数据结构笔记(一)


第1章 数据结构绪论

第2章 算法

第3章 线性表


第1章 数据结构绪论

  • 程序设计 = 数据结构 + 算法

逻辑结构与物理结构

逻辑结构

  1. 集合结构
  2. 线性结构
  3. 树形结构
  4. 图形结构

物理结构

  • 物理结构:是指数据的逻辑结构在计算机中的存储形式。
  1. 顺序存储结构:把数据元素存放在地址连续的存储单元里,其数据间的逻辑关系和物理关系是一致的。
  2. 链式存储结构:把数据元素存放在任意的存储单元里,这组存储单元可以是连续的,也可以是不连续的。

第2章 算法

算法是解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指令表示一个或多个操作。

算法的特性

  1. 输入输出:有零个或多个输入,至少有一个或多个输出。
  2. 有穷性
  3. 确定性
  4. 可行性

算法设计的要求

  1. 正确性
  2. 可读性
  3. 健壮性
  4. 时间效率高和存储量低

算法时间复杂度

定义:在进行算法分析时,语句总的执行次数T(n)是关于问题规模n的函数,进而分析T(n)随n的变化情况并确定T(n)的数量级。算法的时间复杂度,也就是算法的时间度量,记作:T(n) = O(f(n))。它表示随问题规模n的增大,算法执行时间的增长率和f(n)的增长率相同,称作算法的渐进时间复杂度,简称为时间复杂度。其中f(n)是问题规模n的某个函数。
这样用大写O()来体现算法时间复杂度的记法,称之为大O记法。

推导大O阶

  1. 用常数1取代运行时间中的所有加法常数
  2. 在修改后的运行次数函数中,只保留最高阶项。
  3. 如果最高阶项存在且不是1,则去除与这个项相乘的常数。
    得到的结果就是大O阶。

常用的时间复杂度所消耗的时间从小到大依次是:
O(1) < O(logn) < O(n) < O(nlogn) < O(n(2)) < O(n(3)) < O(2(2)) < O(n!) < O(n(n))

算法的空间复杂度

算法的空间复杂度通过计算算法所需的存储空间实现,算法空间复杂度的计算公式记作:S(n) = O(f(n)),其中,n为问题的规模,f(n)为语句关于n所占存储空间的函数。

第3章 线性表

线性表(List):零个或多个数据元素的有限序列。

a(i-1)是a(i)的直接前驱元素,a(i+1)是a(i)的直接后继元素。

线性表的抽象数据类型定义

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
ADT 线性表(List
Data
线性表的数据对象集合为{a1,a2,...,an},每个元素的类型均为DataType。其中,除第一个元素a1外,每一个元素有且只有一个直接前驱元素,除了最后一个元素an外,每一个元素有且只有一个直接后继元素。数据元素之间的关系是一对一的关系。
Operation
InitList(*L):初始化操作,建立一个空的线性表L
ListEmpty(L):若线性表为空,返回true,否则返回false
ClearList(*L):将线性表清空。
GetElem(L,i,*e):将线性表L中的第i个位置元素返回给e
LocaEleme(L,i,*e):将线性表L中查找与定位值e相等的元素,如果查找成功,返回该元素在表中序号表示成功;否则,返回0表示失败。
ListInsert(*L,i,e):在线性表L中的第i个位置插入新元素e
ListDelete(*L,i,e):在线性表L中的第i个位置元素,并用e返回其值。
ListLength(L):返回线性表L的元素个数。
endADT

线性表的顺序存储结构

  • 顺序存储定义:指的是用一段地址连续的存储单元依次存储线性表的数据元素。

  • 顺序存储方式:一维数组来实现顺序存储结构。

线性表的顺序存储的结构代码:

1
2
3
4
5
6
7
#define MAXSIZE 20 /*存储空间初始分配量*/
typedef int ElemType;/*ElemType类型根据实际情况而定,这里假设为int*/
typedef struct
{
ElemType data[MAXSIZE];/*数组存储数据元素,最大值为MAXSIZE*/
int length;/*线性表当前长度*/
}SQList;

顺序存储结构需要三个属性:

  • 存储空间的起始位置:数组data,它的存储位置就是存储空间的存储位置。
  • 线性表的最大存储容量:数组长度MaxSize。
  • 线性表的当前长度:Length。

用数组存储顺序表意味着要分配固定长度的数组空间,由于线性表中可以进行插入好人删除操作,因此分配的数组空间要大于等于当前线性表的长度。

存储器中的每个存储元素都有自己的编号,这个编号成为地址。

顺序存储结构的插入与删除

  • 获得元素操作
    实现GetElem操作,将线性表L中的第i个位置元素值返回。就程序而言,只要i的数值在数组下标范围内,就是把数组第i-1下标的值返回即可。
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    #define ok 1
    #define ERROR 0
    #define TRUE 1
    #define FALSE 0
    typedef int Status;
    Status是函数的类型,其值是函数结果状态代码,如OK等
    初始条件:顺序线性表L已存在,1<= i <= ListLength(L)
    操作结果:用e返回L中第i个数据元素的值
    Status GetElem (SqList L, int i, ElemType *e)
    {
    if(L.length==0 || i>L.length)
    return ERROR;
    *e=L.data[i-1];
    return OK;
    }

插入操作

插入算法的思路:

  • 如果插入位置不合理,抛出异常;
  • 如果线性表长度大于等于数组长度,则抛出异常或动态增加容量;
  • 从最后一个元素开始向前遍历到第i个位置,分别将它们都向后移动一个位置;
  • 将要插入元素填入位置i处;
  • 表长加1;
    代码实现:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
初始条件:顺序线性表L已存在,1<= i <= ListLength(L)
操作结果:在L中第i个位置之前插入新的数据元素e,L的长度加1
Status ListInsert(SqLsit *L, int i,ElemType e)
{
int k;
if (L->length == MAXSIZE)/*顺序线性表已经满*/
return ERROR;
if(i<1 || i>L->length+1)/*当i不在范围内时*/
return ERROR;
if(i<=L->length)/*若插入数据位置不在表尾*/
{
for(k=L->length-1;k>=i-1;k--)/*将要插入位置后数据元素向后移动一位*/
L->data[k+1] = L->data[k];
}
L->data[i-1] = e;/*将新元素插入*/
L-length++;
return OK;
}

删除操作

算法思路:

  • 如果删除位置不合理,抛出异常;
  • 取出删除元素;
  • 从删除元素位置开始遍历到最后一个元素位置,分别将它们都向前移动一个位置;
  • 表长减1.

线性表顺序存储结构的优缺点  

优点

  • 无须为表示表中元素之间的逻辑关系而增加额外的存储空间
  • 可以快速的存取表中任一位置元素

缺点

  • 插入和删除操作需要移动大量元素
  • 当线性表长度变化较大时,难以确定存储空间的容量
  • 造成存储空间的”碎片”

线性表的链式存储结构

为了表示每个数据元素ai与其直接后继数据元素ai+1之间的逻辑关系,对数据元素ai来说,除了存储其本身的信息之外,还需存储一个指示其直接后继的信息(即直接后继的存储位置)。我们把存储数据元素信息的域称为数据域,把存储直接后继位置的域称为指针域。指针域中存储的信息称为指针或链。
数据域 + 指针域 = 结点

链表中第一个结点的存储位置叫做头指针,最后一个结点指针为“空”,用NULL或^表示。

头指针与头结点的异同

头指针
  • 头指针是指链表指向第一个结点的指针,若链表有头结点,则是指向头结点的指针
  • 头指针具有标示作用,所以常用头指针冠以链表的名字
  • 无论链表是否为空,头指针均不为空。头指针是链表的必要元素。
头结点
  • 头结点是为了操作的统一和方便而设立的,放在第一元素的结点之前,其数据域一般无意义(也可存放链表的长度)
  • 有了头结点,对在第一元素结点前插入结点和删除第一结点,其操作与其他结点的操作系统就统一了
  • 头结点不一定是链表必须要素

单链表的读取

获取链表第i个数据的算法思路

  1. 声明一个结点p指向链表第一个结点,初始化j从1开始;
  2. 当j<i时,就遍历链表,让p的指针向后移动,不断指向下一结点,j累加1;
  3. 若到链表末尾p为空,则说明第i个元素不存在;
  4. 否则查找成功,返回结点p的数据。

单链表的插入与删除

单链表第i个数据插入结点的算法思路

  1. 声明一节点p指向链表第一个结点,初始化j从1开始;
  2. 当j<i时,就遍历链表,让p的指针向后移动,不断指向下一结点,j累加1;
  3. 若到链表末尾p为空,则说明第i个元素不存在;
  4. 否则查找成功,在系统中生成一个空结点s;
  5. 将数据元素e赋值给s->data;
  6. 单链接的插入标准语句s -> next = p -> next; p ->next = s;
  7. 返回成功。

单链表第i个数据删除结点的算法思路

  1. 声明一节点p指向链表第一个结点,初始化j从1开始;
  2. 当j<i时,就遍历链表,让p的指针向后移动,不断指向下一个结点,j累加1;
  3. 若到链表末尾p为空,则说明第i个元素不存在;
  4. 否则查找成功,将欲删除的结点p->next赋值给q;
  5. 单链表的删除标准语句p->next = q->next;
  6. 将q结点中的数据赋值给e,作为返回;
  7. 释放q结点;
  8. 返回成功。

对于插入或删除数据越频繁的操作,单链表的效率优势就越是明显

单链表的整表创建

单链表整表创建的算法思路:

  1. 声明一结点p和计数器变量i;
  2. 初始化一空链表L;
  3. 让L的头结点的指针指向NULL,即建立一个带头结点的单链表;
  4. 循环
    • 生成一新结点赋值给p;
    • 随机生成一数字赋值给p的数据域p->datd;
    • 将p插入到头结点与前一新结点之间。

### 单链表的整表删除

单链表整表删除的算法思路如下:

  1. 声明一结点p和q;
  2. 将第一个结点赋值给p;
  3. 循环
    • 将下一结点赋值给q;
    • 释放p;
    • 将q赋值给p。
谢谢你请我吃糖果!