数据结构笔记（一）

第1章数据结构绪论

第2章算法

第3章线性表

第1章数据结构绪论

程序设计 = 数据结构 + 算法

逻辑结构与物理结构

逻辑结构

集合结构
线性结构
树形结构
图形结构

物理结构

物理结构：是指数据的逻辑结构在计算机中的存储形式。

顺序存储结构：把数据元素存放在地址连续的存储单元里，其数据间的逻辑关系和物理关系是一致的。
链式存储结构：把数据元素存放在任意的存储单元里，这组存储单元可以是连续的，也可以是不连续的。

第2章算法

算法是解决特定问题求解步骤的描述，在计算机中表现为指令的有限序列，并且每条指令表示一个或多个操作。

算法的特性

输入输出：有零个或多个输入，至少有一个或多个输出。
有穷性
确定性
可行性

算法设计的要求

正确性
可读性
健壮性
时间效率高和存储量低

算法时间复杂度

定义：在进行算法分析时，语句总的执行次数T(n)是关于问题规模n的函数，进而分析T(n)随n的变化情况并确定T(n)的数量级。算法的时间复杂度，也就是算法的时间度量，记作：T(n) = O(f(n))。它表示随问题规模n的增大，算法执行时间的增长率和f(n)的增长率相同，称作算法的渐进时间复杂度，简称为时间复杂度。其中f(n)是问题规模n的某个函数。
这样用大写O()来体现算法时间复杂度的记法，称之为大O记法。

推导大O阶

用常数1取代运行时间中的所有加法常数
在修改后的运行次数函数中，只保留最高阶项。
如果最高阶项存在且不是1，则去除与这个项相乘的常数。
得到的结果就是大O阶。

常用的时间复杂度所消耗的时间从小到大依次是：
O(1) < O(logn) < O(n) < O(nlogn) < O(n(2)) < O(n(3)) < O(2(2)) < O(n!) < O(n(n))

算法的空间复杂度

算法的空间复杂度通过计算算法所需的存储空间实现，算法空间复杂度的计算公式记作：S(n) = O(f(n))，其中，n为问题的规模，f(n)为语句关于n所占存储空间的函数。

第3章线性表

线性表(List)：零个或多个数据元素的有限序列。

a(i-1)是a(i)的直接前驱元素，a(i+1)是a(i)的直接后继元素。

线性表的抽象数据类型定义

ADT 线性表（List）
Data
    线性表的数据对象集合为{a1,a2,...,an},每个元素的类型均为DataType。其中，除第一个元素a1外，每一个元素有且只有一个直接前驱元素，除了最后一个元素an外，每一个元素有且只有一个直接后继元素。数据元素之间的关系是一对一的关系。
Operation
    InitList(*L):初始化操作，建立一个空的线性表L。
    ListEmpty(L):若线性表为空，返回true，否则返回false。
    ClearList(*L):将线性表清空。
    GetElem(L,i,*e):将线性表L中的第i个位置元素返回给e。
    LocaEleme(L,i,*e):将线性表L中查找与定位值e相等的元素，如果查找成功，返回该元素在表中序号表示成功；否则，返回0表示失败。
    ListInsert(*L,i,e):在线性表L中的第i个位置插入新元素e。
    ListDelete(*L,i,e):在线性表L中的第i个位置元素，并用e返回其值。
    ListLength(L):返回线性表L的元素个数。
endADT

线性表的顺序存储结构

顺序存储定义：指的是用一段地址连续的存储单元依次存储线性表的数据元素。
顺序存储方式：一维数组来实现顺序存储结构。

线性表的顺序存储的结构代码:

#define MAXSIZE 20 /*存储空间初始分配量*/
typedef int ElemType;/*ElemType类型根据实际情况而定，这里假设为int*/
typedef struct
{
    ElemType data[MAXSIZE];/*数组存储数据元素，最大值为MAXSIZE*/
    int length;/*线性表当前长度*/
}SQList;

顺序存储结构需要三个属性：

存储空间的起始位置：数组data,它的存储位置就是存储空间的存储位置。
线性表的最大存储容量:数组长度MaxSize。
线性表的当前长度：Length。

用数组存储顺序表意味着要分配固定长度的数组空间，由于线性表中可以进行插入好人删除操作，因此分配的数组空间要大于等于当前线性表的长度。

存储器中的每个存储元素都有自己的编号，这个编号成为地址。

顺序存储结构的插入与删除

获得元素操作
实现GetElem操作，将线性表L中的第i个位置元素值返回。就程序而言，只要i的数值在数组下标范围内，就是把数组第i-1下标的值返回即可。

#define ok 1
#define ERROR 0
#define TRUE 1
#define FALSE 0
typedef int Status;
Status是函数的类型，其值是函数结果状态代码，如OK等
初始条件：顺序线性表L已存在，1<= i <= ListLength(L)
操作结果：用e返回L中第i个数据元素的值
Status GetElem (SqList L, int i, ElemType *e)
{
if(L.length==0 || i>L.length)
    return ERROR;
    *e=L.data[i-1];
    return OK;
}

插入操作

插入算法的思路：

如果插入位置不合理，抛出异常；
如果线性表长度大于等于数组长度，则抛出异常或动态增加容量；
从最后一个元素开始向前遍历到第i个位置，分别将它们都向后移动一个位置；
将要插入元素填入位置i处；
表长加1；
代码实现：

初始条件：顺序线性表Ｌ已存在，１<= i <= ListLength(L)
操作结果：在L中第i个位置之前插入新的数据元素e,L的长度加1
Status ListInsert(SqLsit *L, int i,ElemType e)
{
int k;
    if (L->length == MAXSIZE)/*顺序线性表已经满*/
        return ERROR;
    if(i<1 || i>L->length+1)/*当i不在范围内时*/
        return ERROR;
    if(i<=L->length)/*若插入数据位置不在表尾*/
    {
        for(k=L->length-1;k>=i-1;k--)/*将要插入位置后数据元素向后移动一位*/
            L->data[k+1] = L->data[k];
    }
    L->data[i-1] = e;/*将新元素插入*/
    L-length++;
    return OK;
}

删除操作

算法思路：

如果删除位置不合理，抛出异常;
取出删除元素;
从删除元素位置开始遍历到最后一个元素位置，分别将它们都向前移动一个位置;
表长减1.

线性表顺序存储结构的优缺点　　

优点

无须为表示表中元素之间的逻辑关系而增加额外的存储空间
可以快速的存取表中任一位置元素

缺点

插入和删除操作需要移动大量元素
当线性表长度变化较大时，难以确定存储空间的容量
造成存储空间的”碎片”

线性表的链式存储结构

为了表示每个数据元素ai与其直接后继数据元素ai+1之间的逻辑关系，对数据元素ai来说，除了存储其本身的信息之外，还需存储一个指示其直接后继的信息（即直接后继的存储位置）。我们把存储数据元素信息的域称为数据域，把存储直接后继位置的域称为指针域。指针域中存储的信息称为指针或链。
数据域 + 指针域 = 结点

链表中第一个结点的存储位置叫做头指针，最后一个结点指针为“空”，用NULL或^表示。

头指针与头结点的异同

头指针

头指针是指链表指向第一个结点的指针，若链表有头结点，则是指向头结点的指针
头指针具有标示作用，所以常用头指针冠以链表的名字
无论链表是否为空，头指针均不为空。头指针是链表的必要元素。

头结点

头结点是为了操作的统一和方便而设立的，放在第一元素的结点之前，其数据域一般无意义（也可存放链表的长度）
有了头结点，对在第一元素结点前插入结点和删除第一结点，其操作与其他结点的操作系统就统一了
头结点不一定是链表必须要素

单链表的读取

获取链表第i个数据的算法思路

声明一个结点p指向链表第一个结点，初始化j从1开始；
当j<i时，就遍历链表，让p的指针向后移动，不断指向下一结点，j累加1；
若到链表末尾p为空，则说明第i个元素不存在；
否则查找成功，返回结点p的数据。

单链表的插入与删除

单链表第i个数据插入结点的算法思路

声明一节点p指向链表第一个结点，初始化j从1开始；
当j<i时，就遍历链表，让p的指针向后移动，不断指向下一结点，j累加1；
若到链表末尾p为空，则说明第i个元素不存在；
否则查找成功，在系统中生成一个空结点s；
将数据元素e赋值给s->data；
单链接的插入标准语句s -> next = p -> next; p ->next = s;
返回成功。

单链表第i个数据删除结点的算法思路

声明一节点p指向链表第一个结点，初始化j从1开始；
当j<i时，就遍历链表，让p的指针向后移动，不断指向下一个结点，j累加1；
若到链表末尾p为空，则说明第i个元素不存在；
否则查找成功，将欲删除的结点p->next赋值给q;
单链表的删除标准语句p->next = q->next；
将q结点中的数据赋值给e，作为返回；
释放q结点；
返回成功。

对于插入或删除数据越频繁的操作，单链表的效率优势就越是明显

单链表的整表创建

单链表整表创建的算法思路:

声明一结点p和计数器变量i；
初始化一空链表L;
让L的头结点的指针指向NULL，即建立一个带头结点的单链表；
循环
- 生成一新结点赋值给p；
- 随机生成一数字赋值给p的数据域p->datd;
- 将p插入到头结点与前一新结点之间。

###　单链表的整表删除

单链表整表删除的算法思路如下：

声明一结点p和q；
将第一个结点赋值给p；
循环
- 将下一结点赋值给q；
- 释放p;
- 将q赋值给p。

第1章 数据结构绪论

第2章 算法

第3章 线性表

第1章 数据结构绪论

逻辑结构与物理结构

逻辑结构

物理结构

第2章 算法

算法的特性

算法设计的要求

算法时间复杂度

推导大O阶

算法的空间复杂度

第3章 线性表

线性表的抽象数据类型定义

线性表的顺序存储结构

顺序存储结构的插入与删除

插入操作

删除操作

线性表顺序存储结构的优缺点

线性表的链式存储结构

头指针与头结点的异同

头指针

头结点

单链表的读取

单链表的插入与删除

单链表的整表创建

第1章数据结构绪论

第2章算法

第3章线性表

第1章数据结构绪论

第2章算法

第3章线性表

线性表顺序存储结构的优缺点