Data Structure Notes
1 | Author : "ebxeax" |
数据结构的基本概念
1.数据
2.数据元素:
数据的基本单位,一个数据元素可有若干个数据项构成,数据项是不可分割的最小单位
3.数据类型
4.抽象数据类型(ADT[Abstract Data Type]):
数学模型在计算机的一种实现,包括数据对象、数据关系、基本操作,如建立一个有限状态机模型
5.数据结构:数据元素之间的关系称之为结构,数据结构包括三方面:逻辑结构、存储结构、数据运算(程序=算法+数据结构)
6.逻辑结构:数据间的逻辑关系,与数据存储独立,分为线性结构和非线性结构
1 | graph TD |
7.物理结构:数据元素的表示以及关系的表示,主要有:顺序存储、链式存储、索引存储、散列存储
8.算法评估
(1)特性:有穷、确定、可行、输入、输出
(2)时间复杂度:衡量算法随问题规模的增大,算法执行的时间增长的快慢
T(n)=O(f(n)),f(n)为算法运算频度,一般采用最坏情况下的时间复杂度
计算方法:取算法时间增长最快的函数项,忽略其系数
a加法规则:
$$
T(n)=T_1(n)+T_2(n)=O(f(n))+O(g(n))=O(max(f(n),g(n)))
$$
多项式相加,只保留最高阶的项,且系数变为1
b乘法规则:
$$
T(n)=T_1(n)*T_2(n)=O(f(n))*O(g(n))=O(f(n)*g(n))
$$
多项式相乘,都保留
从左到右性能依次降低:
$$
O(1)<O(log_2n)<O(n)<O(nlog_2n)<O(n^2)<O(n^3)<O(2^n)
$$
单循环体型:
例题1:计算下列程序的时间复杂度
1
2
3
4
int i,sum //执行1次
sum=0 //执行1次
for(i=0;i<=n;i++)//int i=0执行1次,i<=n执行n+2次,i++执行n+1次
sum+=i; //执行n+1次
时间分析: 该算法执行了3n+6个语句。 假设每个语句执行时间一致,均为常数t。则总时间
$$
T=(3n+6)*t
$$
随着问题规模n的增大,总时间的增长率与n的增长率一致,所以复杂度为
$$
O(n)
$$
结论:
复杂度是关于增长率的,所以可以直接忽视常数项
一般可以直接关注循环段基本操作语句
1
sum+=i;
的执行次数
例题2:
1 | int sum,i; |
时间分析:
i 取值:1,2,4,8…
满足条件:2^𝑘 ≤ n
K𝑙𝑜𝑔_2𝑛时, 跳出循环
所以循环体执行次数:⌈𝑙𝑜𝑔_2𝑛⌉ 故时间复杂度为O(logn).i 取值:1,2,4,8
多循环体型
两个运算法则:乘法规则(嵌套循环)、加法规则(若干循环)
例题3:
1 | int x,y,i,j; |
两个循环体是独立的,采用加法规则:
$$
T(n)=T_1(n)+T_2(n)
$$
$$
=max(T_1(n),T_2(n)) =O(n^2)
$$
例题4:
1 | int i,j,sum; |
两个循环体是嵌套的,采用乘法规则:
$$
T(n)=T_1(n)*T_2(n)
$$
$$
=O(nlogn)
$$
(3)空间复杂度:衡量算法随问题规模的增大,算法所需空间的快慢
S(n)=O(g(n)),算法所需空间的增长率和g(n)的增长率相同
空间复杂度S(n)指算法运行过程中所使用的辅助空间的大小
线性表
1.定义:线性表是具有相同数据类型的n个数据类型的有限序列,n为表长
线性表中第一个元素称为表头元素,最后一个元素称为表位元素
除第一个元素外,每个元素仅有一个直接前驱,除最后一个元素外,每个元素有且仅有一个直接后继
顺序存储
线性表的顺序存储又称顺序表
使用一组地址连续的存储单元(数组等)依次存储线性表的数据元素,从而使得逻辑相邻的两个元素在物理位置上也相邻
三个属性:
1.存储空间的起始位置
2.顺序表最大存储容量
3.顺序表当前的长度
宏定义
静态分配大小
1 |
|
动态分配大小(这里动态指空间大小运行时决定,但分配大小后,空间大小被固定)
1 | typedef int Elemtype |
优点:访问效率高、存储密度高
缺点:插入删除操作复杂
顺序存储线性表操作
1.初始化顺序存储线性表
1 | int initLinklist(SqList &L){ |
(1)创建一个顺序存储表后,需要初始化,首先根据数组大小通过new在堆空间开辟一段连续的空间赋值于先前创建的顺序存储表的elem空间
(2)检查elem是否存在,不存在溢出退出程序
(3)将length元素赋值为0,即设置顺序存储线性表长度为0
2.销毁顺序存储线性表
1 | void destroyList(SqList &L){ |
如果线性表存在,删除线性表elem开辟的空间
3.清空顺序存储线性表
1 | void clearList(SqList &L){ |
将线性表的长度置为0
4.判断顺序存储线性表是否为空
1 | bool isEmpty(SqList &L){ |
判断线性表长度是否为0,并返回相应bool值
5.引用类型按下表获取顺序存储线性表元素
1 | int getElem(SqList L,int i,type&e){ |
(1)先检查传递参数下标量是否正确
(2)通过访问elem内数据存入引用类型变量内
6.按下表获取顺序存储线性表元素
1 | Elemtype getElem(SqList L,int i){ |
(1)先检查传递参数下标量是否正确
(2)通过访问elem内数据并返回
7.引用类型按值查询顺序存储线性表元素下标
1 | int locateElem(SqList L,Elemtype e,int &i){ |
按照elem开辟空间进行迭代,当迭代元素与目标元素值相等时,将迭代量赋值于引用类型下标变量
8.按值获取顺序存储线性表元素下标
1 | int locateElem(SqList L,Elemtype e){ |
按照elem开辟空间进行迭代,当迭代元素与目标元素值相等时,将迭代量返回
9.按下标插入元素
1 | int listInsert(SqList &L,type e,int i){ |
(1)先检查传递参数下标量是否正确
(2)增加线性表长度
(3)按照目标元素位置,将其尾部元素后移1偏移量
(4)将目标元素存入下标位置
时间复杂度分析:
(1)
$$
最好情况:在表尾插入(即i=n+1)
$$
$$
元素后移语句执行的时间复杂度为O(1)
$$
(2)
$$
最坏情况:在表头插入(即i=1)
$$
$$
元素后移语句执行n次,时间复杂度为O(n)
$$
(3)
$$
平均情况:假设p_i(p_i=1/(n+1))
$$
$$
是第i个位置上插入一个结点的概率
$$
$$
则在长度为n的线性表中插入一个节点是需要移动结点的平均次数为
$$
$$
\begin{equation*}
f = \sum_{i=1}^{n+1}p_i(n-i-1)
\end{equation*}
$$
$$
\begin{equation*}
=\sum_{i=1}^{n+1}{\frac{n+1}{n-i+1}}
\end{equation*}
$$
$$
\begin{equation*}
=\frac{1}{n+1} \sum_{i=1}^{n+1}(n-i-1)
\end{equation*}
$$
$$
=\frac{1}{n+1}\frac{n(n+2)}{2}=\frac{n}{2}
$$
$$
因此顺序存储线性表的插入算法平均时间复杂度为O(n)
$$
10.按下标删除元素
1 | int listDelete(SqList &L, int i) { |
(1)先检查传递参数下标量是否正确
(2)按照目标元素位置,将其头部元素前移1偏移量
(3)减少线性表长度
时间复杂度分析:
(1)
$$
最好情况:在表尾插入(即i=n)
$$
$$
无需移动元素,时间复杂度为O(1)
$$
(2)
$$
最坏情况:在表头插入(即i=1)
$$
$$
需移动除第一个元素外的所有元素,时间复杂度为O(n)
$$
(3)
$$
平均情况:假设p_i(p_i=1/(n+1))
$$
$$
是第i个位置上插入一个结点的概率
$$
$$
则在长度为n的线性表中插入一个节点是需要移动结点的平均次数为
$$
$$
\begin{equation*}
f = \sum_{i=1}^{n}p_i(n-i)
\end{equation*}
$$
$$
\begin{equation*}
=\sum_{i=1}^{n}{\frac{n}{n-i}}
\end{equation*}
$$
$$
\begin{equation*}
=\frac{1}{n} \sum_{i=1}^{n}(n-i)
\end{equation*}
$$
$$
=\frac{1}{n}\frac{n(n-1)}{2}=\frac{n-1}{2}
$$
$$
因此顺序存储线性表的插入算法平均时间复杂度为O(n)
$$
11.创建顺序存储线性表
1 | int createList(SqList &L, int n) { |
11.打印顺序存储线性表内元素
1 | void printList(SqList L) { |
转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。可以在下面评论区评论,也可以邮件至 jaytp@qq.com