时间复杂度和空间复杂度(算法时间复杂度取决于)

广义地说，数据结构是指一组数据的存储结构。算法是一组操作数据的方法。

狭义的数据结构是指：数组、链表、栈、队列、哈希表、二叉树、堆、跳表、图和Trie树。算法：递归、排序、二分搜索法、搜索、哈希算法、贪婪算法、分治算法、回溯算法、动态规划和字符串匹配算法。

数据结构和算法相辅相成。数据结构为算法服务，算法应该作用于特定的数据结构。

必须学习

10种数据结构：数组、链表、栈、队列、哈希表、二叉树、堆、跳表、图和Trie树；

10种基本算法：递归、排序、二分搜索法、搜索、哈希算法、贪婪算法、分治算法、回溯算法、动态规划和字符串匹配算法。

结构和算法本身解决了“快”和“省”的问题，即如何让代码运行得更快，如何让代码节省更多的存储空间。

1时间复杂性分析

假设每一行代码的执行时间相同，我们可以计算出执行时间T(n)与每一行代码的执行时间成正比。

1 int cal(int n){ 0

2 int sum=0；

3 int I=1；

4为(；I=n；I){ 0

5 sum=sum I；

6 }

7返回总和；

8 } T(n)=2n ^ 2

第2行和第3行分别需要一个unit_time的执行时间，第4行和第5行已经运行了n次，所以需要2n*unit_time，所以这段代码的总执行时间是(2n ^ 2)* unit _ time。可以看出，所有代码的执行时间T(n)与每行代码的执行次数成正比。

1 int cal(int n){ 0

2 int sum=0；

3 int I=1；

4 int j=1；

5为(；I=n；I){ 0

6j=1；

7为(；j=n；j) {

8总和=总和I * j；

9 }

10 }

11 }T(n)=3 2n 2n^2

第2、3、4行代码各需要一个unit_time的执行时间，第5、6行代码执行需要2n * unit_time，第7、8行执行需要2n * unit_time。因此，整个代码的总执行时间为T(n)=(2n ^ 2n ^ 3)* unit _ time。

执行时间T(n)与每一行代码的执行时间成正比。T(n)=O(f(n))，n代表数据的大小，f(n)代表每行代码被执行的总次数。因为这是一个公式，所以用f(n)表示。公式中的o表示代码的执行时间T(n)与表达式f(n)成正比。

因此，第一个例子中的T(n)=O(2n 2)，第二个例子中的T(n)=O(2n 3)。这是大O时间复杂度的表现。o大时间复杂度实际上并没有具体表示代码的真实执行时间，而是表示代码执行时间随着数据规模的增加而变化的趋势，所以也称之为渐近时间复杂度，简称时间复杂度。

当n很大时，你可以把它想象成10000或100000。公式中的低阶、常数和系数不影响增长趋势，所以都可以忽略。我们只需要记录一个最大值。如果把刚才提到的两段代码的时间复杂度用大O符号表示，可以记录为：T(n)=O(n)；T(n)=O(n ^2).

时间复杂性分析技巧

1.只关注循环执行次数最多的代码。

o复杂性表示只是一种变化趋势。我们通常忽略公式中的常数、低阶和系数，只需要记录一个最大阶的量级。因此，当我们分析一个算法和一段代码的时间复杂度时，我们只需要关注循环执行次数最多的那段代码。这个核心代码的n次执行次数的顺序就是要分析的整个代码的时间复杂度。

2.加法法则：总复杂度等于量值最大的代码的复杂度。

3.乘法法则：嵌套代码的复杂度等于嵌套内外代码复杂度的乘积。

也就是说，假设T1(n)=O(n)和T2(n)=O(n ^ 2)，那么T1(n)* T2(n)=O(n ^ 3)。

复杂度量级别

常数阶O(1)对数阶O(logn)线性阶O(n)线性对数阶O(nlogn)平方阶O(n ^ 2)三次阶O(n ^ 3)k次幂阶O(n ^ k)指数阶O(2n)阶乘阶O(n！)多项式阶和非多项式阶。其中，只有两个非多项式量级：O (2 n)和O(n！) 。当数据量n越来越大时，非多项式量级算法的执行时间会急剧增加，求解问题的执行时间会无限增加。因此，非多项式时间复杂度的算法实际上是一种非常低效的算法。

扩展1

可以用多项式时间算法求解的问题称为P问题。我们把时间

复杂度为非多项式量级的算法问题叫作 NP （ Non-Deterministic Polynomial ，非确定多项式）问题.

参考：https://www.cnblogs.com/HF-Made/p/11410884.html

随着问题规模n的增长，计算量的增长速度是非常恐怖的。这类问题被称为NP问题（Non-deterministic Polynomial），意思是“不确定是否能用多项式时间解决”。有些科学家认为，所有的NP问题终究都可以在多项式时间内解决，只是我们暂时还没有找到方法；也有些科学家认为，某些NP问题永远无法在多项式时间内解决。在NP问题之间，也可以存在归约关系。我们把众多的NP问题层层归约，必定会得到一个或多个“终极问题”，这些归约的终点就是所谓的NPC问题（NP-complete），也可以翻译成PC完全问题。上面所讲的旅行商问题，被科学家证明属于NPC问题。

旅行商问题所描述的是这样一个场景：有一个商品推销员，要去若干个城市推销商品。该推销员从一个城市出发，需要经过所有城市后，回到出发地。每个城市之间都有道路连通，且距离各不相同，推销员应该如何选择路线，使得总行程最短呢？

扩展2

对数我们可能忘记了，这里重新记一下

计算下面代码的时间复杂度？

1 i=1; 2 while (i <= n) { 3 i = i * 2; 4 }

可以得出第2行代码，2x = n , x 就是执行次数， x=log2n , 所以这段代码时间复杂度为O(log2n) = O(logn * C) C 表示系数，去掉后就是O(logn)

2 空间复杂度分析

时间复杂度的全称是渐进时间复杂度，表示算法的执行时间与数据规模之间的增长关系。类比一下，空间复杂度全称就是渐进空间复杂度（ asymptotic space complexity ），表示算法的存储空间与数据规模之间的增长关系。

void print(int n) { int i = 0; int[] a = new int[n]; for (i; i <n; ++i) { a[i] = i * i; } for (i = n-1; i >= 0; --i) { print out a[i] } }

跟时间复杂度分析一样，我们可以看到，第 2 行代码中，我们申请了一个空间存储变量 i ，但是它是常量阶的，跟数据规模 n 没有关系，所以我们可以忽略。第 3 行申请了一个大小为 n 的 int 类型数组，除此之外，剩下的代码都没有占用更多的空间，所以整段代码的空间复杂度就是 O(n) 。

我们常见的空间复杂度就是 O(1) 、 O(n) 、 O(n ) ，像 O(logn) 、 O(nlogn) 这样的对数阶复杂度平时都用不到。而且，空间复杂度分析比时间复杂度分析要简单很多。所以，对于空间复杂度，掌握刚我说的这些内容已经足够了。

3 最好、最坏、平均、均摊时间复杂度分析

3.1 最好、最坏情况时间复杂度

// n 表示数组 array 的长度 int find(int[] array, int n, int x) { int i = 0; int pos = -1; for (; i < n; ++i) { if (array[i] == x) { pos = i; break; } } return pos; }

因为，要查找的变量 x 可能出现在数组的任意位置。如果数组中第一个元素正好是要查找的变量x ，那就不需要继续遍历剩下的 n-1 个数据了，那时间复杂度就是 O(1) 。但如果数组中不存在变量x ，那我们就需要把整个数组都遍历一遍，时间复杂度就成了 O(n) 。所以，不同的情况下，这段代码的时间复杂度是不一样的。

为了表示代码在不同情况下的不同时间复杂度，我们需要引入三个概念：最好情况时间复杂度、最坏情况时间复杂度和平均情况时间复杂度。

平均时间复杂度又该怎么分析呢？我还是借助刚才查找变量 x 的例子来给你解释。每一种情况执行次数相加除以所有情况

要查找的变量 x 在数组中的位置，有 n+1 种情况：在数组的 0 ～ n-1 位置中和不在数组中。我们把每种情况下，查找需要遍历的元素个数累加起来，然后再除以 n+1 ，就可以得到需要遍历的元素个数的平均值，即：

平均时间复杂度=运行总次数 / n+1种情况

我们知道，时间复杂度的大 O 标记法中，可以省略掉系数、低阶、常量，所以，咱们把刚刚这个公式简化之后，得到的平均时间复杂度就是 O(n) 。

3.2 扩展-加权平均值计算

平均时间复杂度的全称应该叫加权平均时间复杂度或者期望时间复杂度。

3.3 均摊时间复杂度

// array 表示一个长度为 n 的数组 // 代码中的 array.length 就等于 n int[] array = new int[n]; int count = 0; void insert(int val) { if (count == array.length) { int sum = 0; for (int i = 0; i < array.length; ++i) { sum = sum + array[i]; } array[0] = sum; count = 1; } array[count] = val; ++count; }

假设数组的长度是 n ，根据数据插入的位置的不同，我们可以分为 n 种情况，每种情况的时间复杂度是 O(1) 。除此之外，还有一种 “ 额外 ” 的情况，就是在数组没有空闲空间时插入一个数据，这个时候的时间复杂度是 O(n) 。而且，这 n+1 种情况发生的概率一样，都是 1/(n+1) 。所以，根据加权平均的计算方法，我们求得的平均时间复杂度就是：

1/(n+1)+1/(n+1)+1/(n+1)+…+n/(n+1) = O(1)

我们还是继续看在数组中插入数据的这个例子。每一次 O(n) 的插入操作，都会跟着 n-1 次 O(1) 的插入操作，所以把耗时多的那次操作均摊到接下来的 n-1 次耗时少的操作上，均摊下来，这一组连续的操作的均摊时间复杂度就是 O(1) 。这就是均摊分析的大致思路。你都理解了吗？

最理想的情况下，数组中有空闲空间，我们只需要将数据插入到数组下标为 count 的位置就可以了，所以最好情况时间复杂度为 O(1) 。最坏的情况下，数组中没有空闲空间了，我们需要先做一次数组的遍历求和，然后再将数据插入，所以最坏情况时间复杂度为 O(n) 。

对一个数据结构进行一组连续操作中，大部分情况下时间复杂度都很低，只有个别情况下时间复杂度比较高，而且这些操作之间存在前后连贯的时序关系，这个时候，我们就可以将这一组操作放在一块儿分析，看是否能将较高时间复杂度那次操作的耗时，平摊到其他那些时间复杂度比较低的操作上。而且，在能够应用均摊时间复杂度分析的场合，一般均摊时间复杂度就等于最好情况时间复杂度。