汇编网首页登录博客注册
zhengcong3250的学习博客
博客首页博客互动【做检测题】论坛求助

我的博客

个人首页 |  我的文章 |  我的相册 |  我的好友 |  最新访客 |  文章收藏 |  论坛提问 |  友情链接 |  给我留言  
图片载入中
  •  何以解忧愁,唯有杜康酒!
  • 『姓名』:
  • 『性别』:男『发送消息
  • 个人说明:http://student.zjzk.cn/course_ware/data_structure/web/shu/shu6.3.2.htm
  • 详细信息『加为好友』
学习动态

[2010-07-12 10:22] 数据结构(算法的描述和分析)

图片载入中
算法的描述

   数据的运算通过算法(Algorithm)描述,讨论算法是数据结构课程的重要内容之一。
1.算法
  非形式地说,算法是任意一个良定义的计算过程。它以一个或多个值作为输入,并产生一个或多个值作为输出。
(1)一个算法可以被认为是用来解决一个计算问题的工具。
(2)一个算法是一系列将输入转换为输出的计算步骤。
【例3.1】有这样一个排序问题:将一个数字序列排序为非降序。
  该问题的形式定义由满足下述关系的输入输出序列构成:
    输入:数字序列〈a1,a2,…,an〉。
    输出:输出序列的一个枚举〈a1',a2',…,an'〉使得a1'≤a2'≤…≤a3'
对于一个输入实例〈31,41,59,26,41,58〉,排序算法应返回输出序列〈26,31,41,41,58,59〉。

(1)输入实例 
    输入实例:一个问题的输入实例是满足问题陈述中所给出的限制、为计算该问题的解所需要的所有输入构成的。

(2)正确的算法和不正确的算法
    若一个算法对于每个输入实例均能终止并给出正确的结果,则称该算法是正确的。正确的算法解决了给定的计算问题。
    一个不正确的算法是指对某些输入实例不终止,或者虽然终止但给出的结果不是所渴望得到的答案,一般只考虑正确的算法。

2.算法的描述
  一个算法可以用自然语言、计算机程序语言或其它语言来说明,惟一的要求是该说明必须精确地描述计算过程。
  一般而言,描述算法最合适的语言是介于自然语言和程序语言之间的伪语言。它的控制结构往往类似于Pascal、C等程序语言,但其中可使用任何表达能力强的方法使算法表达更加清晰和简洁,而不至于陷入具体的程序语言的某些细节。
  从易于上机验证算法和提高实际程序设计能力考虑,采用C语言描述算法。
【例3.2】定义一个输出错误信息后退出程序运行的错误处理函数,该函数将在后续的许多程序中用来简化处理代码。

# include <stdlib.h> //其中有exit的说明
# include <stdio.h> //其中有标准错误stderr的说明
void Error(char*message)
{
  fprintf(stderr,"Error: % s \ n ", message) ; //输出错误信息
  exit(1) ; //终止程序,返回1给操作系统
}



算法分析

1.评价算法好坏的标准
  求解同一计算问题可能有许多不同的算法,究竟如何来评价这些算法的好坏以便从中选出较好的算法呢?
    选用的算法首先应该是"正确"的。此外,主要考虑如下三点:
① 执行算法所耗费的时间;
② 执行算法所耗费的存储空间,其中主要考虑辅助存储空间;
③ 算法应易于理解,易于编码,易于调试等等。

2.算法性能选择
  一个占存储空间小、运行时间短、其它性能也好的算法是很难做到的。原因是上述要求有时相互抵触:要节约算法的执行时间往往要以牺牲更多的空间为代价;而为了节省空间可能要耗费更多的计算时间。因此我们只能根据具体情况有所侧重:
① 若该程序使用次数较少,则力求算法简明易懂;
② 对于反复多次使用的程序,应尽可能选用快速的算法;
③ 若待解决的问题数据量极大,机器的存储空间较小,则相应算法主要考虑如何节省空间。

3.算法的时间性能分析
(1)算法耗费的时间和语句频度
  一个算法所耗费的时间=算法中每条语句的执行时间之和
每条语句的执行时间=语句的执行次数(即频度(Frequency Count))×语句执行一次所需时间
    算法转换为程序后,每条语句执行一次所需的时间取决于机器的指令性能、速度以及编译所产生的代码质量等难以确定的因素。
    若要独立于机器的软、硬件系统来分析算法的时间耗费,则设每条语句执行一次所需的时间均是单位时间,一个算法的时间耗费就是该算法中所有语句的频度之和。
  【例3.3】求两个n阶方阵的乘积 C=A×B,其算法如下:
# define n 100 // n 可根据需要定义,这里假定为100
void MatrixMultiply(int A[a],int B [n][n],int C[n][n])
{ //右边列为各语句的频度
int i ,j ,k;
(1) for(i=0; i<n;j++) n+1
(2)   for (j=0;j<n;j++) { n(n+1)
(3)     C[i][j]=0; n2
(4)     for (k=0; k<n; k++) n2(n+1)
(5)       C[i][j]=C[i][j]+A[i][k]*B[k][j]; n3
       }
     }

    该算法中所有语句的频度之和(即算法的时间耗费)为:
         T(n)=2n3+3n2+2n+1 (1.1)
分析:
  语句(1)的循环控制变量i要增加到n,测试到i=n成立才会终止。故它的频度是n+1。但是它的循环体却只能执行n次。语句(2)作为语句(1)循环体内的语句应该执行n次,但语句(2)本身要执行n+1次,所以语句(2)的频度是n(n+1)。同理可得语句(3),(4)和(5)的频度分别是n2,n2(n+1)和n3。 
  算法MatrixMultiply的时间耗费T(n)是矩阵阶数n的函数。

(2)问题规模和算法的时间复杂度
    算法求解问题的输入量称为问题的规模(Size),一般用一个整数表示。
【例3.4】矩阵乘积问题的规模是矩阵的阶数。
【例3.5】一个图论问题的规模则是图中的顶点数或边数。
  一个算法的时间复杂度(Time Complexity, 也称时间复杂性)T(n)是该算法的时间耗费,是该算法所求解问题规模n的函数。当问题的规模n趋向无穷大时,时间复杂度T(n)的数量级(阶)称为算法的渐进时间复杂度。
【例3.6】算法MatrixMultidy的时间复杂度T(n)如(1.1)式所示,当n趋向无穷大时,显然有
       
  这表明,当n充分大时,T(n)和n3之比是一个不等于零的常数。即T(n)和n3是同阶的,或者说T(n)和n3的数量级相同。记作T(n)=O(n3)是算法MatrixMultiply的渐近时间复杂度。
    
数学符号"O"的严格的数学定义:
    若T(n)和f(n)是定义在正整数集合上的两个函数,则T(n)=O(f(n))表示存在正的常数C和n0,使得当n≥n0时都满足0≤T(n)≤C·f(n)。
3)渐进时间复杂度评价算法时间性能
  主要用算法时间复杂度的数量级(即算法的渐近时间复杂度)评价一个算法的时间性能。
【例3.7】有两个算法A1和A2求解同一问题,时间复杂度分别是T1(n)=100n2,T2(n)=5n3。
(1)当输入量n<20时,有T1(n)>T2(n),后者花费的时间较少。
(2)随着问题规模n的增大,两个算法的时间开销之比5n3/100n2=n/20亦随着增大。即当问题规模较大时,算法A1比算法A2要有效地多。
它们的渐近时间复杂度O(n2)和O(n3)从宏观上评价了这两个算法在时间方面的质量。在算法分析时,往往对算法的时间复杂度和渐近时间复杂度不予区分,而经常是将渐近时间复杂度T(n)=O(f(n))简称为时间复杂度,其中的f(n)一般是算法中频度最大的语句频度。
【例3.8】算法MatrixMultiply的时间复杂度一般为T(n)=O(n3),f(n)=n3是该算法中语句(5)的频度。下面再举例说明如何求算法的时间复杂度。

【例3.9】交换i和j的内容。
    Temp=i;
    i=j;
    j=temp;

  以上三条单个语句的频度均为1,该程序段的执行时间是一个与问题规模n无关的常数。算法的时间复杂度为常数阶,记作T(n)=O(1)。
    如果算法的执行时间不随着问题规模n的增加而增长,即使算法中有上千条语句,其执行时间也不过是一个较大的常数。此类算法的时间复杂度是O(1)。

【例3.10】变量计数之一。
(1) x=0;y=0;
(2) for(k-1;k<=n;k++)
(3)   x++;
(4) for(i=1;i<=n;i++)
(5)     for(j=1;j<=n;j++)
(6)       y++;

  一般情况下,对步进循环语句只需考虑循环体中语句的执行次数,忽略该语句中步长加1、终值判别、控制转移等成分。因此,以上程序段中频度最大的语句是(6),其频度为f(n)=n2,所以该程序段的时间复杂度为T(n)=O(n2)。
  当有若干个循环语句时,算法的时间复杂度是由嵌套层数最多的循环语句中最内层语句的频度f(n)决定的。

【例3.11】变量计数之二。
(1) x=1;
(2) for(i=1;i<=n;i++)
(3)     for(j=1;j<=i;j++)
(4)         for(k=1;k<=j;k++)
(5)             x++;

  该程序段中频度最大的语句是(5),内循环的执行次数虽然与问题规模n没有直接关系,但是却与外层循环的变量取值有关,而最外层循环的次数直接与n有关,因此可以从内层循环向外层分析语句(5)的执行次数:
 
则该程序段的时间复杂度为T(n)=O(n3/6+低次项)=O(n3)。

(4)算法的时间复杂度不仅仅依赖于问题的规模,还与输入实例的初始状态有关。
【例3.12】在数值A[0..n-1]中查找给定值K的算法大致如下:
    (1)i=n-1;
        (2)while(i>=0&&(A[i]!=k))
    (3)   i--;
    (4)return i; 

    此算法中的语句(3)的频度不仅与问题规模n有关,还与输入实例中A的各元素取值及K的取值有关:
①若A中没有与K相等的元素,则语句(3)的频度f(n)=n;
②若A的最后一个元素等于K,则语句(3)的频度f(n)是常数0。

(5)最坏时间复杂度和平均时间复杂度
  最坏情况下的时间复杂度称最坏时间复杂度。一般不特别说明,讨论的时间复杂度均是最坏情况下的时间复杂度。
    这样做的原因是:最坏情况下的时间复杂度是算法在任何输入实例上运行时间的上界,这就保证了算法的运行时间不会比任何更长。
【例3.19】查找算法【例1·8】在最坏情况下的时间复杂度为T(n)=0(n),它表示对于任何输入实例,该算法的运行时间不可能大于0(n)。
    平均时间复杂度是指所有可能的输入实例均以等概率出现的情况下,算法的期望运行时间。
    常见的时间复杂度按数量级递增排列依次为:常数0(1)、对数阶0(log2n)、线形阶0(n)、线形对数阶0(nlog2n)、平方阶0(n2)立方阶0(n3)、…、k次方阶0(nk)、指数阶0(2n)。显然,时间复杂度为指数阶0(2n)的算法效率极低,当n值稍大时就无法应用。
    类似于时间复杂度的讨论,一个算法的空间复杂度(Space Complexity)S(n)定义为该算法所耗费的存储空间,它也是问题规模n的函数。渐近空间复杂度也常常简称为空间复杂度。算法的时间复杂度和空间复杂度合称为算法的复杂度。
评论次数(0)  |  浏览次数(680)  |  类型(我的收藏) |  收藏此文  | 
 
 请输入验证码  (提示:点击验证码输入框,以获取验证码