用哈夫曼编码实现文件压缩.doc

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
****学院 《用哈夫曼编码实现文件压缩》实验报告 《用哈夫曼编码实现文件压缩》 实 验 报 告 课程名称 数据结构 实验学期 2011 至 2012 学年 第 2 学期 学生所在系部 计算机学院 年级 2010级 专业班级 ********** 学生姓名 ****** 学号 ************ 任课教师 ###### 实验成绩 一、实验题目 哈夫曼编码实现文件压缩 二、实验目的: 1、了解文件的概念。 2、掌握线性链表的插入、删除等算法。 3、掌握Huffman树的概念及构造方法。 4、掌握二叉树的存储结构及遍历算法。 5、利用Huffman树及Huffman编码,掌握实现文件压缩的一般原理。 三、实验设备与环境: 微型计算机、Windows 系列操作系统、Visual C++6.0软件。 四、实验内容: 根据ASCII码文件中各ASCII字符出现的频率情况创建Haffman树,再将各字符对应的哈夫曼编码写入文件中,实现文件压缩。 五、概要设计: 本次实验采用将字符用长度尽可能短的二进制数位表示的方法,即对于文件中出现的字符,无须全部都用8位的ASCII码进行存储,根据他们在文件中出现的频率不同,我们利用Haffman算法使每个字符能以最短的二进制字符进行存储,以达到节省存储空间,压缩文件的目的。解决了压缩需采用的算法,程序的思路已然清晰: 1.统计需压缩文件中每个字符出现的频率。 2.将每个字符的出现频率作为叶子结点构建Haffman树,然后将树中结点引向其左孩子的分支标“0”,引向其右孩子的分支标“1 3.打开需压缩文件,再将需压缩文件中的每个ASCII码对应的Haffman编码按bit单位输出。 4.文件压缩结束。 六、详细设计: (1)构造Hufffman树的方法—Hafffman算法 构造Huffman树步骤: I. 根据给定的n个权值{w1,w2,??wn},构造n棵只有根结点的二叉树,令起权值为wj。 II. 在森林中选取两棵根结点权值最小的树作左右子树,构造一棵新的二叉树,置新二叉树根结点权值为其左右子树根结点权值之和。 III. 在森林中删除这两棵树,同时将新得到的二叉树加入森林中。   Ⅳ.重复上述两步,直到只含一棵树为止,这棵树即哈夫曼树。 对于Haffman的创建算法,有以下几点说明: a) 这里的Haffman树采用的是基于数组的带左右儿子结点及父结点下标作为存储结点的二叉树形式,这种空间上的消耗带来了算法实现上的便捷。 b) 由于对于最后生成的Haffman树,其所有叶子结点均为从一个内部树扩充出去的,所以,当外部叶子结点数为m个时,内部结点数为m-1,整个Haffman树的需要的结点数为2m-1 c) 初始化Hafffman树分两步进行,先将所有结点赋值,再将前m个叶子结点赋初值。 d) 在查找权值最小并且父结点为空的两个结点时,通过逐个比较,将两结点的位置下标与权值分别保存。方便在与其父结点建立联系时调用。 开始 开始 定义Hafffman树 初始化Hafffman树 i=0 im-1 Hafffman创建完毕 i++ 将下标为m+i的结点作为所找出的两结点的父结点,建立联系 在前m+i个结点中找出权值最小并且父结点为空的两结点 2)压缩过程的实现: 压缩过程的流程是清晰而简单的: 1创建Haffman树→2打开需压缩文件→3将需压缩文件中的每个ASCII码对应的Haffman编码按bit单位输出→4文件压缩结束。 其中,步骤1和步骤3是压缩过程的关键。 a) 步骤1:这里所要做工作是得到Haffman数中各叶子结点字符出现的频率并进行创建。 b) 步骤3: 将需压缩文件中的每个ASCII码对应的Haffman编码按bit单位输出,这是本压缩程序中最关键的部分。 这里涉及“转换”和“输出”两个关键步骤: “转换”部分大可不必去通过遍历Haffman树来找到每个字符对应的哈夫曼编码,可以将每个码值及其对应的ASCII码存放于如下所示的结构体中: typedef struct { char asciiCode; unsigned long haffCo

文档评论(0)

a13355589 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档