5.树2-东南大学计算机科学与工程学院.ppt

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
5.树2-东南大学计算机科学与工程学院

Huffman树 应用1:最佳判定树 考试成绩分布表 * [ 0, 60 ) [ 60, 70 ) [ 70, 80 ) [ 80, 90) [ 90, 100 ] 不及格 及格 中 良 优 0.10 0.15 0.25 0.35 0.15 60? 70? 80? 90? 不及格 及格 中 良 优 是 否 否 否 否 是 是 是 平均判定次数(带权路径长度) = 0.10*1+0.15*2+0.25*3+0.35*4+0.15*4 = 3.15 一般判定树: 0.10 0.15 0.25 0.35 0.15 Huffman树 应用1:最佳判定树 考试成绩分布表 * [ 0, 60 ) [ 60, 70 ) [ 70, 80 ) [ 80, 90) [ 90, 100 ] 不及格 及格 中 良 优 0.10 0.15 0.25 0.35 0.15 60? 70? 80? 90? 不及格 及格 中 良 优 是 否 否 否 否 是 是 是 平均判定次数(带权路径长度) = 0.10*3+0.15*3+0.25*2+0.35*2+0.15*2 = 2.25 最佳判定树: 0.10 0.15 0.25 0.35 0.15 Huffman树 应用1:最佳判定树 考试成绩分布表 * [ 0, 60 ) [ 60, 70 ) [ 70, 80 ) [ 80, 90) [ 90, 100 ] 不及格 及格 中 良 优 0.10 0.15 0.25 0.35 0.15 最佳判定树与Huffman树构造过程略有不同:不能打乱原来的排列 0.15 0.25 0.35 0.15 0.10 0.25 0.15 0.25 0.35 0.15 0.10 (a)初始 (b)相邻结点权值相加和最小者构二叉树 Huffman树 应用1:最佳判定树 考试成绩分布表 * [ 0, 60 ) [ 60, 70 ) [ 70, 80 ) [ 80, 90) [ 90, 100 ] 不及格 及格 中 良 优 0.10 0.15 0.25 0.35 0.15 最佳判定树与Huffman树构造过程略有不同:不能打乱原来的排列 (d)相邻结点权值相加和最小者构二叉树 0.15 0.25 0.35 0.15 0.10 0.25 0.50 0.15 0.25 0.35 0.15 0.10 0.25 0.50 0.50 (c)相邻结点权值相加和最小者构二叉树 Huffman树 应用1:最佳判定树 考试成绩分布表 * [ 0, 60 ) [ 60, 70 ) [ 70, 80 ) [ 80, 90) [ 90, 100 ] 不及格 及格 中 良 优 0.10 0.15 0.25 0.35 0.15 最佳判定树与Huffman树构造过程略有不同:不能打乱原来的排列 0.15 0.25 0.35 0.15 0.10 0.25 0.50 0.50 (e)相邻结点权值相加和最小者构二叉树 1.0 Huffman树 应用2:Huffman编码,进行数据压缩 计算机领域数据用二进制表示 若已统计出某文本中各字符出现的概率,可以用Huffman编码进行数据压缩 * Huffman树 应用2:Huffman编码,进行数据压缩 假设某文本共有1000个字符,且只由 a, b, c, d, e 5种字符组成 固定长度编码可将每个字符用3比特表示,整个文本要3*1000=3000比特表示,平均编码长度3比特 * 符号 定长编码 a 000 b 001 c 100 d 101 e 110 Huffman树 应用2:Huffman编码,进行数据压缩 假设某文本共有1000个字符,且只由 a, b, c, d, e 5种字符组成 若已统计出各字符出现的概率分别为0.12, 0.40, 0.15, 0.08, 0.25,则整个文本可用2150比特表示 * 0.2 0.25(e) 0.15(c) 0.08(d) 0.12(a) 0.35 0.6 0.40(b) 1.0 0 0 0 0 1 1 1 1 符号 概率 Huffman编码 a 0.12 1111 b 0.40 0 c 0.15 110 d 0.08 1110 e 0.25 10 平均编码长度(带权路径长度) = 0.12*4 + 0.08*4 + 0.15*3 + 0.25*2 + 0.40*1 = 2.15 东南大学计算机学院 方效林 本课件借鉴了清华大学殷人昆老师 和哈尔滨工业大学张岩老师的课件 第五章 树 本章主要内容 树的基本概念 二叉树 二叉树的存储表示 二叉树的遍历及其应用 二叉树遍历的非递归算法 二叉树的计数 树与二叉树的转换 堆 Huffman树及其应用 * 堆(He

您可能关注的文档

文档评论(0)

2752433145 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档