知识大全 树 - 哈夫曼树及其应用 - 哈夫曼编码 (一)
Posted 字符
篇首语:少年意气强不羁,虎胁插翼白日飞。本文由小常识网(cha138.com)小编为大家整理,主要介绍了知识大全 树 - 哈夫曼树及其应用 - 哈夫曼编码 (一)相关的知识,希望对你有一定的参考价值。
编码方案
编码和解码
数据压缩过程称为编码 即将文件中的每个字符均转换为一个惟一的二进制位串
数据解压过程称为解码 即将二进制位串转换为对应的字符
等长编码方案和变长编码方案
给定的字符集C 可能存在多种编码方案
( ) 等长编码方案
等长编码方案将给定字符集C中每个字符的码长定为[lg|C|] |C|表示字符集的大小
【例】设待压缩的数据文件共有 个字符 这些字符均取自字符集C=a b c d e f 等长编码需要三位二进制数字来表
示六个字符 因此 整个文件的编码长度为 位
( )变长编码方案
变长编码方案将频度高的字符编码设置短 将频度低的字符编码设置较长
【例】设待压缩的数据文件共有 个字符 这些字符均取自字符集C=a b c d e f 其中每个字符在文件中出现的次数
(简称频度)见表
表 字符编码问题
字符 a b c d e f
频度(单位 千次)
定长编码
变长编码
根据计算公式
( * + * + * + * + * + )* =
整个文件被编码为 位 比定长编码方式节约了约 %的存储空间
注意
变长编码可能使解码产生二义性 产生该问题的原因是某些字符的编码可能与其他字符的编码开始部分(称为前缀)相同
【例】设E T W分别编码为 则解码时无法确定信息串 是ET还是W
前缀码方案
对字符集进行编码时 要求字符集中任一字符的编码都不是其它字符的编码的前缀 这种编码称为前缀(编)码
注意
等长编码是前缀码
最优前缀码
平均码长或文件总长最小的前缀编码称为最优的前缀码 最优的前缀码对文件的压缩效果亦最佳
>
其中
p i 为第i个字符得概率
l i 为码长
【例】若将表 所示的文件作为统计的样本 则a至f六个字符的概率分别为 对变长编码
求得的平均码长为 优于定长编码(平均码长为 )
cha138/Article/program/sjjg/201311/23863相关参考
树的路径长度 树的路径长度是从树根到树中每一结点的路径长度之和在结点数目相同的二叉树中完全二叉树的路径长度最短 树的带权路径长度(WeightedPathLengthofTree简记为WPL)
构造最优二叉树 哈夫曼算法 哈夫曼首先给出了对于给定的叶子数目及其权值构造最优二叉树的方法故称其为哈夫曼算法其基本思想是 ()根据给定的n个权值wlw…wn构成n棵二叉树的森林F=TT…Tn
平衡化方法 LL型右旋一次 RR型左旋一次 LR型左旋一次右旋一次 RL型右旋一次左旋一次 哈夫曼树和哈夫曼编码 叶子结点的权值对叶子结点赋予的
知识大全 数据结构考研分类复习真题 第六章 答案 (四)[29]
字符ABCD出现的次数为其哈夫曼编码如下A:B:C:D: . ()wpl=(+)*+*+(++)*+(+)*= ()编码为:::::::: ()常用哈夫曼树为通讯用的字符编码本题中集合的数
知识大全 数据结构考研分类复习真题 第六章 答案 (四)[28]
树的后根遍历(对应二叉树的中序遍历)全线索链表 虽然哈夫曼树的带权路径长度是唯一的但形态不唯一本题中各字母编码如下c: c: c: c: c:&nbs
编码方案.编码和解码 数据压缩过程称为编码即将文件中的每个字符均转换为一个惟一的二进制位串 数据解压过程称为解码即将二进制位串转换为对应的字符.等长编码方案和变长编码方案 给定的字符集C可能存在
树的前序遍历与相对应的二叉树的前序遍历一致;树的后序遍历与相对应的二叉树的中序遍历一致 树的带权路径长度是树中所有叶结点的带权路径长度之和树的带权路径长度最小的二叉树就称为最优二叉树(即哈夫曼树
知识大全 数据结构考研分类复习真题 第六章 树和二叉树 (一)[4]
设给定权值总数有n个其哈夫曼树的结点总数为( )【福州大学一(分)】 A.不确定 &nbs
知识大全 数据结构考研分类复习真题 第六章 树和二叉树 (一)[11]
.在下列情况中可称为二叉树的是( )【西安交通大学三(分)】 A.每个结点至多有两棵子树的树 B哈夫曼树 
四解答下列各题(共分) 以数据集为叶子结点的权值()构造一棵哈夫曼树 (分)()计算其带权路径长度(分) 已知二叉树的先序中序和后序序列分别如下但其中有一些已模