- 1、本文档共32页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2009-11-29 第一届中国(杭州)安全电子商务学术会议 面向信息隐藏的文本特征值性质研究 申 请 者: 戴祖旭 工作单位: 武汉工程大学 电子邮件: zuxudai@ 申请日期: 2009/11/29 摘 要 文本作为一种重要的信息传输载体,文本信息隐藏研究在信息安全等领域应用价值极高。目前对照信息隐藏的要求(数据有效载荷、不可感知性、鲁棒性、安全性等)去研究携带秘密信息的特征值的性质并评价相应算法的工作还很缺乏。本项目采用数理统计方法研究基于词性标记串序关系、语法结构关系以及其他统计特性的载体特征值的概率分布与冗余性质;对词性标记串按文本编辑相互转化关系分类,研究特征值在文本编辑下的变换性质,将这些变换性质作为信息隐藏的噪声,建立不同类型特征值的信道模型,估计容量,设计信道编码方法。本研究为基于词性标记工作域的文本信息隐藏技术提供理论基础。 1.研究意义及国内外研究工作现状 信息隐藏是以多媒体信号作为宿主载体,利用多媒体数据的冗余特性和人类感知觉的冗余特性来隐藏秘密信息的技术。在开放式网络环境中,信息隐藏技术主要用于: (1)隐秘通信; (2)数字作品完整性与版权保护。 作为一种重要的信息存储与传输媒体,文本载体信息隐藏理论与技术的研究是信息隐藏学科的一个重要分支。 基于格式的方法:将文本解释为二值或灰度图像,通过调整行间距或单词和字符间距、修改字符轮廓与拓扑结构、调整字符亮度或颜色,以及格式化文本的脚本控制符来隐藏信息。选择行(字)间距、字符结构、字符亮度 等物理量作为载体特征值来携带秘密信息,利用人类视觉保真度量模型计算特征值调整幅度,隐藏过程不改变人眼对文本外观的感知效果。这类方法有科学的人类视觉模型做基础,易于实现自动化,在信息隐藏技术出现的初期发展较快,缺点是隐藏容量较小,抵抗文本重新录入、复印等再生操作的鲁棒性较差。 基于内容的方法:建立在文本内容理解的基础上,主要通过修改自然语言语句来隐藏信息,利用同义词替换,可选择同义词、同义词频率、同义词语义歧义等特征值携带秘密信息;利用语句结构的变化,可选择句法分析树和词性标记串等特征值携带秘密信息。更高级的是利用文法来生成含密文本。 例:汉语语句“风景优美的房间请给我。”部分改写实例 (1) 风景优美的房间请给我。 (2) 请把风景优美的房间给我。 (3) 我想要风景优美的房间。 (4) 请给我风景优美的房间。 (5) 房间请给我风景优美的。 (6) 把风景优美的房间给我。 (7) 风景优美的房间给我。 (8) 风景优美的房间我要。 (9) 我要风景优美的房间。 (10)给我风景优美的房间。 我们可以有10种改写方式(或许还有更多的其它方式),10个句子的语法都正确,意思也相似。因此,采用定长编码方法,一个句子用句法分析树可携带3比特信息。再考虑到用“优美”的同义词{美丽,漂亮,好看,悦目,美妙,幽美,优美}做替换,则可增加到70个改写句子,一个句子就可携带6比特信息。当然还可以进一步综合利用词性标记等其它特征值来携带信息以提高容量。 3.信息隐藏算法的两个基本要素 秘密信息的隐藏空间与隐藏方式是信息隐藏算法的两个基本要素。隐藏空间称为嵌入工作域,人们总是利用工作域中的各类特征值来携带秘密信息。隐藏方式由数据嵌入方式实现,包括叠加嵌入和映射嵌入。叠加嵌入中,秘密信息作为弱信号用叠加的方式嵌入到宿主信号的特征值中;映射嵌入中,宿主信号的系数被映射函数映射到由嵌入比特确定的特征值,嵌入方式直接受特征值性质制约。 目前的文本信息隐藏研究一般集中在寻找文本的各种特征值并设计相应的信息隐藏方法等较为基本的内容上,而对照信息隐藏的要求(数据有效载荷、不可感知性、鲁棒性、误判率、安全性、计算效率和成本等)去研究特征值的性质并评价相应信息隐藏算法的研究工作还很缺乏。 4.项目研究内容、目标 文本载体信息隐藏过程一般包括以下步骤:秘密信息编码(映射)为载体特征值(格式参数、同义词、语法树、逆序数等);根据特征值修改载体得到含密载体(受文本不可感知性条件约束);公开发送含密载体以及文本编辑处理等噪声干扰;接收方计算特征值并译码提取秘密信息。 设信息隐藏函数为
文档评论(0)