- 1、本文档共57页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[数学建模方法之一:结构主义
Web中的数学建模例子 网络已经成为现代人的一种生活方式。在网上,每天有成千上万的多媒体文件在传输(例如,路透社每天收到网上文本文件达20万)。试建立数学模型,使得可以对这些文件进行自动分类,以便人们阅读和使用。 四、结构化建模例子 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 在线文本自动分析建模 原型的目标: 在线电子文本的计算机自动分类与辅助理解。 理解基于分类,分类是理解的前提。 不同的分类目的有不同的分类模型: 理解性分类 —— 基于语意、概念层、主题层的细分类,目的是分析和理解。 1、建立专业模型 检索性分类 —— 国际图书分类法,目的是查询; Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 原型的结构分析 文本——章节——节——段落—— 语意团——句或短语——词——字符 文本的结构: 原型有两层结构:文本的结构; 文本集合的结构。 分析:文本集合的结构是原型对应目的的主要结构; 文本集合的结构依赖于文本的结构(子结构); 文本结构的表示应该利于文本集合分类目的。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 文本集的结构分析: 联想到数学中代数结构:集合中定义代数运算,加法和数乘,元素间的运算关系 —— 结构相同! 两个文本的合并还是文本 一个文本的倍数仍然是文本 分析文本集的结构,首先是文本之间的相互关系: 2、同构分析(数学结构与原型结构的联系) ——加法封闭; ——数乘封闭! Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 同构: 此时问题的原型的结构直接和数学结构联系起来! 文本的集合应该有一个“线性空间”的结构; 文本的分类是在线性空间中的“向量的分类”! 对于线性代数的结构有清楚的理解和关注,则容易发现: Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 因此,每个文本对应地定义一个文本向量,用于分类,分量如何定义? 显然,分量是“分类特征”的具体表示:从关键词和检索中,容易想到基于词频的,可用于区分文本的量化的表示! 数学模型:向量空间的结构+词频特征表示。 3、同构表示与数学建模 建立原型结构的数学表示则建立了数学模型。 文本集合同构于线性空间,文本的分类是线性空间中向量的分类。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 根据专业知识,词频及具有分类的特征信息,——信息熵!因此可以仿照熵的定义: 某词W(i)在文本d 中出现的频数 × log( ) 集合中文本总数 词W(i)在文本中至少 出现一次的文本数 这里熵的形式,一来用类似信息熵的定义,符合“分类”的特征信息的概念;二来,词频的作用大于词在文本集合中出现的作用。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 假设TF(w(i),dj)是词w(i)在文本dj中出现的次数,|D|是D中文本总数,DF(w(i))是指在D中至少出现一次w(i)的文本数。则每一个文本dj∈D,和一个特征词w(i)存在一量: 形
您可能关注的文档
- [教育心理学第9章问题解决与创造性.ppt
- [教育技术实验2.ppt
- [教育案例3审视教师的专业发展.ppt
- [教育法学案例分析.ppt
- [教育法制专题.ppt
- [教育的政治功能.ppt
- [教育法学第五单元.ppt
- [教育研究成果的生成与呈现.ppt
- [晋商图书.doc
- 《园林植物病虫害习题集最终版.doc
- 2024租房合同押金条款.docx
- 通用版2025届高考英语一轮复习第9讲虚拟语气学案含解析.doc
- Unit+4+Body+language+Discover+Useful+Structures+动词ing形式做宾语和表语 高中英语人教版(2019)选择性必修第一册.pptx
- 企业个人辞职申请书.docx
- 北京林业大学《刑法分则》2022-2023学年第一学期期末试卷.doc
- 2024租房合同范本「简单版」.docx
- 2023年铬矿石项目可行性评估方案.docx
- 山东版2024高考政治一轮复习第二单元生产劳动与经营第6课时投资理财的选择教案.docx
- 2024复印机租赁合同协议书.docx
- 城市轨道交通乘客信息系统技术规范.docx
文档评论(0)