- 1、本文档共36页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[结构主义建模
根据专业知识,词频及具有分类的特征信息,——信息熵!因此可以仿照熵的定义: 某词W(i)在文本d 中出现的频数 × log( ) 集合中文本总数 词W(i)在文本中至少 出现一次的文本数 这里熵的形式,一来用类似信息熵的定义,符合“分类”的特征信息的概念;二来,词频的作用大于词在文本集合中出现的作用。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 假设TF(w(i),dj)是词w(i)在文本dj中出现的次数,|D|是D中文本总数,DF(w(i))是指在D中至少出现一次w(i)的文本数。则每一个文本dj∈D,和一个特征词w(i)存在一量: 形式化: 记d(i)j =TFIDF(w(i),dj) ,则每一个文本dj∈D,存在一个分量适当排序的文本向量。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 文本向量空间模型与文本向量: Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 问题的目标:文本集的分类 原型的结构分析: 文本集的结构(目标)+文本的结构(表示的关键) 同构分析: 数学结构和原型结构的联系 文本集的结构≌线性空间结构 数学模型表示: 文本向量空间+文本向量(词频表示的分量) 建模过程 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 文本自动分类: 理解文本的类属性,子空间分类. 文本自动聚类: 发现文本集合中的新模式,新概念. 文本向量: 由文本的实意词的特征值或特征模式为分量的向量. 以信息熵的形式构造. 特征子空间: 具有某种共同意义的分量组成的子空间. 主义 自由 个人 文本向量空间: 全部文本向量的高维线性空间. 应用事例:思想史研究中,“五四” 运动的讨论的主要思想是什么? 发现在“自由主义”的特征词所在的子空间中,文本的投影数量最大! Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 例题小结: 本题几乎没有人见过类似的问题。这为“引模”带来了不少困难。 如果有结构化建模的理念,而且熟悉线性代数,就比较容易通过一定的思考产生模型的。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. * * 结构主义数学建模方法 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 一、引子:建模=引模? 大学生的问题:数学建模 = 数学引模 ? 一个数学建模培训教学流程: 介绍建模五步法(一节课); 工具训练(四节课); 讲解案例(二十节课); 练习(十节课). 分析实际问题的系统方法?建模的一般方法? Eva
文档评论(0)