基于稀疏自编码的属性网络嵌入研究及应用.pdfVIP

下载本文档

10
0
约7.65万字
约 56页
2020-08-07 发布于江苏
举报
版权申诉

基于稀疏自编码的属性网络嵌入研究及应用.pdf

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

摘要随着互联网数据的爆炸式增长，海量数据来源的多源性、异质性、随机性、模糊性等特点为数据分析带来了新的挑战，如何从海量数据中挖掘有益信息，为企业决策提供依据变得越来越重要，也逐渐成为一个新的研究课题。从海量数据中挖掘有效信息的方法众多，当前比较主流的一个处理方法是先将数据表示成属性网络，再通过网络嵌入等手段提取网络特征，最后使用提取到的网络特征完成具体任务，如分类、聚类、链接预测、推荐等。网络嵌入是将网络中节点编码成低维、稠密向量，从而避免大数据来源的差异性、高维性、异质性等问题达到提取网络固有特征的目的。研究表明，有效提取网络固有特征不但能加快模型训练速度，还能提高后续任务的准确度。本文研究如何从网络中提取网络固有特征，为网络节点生成低维、稠密向量，并在真实网络上验证获取的网络嵌入的性能。针对当前现有网络嵌入方法未能有效挖掘网络固有特征问题，本文围绕网络嵌入提取展开研究，主要研究内容如下： (1) 加权融合网络拓扑特征和语义属性信息。网络拓扑部分整合三部分内容：网络的邻接矩阵、从网络拓扑中提取的二阶邻居、共同邻居比信息；语义属性信息是由语义属性矩阵计算而成的语义属性模块度矩阵。 (2) 网络嵌入提取。使用半监督稀疏自编码模型对融合后的向量进行训练，获得属性网络的网络嵌入。在模型训练过程中，将半监督约束和稀疏损失约束添加到目标函数中，引导模型提取网络特征过程以得到更高质量的网络嵌入。 (3) 将基于稀疏自编码的属性网络嵌入算法应用于引文推荐领域。利用知网文献的引用关系，构建知网属性网络的网络拓扑；根据文献标题、作者、摘要、关键词、分类号、发表期刊信息构造属性网络的语义属性矩阵；将融合网络拓扑和语义属性矩阵后的向量喂入半监督稀疏自编码模型获得网络嵌入；使用获得的网络嵌入进行聚类使相似文献相邻显示，从而提高用户查找文献效率、达到文献精准推荐目的。关键字：引文推荐属性网络网络嵌入稀疏自编码半监督聚类 I ABSTRACT With the explosive growth of Internet data, the multi-source, heterogeneity, randomness and fuzziness of massive data sources have brought new challenges to data analysis. How to mine useful information from massive data and provide basis for enterprise decision-making has become increasingly important, and has gradually become a new research topic. There are many methods to mine effective information from massive data. At present, one of the mainstream processing methods is to express data as attribute network, then extract network features by means of network embedding, and finally use the extracted network features to complete specific tasks, such as classification, clustering, link prediction, recommendation and so on. Network embedding is to encode nodes in the network into low-dimensional and dense vectors, so as to avoid the differences, high-dimensional and heterogeneity of large data sources and