- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中文微博实体链接研究.pdf
网络出版地址:/kcms/detail/11.2442.N1025.004.html
北京大学学报 ( 自然科学版)
Acta Scientiarum Naturalium Universitatis Pekinensis
doi: 10.13209/j.0479-8023.2014.014
中文微博实体链接研究
†
朱敏 贾真 左玲 吴安峻 陈方正 柏玉
西南交通大学信息科学技术学院 , 成都 610031; † 通信作者 , E-mail: zjia@
摘要 针对 2013 年 CCF 自然语言处理与中文计算会议(NLPCC 2013) 中文微博实体链接的任务, 使用 CCF
提供的新浪微博数据作为训练和测试数据, 利用西南交通大学耶宝智慧中文分词平台作为自然语言预处理工
具 , 提出一种实体链接的方法。该方法应用改进的拼音编辑距离算法和后缀词表匹配法, 提出实体聚类消歧
与基于百度百科词频的同类实体消歧相结合的消歧方法。在 2013 年 CCF 中文微博实体链接评测任务中正确
结果的准确率为 0.8838, 在 10 个参赛队伍中名列第 3 位。表明该方法有效并可以适应文本中的噪声。
关键词 微博实体链接 ; 改进的拼音编辑距离; 后缀词表匹配法 ; 实体消歧
中图分类号 TP391
Research on Entity Linking of Chinese Micro Blog
†
ZHU Min, JIA Zhen , ZUO Ling, WU Anjun, Chen Fangzheng, Bai Yu
School of Information and Science Technology, Southwest Jiaotong University, Chengdu 610031;
† Corresponding author, E-mail: zjia@
Abstract The authors focus on the task of entity linking of Chinese micro blog in NLPCC 2013, taking Sina
micro blog data provided by CCF as training data and test data, and Yebol Chinese segmentation system as
segmentation technology. A way of entity linking is proposed which links from knowledge base to search entity
from thesaurus, using improved pinyin ed
您可能关注的文档
- 《误差理论与数据处理(第6版)》费业泰答案(整合最全).doc
- 《软件工程》课程设计图书馆管理系统.doc
- 《过程控制工程及仿真--基于MATLABSimulink》的课件第3章Simulink高级仿真技术.ppt
- 《金属切削机床》课程设计铣床主轴箱设计(完整图纸).doc
- 【2014复习参考】高考地理一轮复习知能达标训练21工业地域的形成(试题+答案+解析,7页).doc
- 【2014复习参考】高考地理一轮复习知能达标训练24人类活动地域联系的主要方式(试题+答案+解析,8页).doc
- 【Photoshop入门词典】第28课画笔形状动态.pdf
- 【一轮效果监测】2014届高考数学一轮复习检测《等差数列》【更多关注高中学习资料库】.doc
- 【京sem辉】蹊径平台使用手册.pdf
- 【华南理工大学学报】基于RBF神经网络的建筑逐时空调负荷预测模型.pdf
- 部编版八年级上册历史复习第一单元中国开始沦为半殖民地半封建社会训练题.docx
- 2024_2025学年高中历史第三单元资产阶级政治家第10课革命的先行者孙中山2教学教案岳麓版选修4.doc
- 2025届高考历史统考一轮复习课后限时集训4专制集权的不断加强含解析岳麓版.doc
- 2025届高考数学试卷专项练习12三角函数与解三角形含解析.doc
- 2025届高考生物一轮复习专题重组卷第一部分单元检测卷十生物技术实践含解析.doc
- 2025届高考政治一轮复习素养测评二十六文化创新含解析.doc
- 2024_2025学年新教材高中政治第二单元人民当家作主6.2民族区域自治制度教案部编版必修3.docx
- 2024_2025学年新教材高中地理第四章区际联系与区域协调发展4国际合作教案新人教版选择性必修2.doc
- 2025届高考数学第二次模拟试卷三理含解析.doc
- 2025版高考英语一轮复习必修3Module6OldandNew学案含解析外研版1.doc
文档评论(0)