- 1、本文档共15页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
LJCorpus中文语料库分析软件使用手册
Copyright ? 2009灵玖软件 Website: TEL:010玖LJCorpus中文语料分析软件LING-JOIN Chinese Corpus Parser Syetem用户手册MANUALFriday, April 16, 2010Document InformationDocument ID LINGJOIN-LJCorpus -MANUALVersion V1.0Security level Status Creation and first draft for commentAuthor DateApril 11, 2010Publisher/Approved byVersion History Note:The first version is”v0.1”. Each subsequent version will add 0.1 to the exiting version. The version number should be updated only when there are significant changes, for example, changes made to reflect reviews. The first figure in the version 1.x denotes current review status by. 1. x denotes review process has passed round 1 etc .Anyone who create, review or modify the document should describe his action.Version Author/ReviewerDateDescriptionV1.02010-04-16Creation and first draft for comment.目 录 TOC \o 1-3 \h \z \u HYPERLINK \l _Toc259197153 LJCorpus中文语料库分析软件简介: PAGEREF _Toc259197153 \h 3 HYPERLINK \l _Toc259197154 LJCorpus中文语料库分析软件操作步骤 PAGEREF _Toc259197154 \h 3 HYPERLINK \l _Toc259197155 第一步:新词发现 PAGEREF _Toc259197155 \h 5 HYPERLINK \l _Toc259197156 第二步:导入用户词典,对语料进行分词及词性标注 PAGEREF _Toc259197156 \h 6 HYPERLINK \l _Toc259197157 第三步:词频统计及翻译 PAGEREF _Toc259197157 \h 9 HYPERLINK \l _Toc259197158 四、关于灵玖软件 PAGEREF _Toc259197158 \h 10 HYPERLINK \l _Toc259197159 灵玖软件介绍 PAGEREF _Toc259197159 \h 10 HYPERLINK \l _Toc259197160 联系我们 PAGEREF _Toc259197160 \h 10 LJCorpus中文语料库分析软件简介:语料库语言学是20世纪80年代才崭露头角的一门交叉学科,它研究自然语言文本的采集、存储、加工和统计分析,目的是凭借大规模语料库提供的客观翔实的语言证据来从事语言学研究和指导自然语言信息处理系统的开发。随着互联网的爆炸式增长,中文语料库的规模也随之剧增。语言学的研究面临着各类复杂的海量数据,亟需采用信息化的手段,自动分析相关的语言数据,从而更好地研究并开发使用的自然语言信息处理系统。LJCorpus中文语料库分析软件是一套专门针对中文生语料库的加工、抽取、统计与翻译全自动的综合语料分析系统,应用了领先的汉语词法分析技术、新词发现技术、统计挖掘技术以及词语翻译对齐技术。LJCorpus中文语料库分析软件的四大功能主要包括:新词发现:从给定的大规模文本文件集合中,挖掘出内涵的新词语列表,可以用于用户专业词典的编撰。识别出的新词结果还可以进一步编辑标注,编辑好的新词词典,可以作为专业知识库导入分词词典中,从而提高分词系统的准确度,并适应新的语言变化情况。分词标注:对生语料进行分词、自动识别人名地名机构名等未登录词、新词标注以及词性标注。并可在分析过程中,导入用户定义的词典。统计分析针对切分标注结果,系统可以自动地进行统计分析,分析结果包括:一元词频统计
您可能关注的文档
最近下载
- 高净值客户的财富保全与传承-1.pptx
- 工业互联网技术专业职业生涯规划书发展报告大一全国大学生职业规划大赛模板范文1500字.pdf VIP
- 吡咯替尼治疗HER2阳性晚期乳腺癌的真实世界研究.pdf
- 实验室生物安全个人防护培训考核试题.pdf
- 2024年医疗卫生行业继续教育答案-阿尔茨海默病早期筛查新进展和智能监测技术题库.docx VIP
- 高中地理人教版(2019)必修一6.1.1台风气象灾害(共18张ppt).pptx
- 北师大版小学数学三年级上册第八单元 认识小数 大单元整体教学设计学历案教案附作业设计(基于新课标教学评一致性).docx
- 传染病防治卫生监督工作规范答案-2024年全国疾控系统大学习活动.docx VIP
- YC创业课全集.docx
- 音乐教案:金蛇狂舞.pdf VIP
文档评论(0)