集成NLPIR语义分析讲解.doc

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
集成NLPIR语义分析讲解

Java集成NLPIR语义分析系统 简介 NLPIR是一套专门针对原始文本集进行处理和加工的软件,提供了中间件处理效果的可视化展示,也可以作为小规模数据的处理加工工具。用户可以使用该软件对自己的数据进行处理。NLPIR分词系统前身为2000年发布的ICTCLAS词法分析系统,从2009年开始,为了和以前工作进行大的区隔,并推广NLPIR自然语言处理与信息检索共享平台,调整命名为NLPIR分词系统。 NLPIR 系统支持多种编码(GBK 编码、UTF8 编码、BIG5 编码)、多种操作系统(Windows, Linux, FreeBSD 等所有主流操作系统)、多种开发语言与平台(包括:C/C++/C#,Java,Python,Hadoop 等)。/NLPIR-team/NLPIR,这个URL地址可以下载整个的NLPIR项目,如果要下载某一单独部分,比如summary(摘要),在下载时需要用TortoiseSVN工具,在check out里输入地址:/NLPIR-team/NLPIR/tree/master/NLPIR%20SDK/Summary,把tree/master换成trunk,下载。 与web项目集成 web项目的搭建与配置在这里不在累述。 NLPIR2016版本可以使用配置文件配置需要读取的dll路径 使用配置文件时,代码中初始化接口时需要修改读取dll文件的路径。如: 图中的nlpirpathString需要读取dll_or_so_path来获得(避免又用配置文件,有放dll到tomcat bin目录下的问题) 如果不用配置文件,则需要把用到的dll放到tomcat的bin目录下。 我们以提取文本摘要为例,讲一下集成NLPIR。 加入jar包 pom.xml里加入jna包的引用 拷贝Data和win64两个文件夹 把下载的源码中Data和win64两个文件夹拷贝到tomcat的bin目录下 拷贝代码 拷贝src下的文件到项目下,修改包路径 对方法进行简单封装 ClibraryDS.java类的代码如下,我把初始化接口的静态变量放到了自己的测试类中 package com.springmvc.nlpir.summary.lingjoin.summary; import com.sun.jna.Library; /** * 生成摘要的组件,该组件可以自定义摘要的长度 * @author lingjoin_zyp * */ public interface CLibraryDS extends Library { // 定义并初始化接口的静态变量 /** * 功能:初始化 * @param sPath Data目录的父目录,可以直接传入来表示寻找项目下的Data目录 * @param nEncoding 设置分词编码,只能处理相应初始编码的文件.默认为GBK。 * 0:GBK;1:UTF-8;2:BIG5;3:GBK_FANTI * @param sLicenseCode 授权码,这里直接用0,就可以了 * @return true - 成功;false - 失败 * 备注:在进程中此函数必须在其他函数之前调用(只需执行一次) */ public boolean DS_Init(String sPath, int nEncoding, String sLicenseCode); /** * 功能:生成单文档摘要 * @param sText 文档内容 * @param fSumRate 文档摘要占原文百分比,该值最大不能超过1.00 * @param iSumLen 用户限定的摘要长度 * @param bHtmlTagRemove-[IN] 是否需要对原文进行Html标签的去除 * @return * 备注:fSumRate和iSumLen这个两个参数设置一个就可以了,例如: * DS_SingleDoc(sText, 0.00f, 80); * DS_SingleDoc(sText, 0.50f, 0); */ public String DS_SingleDoc(String sText, float fSumRate, int iSumLen, boolean bHtmlTagRemove); /** * 退出,释放资源;进程结束前须调用它释放所占用的内存资源 * 备注:如果需要频繁的生成摘要,那么不要调用这个方法 */ public void DS_Exit(); /** * 获得错误消息 * @return 错误消息

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档