MALLET教程..doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Mallet:自然语言处理工具包 发表于128 天前???技术,?科研???评论数 6?? 被围观?1006?Views+ MALLET是基于java的自然语言处理工具箱,包括分档得分类、句类、主题模型、信息抽取等其他机器学习在文本方面的应用,虽然是文本的应用,但是完全可以拿到多媒体方面来,例如机器视觉。 MALLET包含了足够的文本分类的算法,还有特征提取的算法等。文本分类的算法像是Na?ve Bayes, Maximum Entropy, and Decision Trees等,而且也对代码做了优化。 MALLET也包含sequence tagging的工具和算法,例如信息抽取的应用等,算法有Hidden Markov Models, Maximum Entropy Markov Models, and Conditional Random Fields. MALLET也包含主题模型:topic modeling?toolkit contains efficient, sampling-based implementations of Latent Dirichlet Allocation, Pachinko Allocation, and Hierarchical LDA. MALLET当然还有其他功能,很强大。下面是api和一个pdf的链接:[API] [教程]。 ==============关于MALLET的安装配置================== 这里有一个安装配置的说明,我把它转载过来了: Mallet?使用说明 ? Mallet是专门用于机器学习方面的软件包,此软件包基于java。通过mallet工具,可以进行自然语言处理,文本分类,主题建模。文本聚类,信息抽取等。下面是从如何配置mallet环境到如何使用mallet进行介绍。 ? 一.实验环境配置 1.???????下载并安装JDK,并正确设置环境变量 需设置三个环境变量: ?????????JAVA_HOME:该环境变量的值就是Java所在的目录, 例如C:\Program Files\Java\jdk1.6.0_10 ?????????PATH:指定一个路径列表,用于有哪些信誉好的足球投注网站可执行文件。 该环境变量值为:%JAVA_HOME%\bin ????????CLASSPATH:指定一个路径列表,是用于有哪些信誉好的足球投注网站Java?编译或者运行时需要用到的类。该环境变量的值为:%JAVA_HOME%\lib\tools.jar;%JAVA_HOME%\lib\dt.jar ????????运行?cmd ?????????分别输入javac和java,没有出错则表示配置成功。 2.???????下载apache-ant,不需安装,只需正确设置环境变量。 apache-ant是一个基于Java的编译工具。 ????????下载?/bindownload.cgi,解压?放到你要的目录 ????????配置 ??????ANT_HOME:设置为apache-ant的解压目录,例如:C:\server\apache-ant-1.8.0 ?????????????classpath:?%ANT_HOME%\lib ??????Path?:%ANT_HOME%\bin ????????测试 ????????运行?cmd ?????????输入?ant 结果如下则表示配置成功 Buildfile:?build.xml?does not exist! Build failed 3.下载mallet?必威体育精装版版本mallet-2.0.5,地址:/download.php ???????配置环境变量: ?????????MALLET_HOME=MALLET的解压目录,例如C:\mallet ?????????Path中添加?%MALLET_HOME%\bin ?????????classpath:%mallet_home%\class;%mallet_home%\lib;%mallet_home%\lib\mallet-deps.jar ????????运行?cmd,进入到mallet的解压目录 ?????????输入?ant 如果出现Build successful字样,则表示配置成功 ? 二.Mallet简要说明 ? 全称:MAchine?Learning for?LanguagE?Toolkit Mallet是一java的软件包,专门用于统计自然语言处理,文本分类,主题建模,信息抽取,以及其它涉及文本的机器学习方面的应用。 a)?????????文本分类:它的基本思想是,用大量的训练样本训练分类器,再用些测试样本测试分类器的性能,然后保存训练好的分类器模型。当将未知类别的文本输入已训练好的分类模型

文档评论(0)

tiangou + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档