哈工大信息检索研究室.ppt

  1. 1、本文档共83页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
哈工大信息检索研究室

哈工大信息检索研究室 工作介绍 刘 挺 2007年9月13日 目录 哈工大的中文信息处理 哈工大信息检索研究室(HIT IR Lab) IR Lab的几项研究课题 哈工大的中文信息处理 历史 20世纪 60年代,哈工大的一些研究人员开始从事俄汉机器翻译研究 80年代,转入汉英机器翻译 80年代末,哈工大成功地研制了 整句拼音汉字输入系统 联机手写体汉字识别系统 并开始了语音识别及情报检索的研究工作 21世纪 经过40多年的努力,哈工大在语言语音处理领域打造了一支200多人的科研队伍,积累了一批关键技术和数据资源。 队伍 重点实验室:李生教授 机器智能与翻译研究室:赵铁军教授 杨沐昀、郑德权 智能技术与自然语言处理研究室:王晓龙教授 关毅、刘秉权、徐志明、林磊、刘远超 语音处理研究室:韩纪庆教授 李海峰、郑铁然 信息检索研究室:刘挺教授 张宇、秦兵、车万翔 深圳分部(哈工大深圳研究生院):王轩副教授 陈清才 校友 王海峰(东芝)、张民(新加坡)、于浩(富士通)、付国宏(香港大学) 荀恩东(北语)、吕雅娟(计算所)、姚建民(苏州大学)、张刚(计算所) 人员分布 总人数200余人 实验室现有教师21人 其中教授/博导7人 在校博士研究生51人 硕士研究生95人 另有深圳分部40余人 主要研究方向 语言 智能中文信息处理平台 语句级中文输入法 机器翻译技术、资源、评价的研究 面向互联网的信息检索 问答系统 文本挖掘与自动文摘 语音 顽健语音识别与声控技术 基于语音的信息安全技术 音频信息检索技术 科研项目 自2000年以来,该实验室先后承担国家及部委科研项目近40项 国家863计划5项 国家自然科学基金 重点项目1项 面上项目16项 部委项目15项 近两年承担的国家项目 2005年,国家自然科学基金5项 2006年,国家自然科学基金3项 2006年,863专题项目3项 发表论文 近2年发表论文160余篇 国际期刊5篇 IEEE Transactions on Systems, Man and Cybernetics Bioinformatics 国际会议 在国际人工智能大会IJCAI’2007上发表2篇论文 在国际计算语言学大会Coling/ACL’2006上发表三篇论文,ACL’2007两篇 国内重要期刊 《中国科学》 《计算机学报》《软件学报》…… 发表的论文中英文论文占40% 哈工大信息检索研究室 (HIT IR Lab) 人员数量的增长 目前组织结构 人才培养 2005-2006 秦兵、卢志茂获得博士学位 文化:友爱精诚乐学日新 国内IT知名企业 输入: 四通打字机、王码五笔字型 汉王中文手写 汉王、清华紫光/文通OCR 语音识别 输出 巨人汉卡、联想汉卡 北大方正汉字激光照排系统 科大讯飞语音合成 国内IT知名企业 内容处理 检索 百度、雅虎、搜狗、有道(网易)、搜搜(腾讯) TRS 翻译 华建 金山 信息检索 文本的优势 语言文字是人类记录和交换高层知识的载体 例证:从小人书到小学课本,再到中学课本,图片逐渐减少,文字逐渐增加 语言文字能够方便地表达抽象的概念 例证:当前实用化的图片检索、视频检索、音乐检索、语言检索都是通过对相关文本信息进行的 Web 2.0的助推 以论坛、博客为代表的Web 2.0迅猛发展,导致媒体平民化,“从少数人发布信息”到“人人都是作者”, 海量、多角度、零散、动态更新的观点充斥互联网,这些信息亟待深度分析与整合,需要自然语言处理技术的介入 网站举例 奇虎():经验有哪些信誉好的足球投注网站 搜评():评论有哪些信誉好的足球投注网站 趋势 科研项目 科研项目 科研成果 技术评测 国家863评测 2003年自动文摘评测第1名 2004年信息检索第2名 2005年信息检索名列前茅 国际评测 CoNLL语义角色标注评测 2005年,19单位并列第6名 SIGHAN汉语分词评测 2005年,北大测试语料库,第3名和第5名 SemEval词义消歧评测 2007 第1名 学术论文 主要论文 语言技术网 成果转化 出访 来访 召集会议 研究合作 开发合作 联合实验室 IRLab的几项研究课题 IRLab的几项研究课题 语言技术平台LTP 特定上下文中的词汇复述 汉英双语例句检索 阅读理解 汽车领域的垂直有哪些信誉好的足球投注网站引擎 语言技术平台LTP LTP平台的框架 LTML (Language Technology Markup Language) 资源共享 免费共享程序资源和数据资源 《同义词词林(扩展版)》 中英文双语句对 中文问答系统测试集 汉语依存树库 “分词/词性标注/依存分析/词义消歧”人工标注语料库 自动文摘语料库 基于等价伪词的词义消歧 等价伪词 用多义词每个义项中的同义单一词构造人造歧义词 用这些单义词的上下文环境模拟多

文档评论(0)

shenlan118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档