- 1、本文档共3页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于 Google 有哪些信誉好的足球投注网站路径的课程信息垂直有哪些信誉好的足球投注网站引.doc
基于 Google 有哪些信誉好的足球投注网站路径的课程信息垂直有哪些信誉好的足球投注网站引
【摘要】课程信息垂直有哪些信誉好的足球投注网站引擎,即在课程信息这个特定的领域里,让用户能有哪些信誉好的足球投注网站到最精准
最全面的结果。本文利用 Google 发现“学校-学院-教师-课程”路径,利用 HTMLParser 进行
基于 UC[5]、 CoNLL[6]、ACE[7]、SIGHAN[8]等。
就本文而言,实体“课程”包括以下属性:课程名称、学院、学校、教师、教师主页 URL, 课程链接以及课程简介。本文的 NE 识别方法为基于 LParser 编写包装器进行基于 WEB 页面结 构分析的课程元数据信息抽取。
第 2 节介绍了本文的总体思路与核心算法,重点介绍了抓取网页的基类,并以卡耐基-
梅隆大学的生态环境研究学院为例,具体叙述了专门为该学院编写的包装器。
第 3 节评测了算法的查全率,查准率和 F-度量,分析了本文算法的性能。 第 4 节简单介绍了本文涉及的实现技术。
最后,对本文的性能和扩展做了小结,指出了针对本文改进和发展的方向。
2.1 利用 Google 发现有哪些信誉好的足球投注网站路径
课程的自然组织形式为从大学、学院、教师再到课程或者从大学、学院直接到课程。因 此,本文利用 Google AJAX Search API 以及 Google 的高级有哪些信誉好的足球投注网站语法按以下两种顺序之一来 发现课程信息:
(1) 学校→学院→教师→课程
(2) 学校→学院→课程
2.1.1 Google API 和高级有哪些信誉好的足球投注网站语法
如图 1 所示,为本文设计的基于 Google 的路径发现页面有两个输入框,keyeKeyeKeyeType ”,表示过滤文件类型为“someType”的结果。
“intitle:someKeyeKeyu”,site 留空。第一个得到的 结果即为 .cmu.edu/
(2) 学院在 keyental cmu”,site 留空。第一个结果即为 .ce.cmu.edu/
(3) 课程信息页面:在 keyu.edu”。得到 2007-course-list 和 2008-course-list 的 URL 地址。
(4) 教师信息页面:在 keyu.edu”。得到 falculty 的 URL 地址。
2.2 LParser,使用的版 本为 1.6。HTMLParser 是一个简单而功能强大的 Java HTML 解析器库,可以分析和处理 LParser 的分析器 parser,设置编码方式
2. 根据 WEB 页面结构选择适合的 Filter,比如本页面要提取课程简介,则该节点必定含有关键词
Description,因此选用 StringFilter coursefilter = neental.java 继承(extends)于 Extractor.java 主要包括两个函数:
(1) getTeachers(),通过分析 WEB 页面结构获得教师信息,并存储于 teacherList,
伪代码见图 3: 1. 初始化 teacherList,数据,类型为 ArrayList
2. 根据 U 根据卡耐基梅隆大学课程编号的统一形式,用正则匹 配
[0-9]{2}-[0-9]{3},(即判断索引中的 name 域的值是否以“两个数字”+“-”+“三个数字”开头), 如果不是,说明不是卡耐基梅隆大学课程的索引项,删除该项。
1. 调用 setInfor()函数,设置了每一门课程的公共信息,本例为学校和学院
2. 初始化 HTMLParser 的分析器 parser,并设置编码方式
3. 分析 LParser 进行基于 ellon College of Sciences
(MCS,样本 600,未提供教师信息),第三行数据为 College of Fine Arts(CFA,样本 120)。
表 1 查全率,查准率,F-度量的比较
Tab.1 parison of Recall,Precision,F-measure
4.系统实现
本文的 Model-Vie4j 通过对 xml 文 件的读写实现实现“Latest KeyQuery 词条有哪些信誉好的足球投注网站,QueryParser 字串有哪些信誉好的足球投注网站,BooleanQuery 布尔有哪些信誉好的足球投注网站等等。 分词基于 Lucene 的中文分词软件—JE 分词。本有哪些信誉好的足球投注网站引擎同时支持中文和英文有哪些信誉好的足球投注网站。
图 5 各个学院的 F 度量
Fig5 F-measure of different colleges
5.总结和展望
本文提出了利用 Google 按照“ 学校- 学院- 教师- 课程” 发现有哪些信誉好的足球投注网站路径,然后利用 HTMLParser 编写包装器进行基于 M、CRF 等统计模型的元数据算法。并且将利用 . Chau and H. Chen. Persona
您可能关注的文档
- 培养孩子学习心得(精选多篇).doc
- 培养英语朗读习惯 提高学生学习能力.doc
- 培养适应岗位需求的银领人才 ——长三角部分企业考.doc
- 培育和践行社会主义核心价值观的意义(精选多篇).doc
- 培训代表发言(精选多篇).doc
- 培训会会议主持词.doc
- 培训会议主持词串词.doc
- 培训会议主持词结束语.doc
- 培训会议领导讲话(精选多篇).doc
- 培训会领导讲话(精选多篇).doc
- 2025年北京市东城区高三一模政治试卷(含答案).pdf
- 桂林市、来宾市2025届高三高考一模英语试卷(含答案详解).pdf
- (二模)2025年茂名市高三年级第二次综合测试英语试卷(含答案).docx
- (二模)岳阳市2025届高三教学质量监测(二)政治试卷(含答案解析).docx
- 四年级阅读分析段落技巧和答题方法 PPT课件.pptx
- 小学四年级语文概括文章主要内容阅读理解答题技巧PPT课件.pptx
- (二模)金华十校2025年4月高三模拟考试历史试卷(含答案).docx
- (二模)包头市2025届高三第二次模拟考试语文试卷(含答案解析).docx
- (二模)2025年茂名市高三年级第二次综合测试化学试卷(含答案).pdf
- 2025年金华十校高三二模英语试卷(含答案).pdf
最近下载
- 复盛CSR系列压缩机技术手册-2015版.pdf VIP
- 现代通信网第5章-5电话通信网1105.ppt VIP
- 腰椎间盘突出症介入治疗进展.ppt
- 中秀3000资料.pdf
- 证券从业《金融市场基础知识》教材.pdf
- 现代通信网基础.ppt VIP
- 2017年山东东营中考历史试卷.docx
- 高中物理实验报告单(完整版).pdf
- 八年级数学上册专题12.21 三角形全等几何模型-一线三等角模型(巩固篇)(专项练习)-2022-2023学年八年级数学上册基础知识专项讲练(人教版).docx VIP
- 江西欣和化工有限公司年产5万吨脂肪酸甲酯(生物柴油)、年产5万吨精制甘油(生物碳源)、年产1万吨过一硫酸氢钾复合盐、2万吨过硼酸钠项目环境影响报告书.pdf
文档评论(0)