网站大量收购独家精品文档,联系QQ:2885784924

资讯检索系统测试集之比较.pptVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

topic_id編號/topic_id01020304組成結構description簡短的資訊需求,主要為名詞與其修飾語 構成的名詞詞組/descriptionnarrative詳細的資訊需求,以自然語言敘述,通常為2 至3個句子組成,亦包含名詞解釋,同義詞 或實例./narrativedescription欄位中的詞彙必須包含在narrative欄位中IREX~查詢主題資訊檢索系統測試集之比較

圖書與資訊學刊第29期(1999年5月)by江玉婷,陳光華

台大圖資所碩士論文測試集(TestCollections)文件集(DocumentSet;DocumentCollection)查詢問題(Query;Topic)相關判斷(RelevantJudgement)根據不同的目的而有不同的評比項目量化的測量準則,如Precision與Recall組成要素評比用途設計與發展:系統測試評估:系統效能(Effectiveness)之測量比較:不同系統與不同技術間之比較測試集(TestCollections)(續)早期:Cranfield英文:SMART,OHSUMED,CysticFibrosis,LISA….日文:BMIR-J2小型測試集美國:TREC日本:NTCIR,IREX,歐洲:AMARYLLIS大型評比環境:提供測試集及研討的論壇1比較33種不同索引方式之檢索效益3請每位作者根據這些文件與其當時研究的主題提出問題,經篩選後產生200餘個查詢問題2蒐集1400篇有關太空動力學的文件(摘要形式)CranfieldIICranfieldII(Continued)CranfieldII測試集中相關判斷建立四個步驟首先請提出查詢問題的建構者對文件後所附之引用及參考文獻進行相關判斷接著請五位該領域的研究生將查詢問題與每篇文件逐一檢視,共花了1500小時進行了50萬次以上的相關判斷,希望能找出所有的相關文件。為了避免前述過程仍有遺漏,又利用文獻耦合的概念計算文件間之相關性,發掘更多的可能相關文件。若有兩篇以上的文獻共同引用了一篇或多篇論文,則稱這些文獻間具有耦合關係。最後,將以上找出的所有文件,再一併送回給原作者進行判斷。TREC:TextREtrievalConference01主辦:NIST及DARPA,為TIPSTER文件計劃之子計劃之一02文件集5GB以上數百萬篇文件03TREC~簡介TREC文件集TREC之文件標示TREC-1andTREC-2查詢主題TREC-3查詢主題TREC-4查詢主題主題結構與長度主題建構主題篩選pre-search判斷相關文件的數量TREC~查詢主題TREC-6之主題篩選程序判斷方法PoolingMethod人工判斷判斷基準:二元式,相關與不相關相關判斷品質完整性一致性123TREC~相關判斷STEP1STEP2STEP3針對每個查詢主題,從參與評比的各系統所送回之測試結果中抽取出前n篇文件,合併形成一個Pool視為該查詢主題可能的相關文件候選集合,將集合中重覆的文件去除後,再送回給該查詢主題的原始建構者進行相關判斷。利用此法的精神是希望能透過多個不同的系統與不同的檢索技術,盡量網羅可能的相關文件,藉此減少人工判斷的負荷。Pooling法TREC候選集合與實際相關文件之對照表TREC~評比TREC~質疑與負面評價測試集方面查詢主題並非真實的使用者需求,過於人工化缺乏需求情境的描述相關判斷二元式的相關判斷不實際poolingmethod會遺失相關文件,導致回收率不準確品質與一致性效益測量方面只關注量化測量回收率的問題適合作系統間的比較,但不適合作評估TREC~質疑與負面評價(續)評比程序方面互動式檢索缺乏使用者介入靜態的資訊需求不切實際第一個日文資訊檢索系統測試集BMIR-J1:1996BMIR-J2:1998.3文件集:主要為新聞文件每日新聞:5080篇經濟與工程發展單位:IPSG-SIGDS查詢主題:60個BMIR-J2~簡介01以布林邏輯結合關鍵詞檢索1-2個IR系統02由資料庫檢索者做進一步的相關判斷03由建構測試集的人員再次檢查B

文档评论(0)

wangwumei1975 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档