植基於语意概念及使用者认知观点的诗词资讯检索系统设计.pptVIP

植基於语意概念及使用者认知观点的诗词资讯检索系统设计.ppt

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
植基於语意概念及使用者认知观点的诗词资讯检索系统设计

植基於語意概念及使用者認知觀點的詩詞資訊檢索系統設計:以全唐詩網站為例 .tw 第三屆文學與資訊科技國際研討會 日本學藝大學主辦 2007年3月19-20日 台灣元智大學中國語文學系.羅鳳珠 清華大學.張智星、大葉大學.許介彥 人與電腦 人: 能分辨字形的符碼 能解讀字詞含義的意碼 電腦: 只能分辨字形的符碼 電腦理性客觀,處理有規則而合邏輯的資料。 詩詞與電腦 詩詞: 感性主觀,講究: 只可意會而不可言傳 不著一字而盡得風流 言有盡而意無窮 電腦: 電腦理性客觀 處理有規則而合邏輯的資料。 電腦的侷限 電腦處理有規則及合邏輯的資料,其效率高於人腦何止千萬倍,但是電腦只能分辨字形的符碼,無法解讀字詞含義的意碼,所以引用電腦做為偏重主觀抽象感知的詩詞文學研究輔助工具,比客觀知識的自然科學困難得多。 電腦縱然有強大的記憶與搜尋能力,因為只能以字形分辨,無法辨別語意內涵,不具有思考能力,不具有人的認知、感知能力,不具備人的知識體系,無法滿足使用者的需求。 韻文的語言特色 袁行霈教授在《中國詩歌藝術研究.原序》論及:「如果從語言學的角度給詩歌下一個定義,不妨說詩歌是語言的變形,他離開了口語和一般的文書語言,成為一種特異的語言形式。」 無論從語意或語言形式的角度,詩歌非但與一般口語、文書語言不同,與其他文體也存在著差異,再加上詩歌的形式受到詩歌格律之平仄聲調及字數、句法上的限制,語言更精鍊,語意更豐富,修辭更講究,語境更複雜,需要更多聯想,解讀更困難。 資訊檢索(Information Retrieval)的發展歷程 科學使得人際間的交流非常的快速,科學也提供了思想的記錄,使人類能夠運用這些思想,知識就不再限於個人,而是屬於人類的所有生命。( Vannevar Bush ) 記錄思想的文獻儲存在圖書館,圖書館的資料按照字母或數字排列的索引,只能一層一層往下尋找,不符合人類大腦以思維聯繫尋找資料的方式,因此,Vannevar Bush便構思著建立一個以聯繫(association)代替索引(indexing)以選擇資料的機械化個人文件夾和圖書館(mechanized private file and library) ( Vannevar Bush ) 資訊無論以任何物質/非物質載體、任何媒體形式呈現,從資訊產生者到資訊接收者之間,都會有認知上的落差,提取方法的不同,而產生給予、接受與取得的障礙。 詩詞文體語言的特性所衍生的 資訊檢索需求1/2 詩詞是特殊的語言形式,以不同的修辭技巧達到精緻凝練、語意無窮,情境高遠、言意與形神兼具的境界。 透過修辭的技巧,將作者主觀內化的情思意念,投注在客觀外顯的事物上,作為作者與讀者之間引發共鳴的溝通媒介。詩詞所使用的詞彙,有一些是客觀知識的描述闡釋,有一些是主觀情意的引導感發。 詩詞文體語言的特性所衍生的 資訊檢索需求2/2 主觀情意的感發,往往因為讀者的學養、經驗、年齡、心理氣質、思想境界等各種背景差異而使感受各有不同,因此相同的詞彙,相同的作品,感受上存在者個別的差異,即便是同一個人,經過不同時空,重讀相同的作品,感受也會不同,這是客觀認知與主觀感知的問題。 文學表達的情感通常是主觀而抽象的,即便是藉助客觀的物象作為作者與讀者之間溝通的媒介,仍然存在著感知層次的不同,因此,資訊檢索的技術,應用在文學上,其困難度比自然科學領域高得多,應用在特殊語言形式的詩詞,困難度又高於小說、戲劇、散文等文體。 傳統文學網站資訊檢索功能及缺點1/2 傳統的文學網站檢索都只能比對字形,不能分辨詞形、詞義。文學講究修辭變化,講究文采意境,一詞多義,一義多詞的現象比比皆是。只能比對字形的檢索,檢索結果的完整性及正確都不足,不能滿足一般的使用需求,對於文學領域以研究及教學為目的的使用者而言,尤其不足。 以「月」為例: 一詞多義: 「月」常用的基本含義有四種,其一是月亮,其二是曆法單位,其三是季節代稱,其四是圓形如月亮的物品,這是一詞多義。 一詞多義會使檢索時出現字形、詞形相符但語意不符的資料,影響正確性 一義多詞 「月」若作「月亮」解時,同義詞有「月亮=玉兔=銀蟾=玉杯=玉鉤=玉盤=玉輪=玉蟾=生魄=冰輪=兔降=孤光=明霽=金波=金輪=桂華=桂魄=素娥=掩夜=清光=寒暉=嬋娟=瓊瑤=蟾影‥‥」,這是一義多詞。 一義多詞會遺漏很多語意相同但字形、詞形不同的資料,影響完整性。 傳統文學網站資訊檢索功能及缺點2/2 電腦無法分辨詞組的構詞單位,所以檢索時會產生因為無法正確判斷詞組而造成檢索結果錯誤的情形。以「春風」為例從全唐詩網站檢索,共得1,182筆資料:劉長卿〈使回赴蘇州道中作〉詩:「春風何事遠相催,路盡天涯始卻回。」 薛稷〈奉和聖製春日幸望春宮應制〉詩:「九春/風景

您可能关注的文档

文档评论(0)

118books + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档