以部落格语料进行情绪趋势分析摘要1绪论.pdf

以部落格语料进行情绪趋势分析摘要1绪论.pdf

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
以部落格以部落格料行料行情分析情分析以以部落格部落格料行料行情分析情分析昌高虹安信希立台大工程系摘要摘要摘要摘要部落格提供大量具有的文本言理所需富料源本文文本的特性其切分成不同域的料子集合合域所提供的料察目通常包含意情在跨域的化作分析的基了得不同域的部落格文本本研究提出部落格系收集跨域的文本同以情分析例以特定查在部落格系反的相文本得各域的情特徵藉以解路空人特定所反的情化近年全球上各系的明持改人吸收理的方式以年作一概括的分水分析使用者的性可年之前人接路到逐上的容包含新旅情生活投消息工作等年之後人始

以部落格以部落格語料進行語料進行 情緒趨勢分析情緒趨勢分析 以以部落格部落格語料進行語料進行 情緒趨勢分析情緒趨勢分析 楊昌樺 高虹安 陳信希 國立台灣大學資訊工程學系 {d91013, r95116, hhchen}@.tw 摘要摘要 摘要摘要 部落格提供大量 具有時間標記的文本 ,為語言處理所需豐富語料來源 。本文針對文 本的時間標記特性 ,將其切分成不同時間域 (Time Domain)的語料子集合 ,綜合個別時間 域所提供的語料 ,觀察目標觀點 (sentiment ,通常包含意見與情緒)在橫跨時間域的變化 , 作為觀點 趨勢分析的基礎 。為了獲得不同時間域的部落格文本,本研究提出部落格資訊 系統 ,收集跨時間域的文本 。同時以情緒分析為例,以特定查詢在部落格資訊系統反饋 的相關文本 ,獲得各時間域的情緒特徵,藉以解讀 網路空間人們對特定議題所反應的情 緒變化 。 1. 緒論緒論 緒論緒論 近年來 ,全球資訊網(World Wide Web; Web)上各種資訊系統的發明 ,持續改變人們 對資訊吸收與處理的方式 。以2005 年作為一個概括的分水嶺 ,分析使用者的習性,可發 現: 2005 年之前 ,人們從接觸網路,到逐漸習慣閱讀Web 上的內容 ,包含新聞報導、旅 遊情報 、生活資訊、投資消息、工作機會等。2005 年之後,人們開始廣泛地創造Web 上 的內容 ,包含製作自己部落格、相簿遊記、影音紀錄等。Web服務 提供者,為了能滿足 前者的閱讀需求 ,激發了內容網站(如 、) 、與服務網站包括( 入口網 1 2 站,如 Yahoo! ,及搜尋網站,如Google 的興起) 。而為了能涵蓋後者的創造需求,也帶 1 / 2 / 3 4 5 動了部落格網站 (如 Blogger ) 、相片網站(如無名小站 ) 、影音網站(如 YouTube ) 等的蓬勃 發展 。以媒體的觀點分析之 ,前者透過特定企業將Web視為大量資訊的媒介 ,提供的站 台延續大眾媒體的角色 。後者藉由Web使用者社群參與 ,創造新式資訊發佈型態,通稱 為社群媒體 。 近來社群媒體所創造的資源吸引很多 學者的注意 ,本文針對部落格或稱網路日誌( 、 Weblog 、Blog)所提供的文本 ,進行語言處理方面的探討。部落格系統提供簡單的介面, 讓使用者發表具時間標記的文章 ,因此有越來越多的人們開始使用部落格在網路上分享 6 每天的生活經驗 、發表對事物的看法與心情。根據部落格搜尋引擎Technorati的報告指 出,全球部落格的數量已超過7,000萬個 ,並且平均每天有超過12萬個部落格成立 ,因此 整個部落格空間 (Blogosphere)每天所能貢獻出的新文本更在此數量之上 。這份報告中同時 也指出 ,目前部落格空間以日文及英文使用者居多,各佔37%及 36% ,而中文目前所佔比 例是 8% ,但有增長的趨勢,本文即以中文部落格文本為主要的研究對象 。 在社群媒體的框架下 ,人們在使用部落格搜尋引擎時,不但想找到較專業或具代表 性的部落格 ,同時也想找到一般使用者所提出的心得及想法 。TREC自 2006年開始舉辦 7 Blog Track (Macdonald, de Rijke, Mishne, and Soboroff, 2006) ,其競賽項目說明了使用者上 述的資訊 需求 。其中Opinion Retrieval Task是針對特定議題找出使用者表達意見的文章 , 並判

文档评论(0)

wangsux + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档