网站大量收购闲置独家精品文档,联系QQ:2885784924

“大数据时代”的自动化新闻写作的历史、实践与未来.docVIP

“大数据时代”的自动化新闻写作的历史、实践与未来.doc

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
“大数据时代”的自动化新闻写作的历史、实践与未来   【摘要】大数据时代已经到来,而大数据的一个显著特点,就是分析的对象正在从结构化数据向半结构化数据、非结构化数据转变。这正和新闻文本的特点相契合,因此,大数据中文本挖掘、情感分析的相关方法必将在新闻业中发挥重要作用。   【关键词】自动化生成新闻;机器人新闻写作;计算新闻   每天股市收盘时,许多投资者的手机上都会收到一条行情软件的推送消息“今日股市开盘XXXX点,收盘XXXX点,最高XXXX点,最低XXXX点……”。写这样一条消息不难,然而,每天下午3点收盘,最迟3:01这条信息就需要完成推送,如果靠人力写作,显然是一项非常枯燥乏味的工作,但如果依靠机器自动化写作,这就是一条最简单的自动化生成新闻。除了收盘时的简报,也有软件可以提供更加详细的市场资讯,来自于自动化写作的这样一条新闻,可以涉及很多名词:数据(驱动)新闻、计算新闻、程序新闻、算法新闻、机器人报告、自动化新闻,而这些术语都与数据和计算机的使用直接相关,更确切地说,与当下这样的大数据时代直接相关。   大数据时代已经到来,而大数据的一个显著特点,就是分析的对象正在从结构化数据向半结构化数据、非结构化数据转变。这正和新闻文本的特点相契合,因此,大数据中文本挖掘、情感分析的相关方法必将在新闻业中发挥重要作用。   文本挖掘分析的是包含在自然语言文本中的数据,它可以帮助一个组织从基于文本的内容中获得有价值的潜在业务洞察力。例如文档、邮件和社交媒体中发布的帖子。在某种意义上,它被定义为从无处不在的文本中发现知识的方式,而且通常这些文本可以在网络上直接获取。而文本挖掘中的情感分析更是为新闻自动化写作打下了很好的基础。情感分析是指使用自然语言处理、文本分析和计算语言学确定一段文本的作者对某一特定主体的态度,它可以帮助确定文本表达的态度是积极的、消极的还是中立的,情感分析现在经常用于发现消费者对特定主题、产品或想法的感受。在未来,它们可能帮助新闻从业人员发现社交媒体上流行的热点事件,收集事件的情报;可能发现受众的情绪所在,从而抓住他们的兴趣;还可能帮助机器自动生成的新闻变得更加平易近人,而不仅仅是冷冰冰的客观陈述。大数据的方法越来越多地渗入各个领域和各个行业中,潜移默化地改变它们。   新闻业确实正在发生改变,从计算机辅助报道到数据新闻,再到自动化新闻写作,这种术语的变化体现了一个事实,计算机和数据正在逐渐成为关系中的主体。这种变化不仅是由新技术驱动,而且结合了更广泛的背景。“大数据”仍然是一个相对较新的概念,人类正身处数据洪流之中,产生了两种深刻的发展。[1]第一是由于人类(和自然)活动产生的关于人类(和自然)活动的数字化信息的种类和数量都非常多,通过移动设备、跟踪工具、传感器以及便宜的计算存储等来记录这些信息也日益普及。“在一个数字化的世界里,消费者每天的活动――沟通、浏览、购买、分享、有哪些信誉好的足球投注网站――创造了他们自己巨大的数据流量”[2]。第二个主要发展涉及计算过程、机器学习、算法和数据科学的快速进步和扩散。这些?l展使得公司、政府和研究人员更容易地分析公共生活中的数据。无论是称为大数据还是别的什么,这一时刻都是数据中的一部分,它的收集分析和展现,以及相关数据驱动技术的应用,都对理解媒体、技术和社会的交叉点产生了极大的共鸣。   这种深刻的发展让我们认识到,日常生活的数据化有助于我们理解世界上发生了什么,从而做出更好的决定。重要的是,这种理解不是来自人类社会创造的理论或者假设检验,而是计算机处理大数据所揭示的相关性。   这种深刻的发展也使得新闻生产和分发中的重要方面发生着变化。可以看到的是,在新闻业大规模数据集及它们的收集、分析和解释对于从数字化信息中获取价值和意义变得越来越重要,也成为一种趋势。大数据和数据新闻越来越多地被作为一种思维方式来理解,它体现了我们如何思考人类主题以及探索作为对象的世界的能力。   一、数据导向的新闻业发展   在新闻中使用计算机和数据是一个沿革的过程,精确新闻、计算机辅助报道、数据新闻、数据库新闻、数据驱动新闻和计算新闻,乃至自动化新闻写作,它们的共同点都是计算机导向的方法,并且对从业人员来说,需要更多高级的计算机技能。但是本质上,精确新闻强调使用科学方法,计算机辅助报道强调数字化工具的使用,数据库新闻强调信息存储和检索的结构,数据和数据驱动的新闻强调在数据集中找到故事,而计算新闻强调在工具和方法应用中融合计算和新闻价值。(数据导向的新闻生产模式见表1)   [表1 数据导向的新闻生产模式[3]][\精确新闻\计算机辅助报道\数据新闻\数据驱动新闻\计算新闻\焦点\新闻的科学性\利用计算机技术报道新闻\在新闻中发现、分析和展示数据\跟随“数据线索”追踪未知或推测的故事\创造、适应

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档