网站大量收购独家精品文档,联系QQ:2885784924

出版业大数据建设与应用的关键问题.doc

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
出版业大数据建设与应用的关键问题

出版业大数据建设与应用的关键问题   大数据时代,我们周围的世界发生着看不见但影响巨大的转变。最近这些年,大数据告诉我们很多非常有意思的事情。在这股浪潮的席卷之下,激发了新闻出版业对大数据的关注与探索 一、出版业发展大数据:先了解,再应用 出版业的数据每时每刻都在产生,然而出版领域究竟包括哪些数据?如何采集?不同的数据又指向何种应用?这些问题的解决是出版业大数据建设与应用的关键 1.出版业有哪些数据 从数据产生的业务来源看,有出版社数据、发行单位数据、图书馆数据、技术服务类数据等;从数据结构化的程度看,出版产品数据等结构化数据较少,图片、文档、视频等非结构化数据比重较大;从数据产生的环节看,包括过程性数据(如销售条件、库存)和结果性数据(如畅销排行等);从数据的所有权看,还可分为甲方数据(数据生产者的原生数据)、乙方数据(技术服务的沉淀数据)以及第三方数据(通过网络爬虫等手段获取) 2.通过结构模型走近大数据 为了更清晰地认识出版业大数据的面貌,国家新闻出版广电总局数字出版司对出版业的大数据进行模型构建,整体上可以分为五个层面(如图1所示):由内而外分别是核心层、产品层、业务层、市场层和用户层。核心层即出版生产过程中产生的各种内容资源数据;产品层是指产品信息的基础数据,目前以书目信息为主;业务层是指出版产品流通的数据,记录着整个出版业务运行状态的信息;市场层和用户层分别包括产品消费数据和消费反馈数据,记录了广大用户的行为数据和评价信息。这种划分从宏观层面可以更好地理解出版业大数据的发展整体状况,对制定大数据扶持政策、推动大数据发展具有积极的作用 不同层的出版数据的主要采集与生成方式、应用场景也有所不同。数据的采集难度相应由内而外逐步增加,尤其是针对用户层的数据采集最为复杂多变 核心层:总量巨大,形态多样,且大都属于非结构化数据。核心资源数据的采集可通过系统加工的方式,最终形成知识服务体系,构成出版业大数据的基础 产品层:按照统一的数据交换标准,通过系统间的数据交换实现产品基础数据的采集与更新。产品层数据属于高度结构化的基础数据,某些用于政府监管和行业公益性服务的基础数据可通过定期的人工采集方式实现国家规定的基础数据逐级上报要求 业务层:采集方式大都以系统记录为主。随着产业链各业务系统之间的互联互通,未来业务层的系统设计将更趋于一体化的解决方案,全面的掌控各业务运行情况,打造高效管理的大数据监控环境 市场层与用户层:出版业用户行为有很多种,包括出版社、图书馆、书店、政府、研究机构、学校、个人等,其中个人用户的行为数据在所有行为数据中将占主导地位。目前个人读者的数据采集大都采用阅读器、销售平台、社交媒体、读者数据库、门店采集等方式,但效果不尽理想。出版业历经数字化转型升级的洗礼,很大程度上依然还是一个需要依靠直觉的产业。随着技术的发展,市场层与用户层的行为数据采集手段将会更加成熟和稳定 二、大数据现状:起点低,基础薄弱 国务院印发的《促进大数据发展行动纲要》对促进出版业大数据工作发展具有重要的推进意义。总局围绕着出版业大数据工作提出了构建新闻出版业数据体系的工作思路,并围绕着数据建设工作采取了一系列的工作部署,如国家知识服务体系建设、CNONIX应用示范工程等。各出版发行单位也积极拿出应对措施,投入到大数据建设工作中,但从整体看呈现出跳跃式的特点,基础准备不足 1.数据体量方面:出版业大数据“天花板”较低。相对于金融、制造等行业,出版业数据应用体量不足。虽然每年几十万个品种进入市场,在出版社、中盘、书店、物流、图书馆以及电商等都形成了大量的数据,但是品种繁多的同时,单品销售数据量小,重复消费数据低,替代性极弱,因此未能达到大数据级别,造成了出版业大数据的规模实践受到一定程度的制约 2.数据思维方面:大数据的思维对产业链各个环节的渗透影响还不足。如出版环节的传统运作思维逻辑导致对内容资源形成大数据应用的观念转变不够,尤其是专业出版领域内构建知识服务体系的理念有待进一步加强;市场流通环节存在着数据不透明、数据孤岛、数据真实性堪忧等诸多问题,造成数据采集和加工的质量效益低下;用户行为数据获取较难,数据决策短期内难以替代经验式决策 3.数据实践方面:出版业大数据发展实践多以项目为主,普遍实施基础较弱。近两年,参与大数据工作的出版发行单位越来越多,从申报财政部项目的种类看,从数字化转型升级、电商平台建设、O2O工程、智慧物流到数据交换中心建设等,均与大数据应用有着千丝万缕的联系。虽然企业对大数据工作的认知有了较大幅度提升,但深度普遍有限,大数据工作还只是单纯围绕项目做文章。姑且不说应用,许多单位连基础性的数据准备和管理工作都没有做充分,因此行业普遍应用大数据的基础较弱

文档评论(0)

linsspace + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档