- 1、本文档共15页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
2022年北京高考语文试题及答案--第1页
2022年北京高考语文试题及答案
一、本大题共5小题,共18分。
阅读下面材料,完成1-5题。
材料一
屠呦呦从葛洪的《肘后备急方》中获得了新思路,提取出青蒿素,荣获了诺贝尔生理学或
医学奖。这让世界看到了中国古籍的惊人价值。对于古籍的界定有多种说法,其中较为通行的
是:1911年以前、以中国古代传统文化为主要内容、采用中国传统的著作方式、具有中国传
统装帧形式的书籍。古籍的类型除了大量的汉文古籍,还有丰富的民族文字古籍。
近年来,随着传统文化热的兴起,认识和了解古籍成为一种需求。古籍的价值是多重的。
古籍的载体材料主要包括纸张、织物和墨。这三种材料由于产生或制作的年代不同,具有鲜明
的时代特征,比如元代以前印书主要用麻纸、皮纸,明代以后大量用竹纸,通过载体材料体现
出的文物价值显而易见。浩瀚的古代文献记载着中华民族五千年绵延不断的文明,为了解先人
的政治、文化、制度、风俗等提供了重要的资料。这就是古籍的文献价值。古籍在加工制作过
程中,使用的材料以及制版、印刷中所体现出来的工艺都具有珍贵的艺术价值。人们看到一部
古籍,往往还未翻阅,就已为其精美的外观和典雅的色调所征服。对文献研究者来说,文献价
值是古籍的“皮”,其他价值则是古籍的“毛”,皮之不存,毛将焉附。
据《中国古籍总目》著录,存世古籍总量大约有20万种。其中一些珍贵的古籍具有很高
的文物价值、文献价值和艺术价值。这些珍贵古籍不仅包括全本,还包括具有重要历史文献价
值的残本、散页等。元代及元代以前版印、抄写的古籍已万不存一,流传至今者是我国现存古
籍中最珍贵的文化遗产。这些古籍非常稀有,很多作为文物被珍藏在图书馆,读者很难一睹其
庐山真面目。
材料二
2022年北京高考语文试题及答案--第1页
2022年北京高考语文试题及答案--第2页
古籍的传承性保护是一种新兴的古籍保护理念。以往,古籍保护提倡原生性保护与再生性
保护。原生性保护指保护古籍文物本身,可谓之“存形”;再生性保护指对古籍的影印、缩微
复制和整理出版等,可谓之“移形”。不过,这两种方式主要解决古籍“藏”与“用”的问题,
而古籍的“藏”与“用”长期局限在特定的机构与学者群体中,未能引起普通大众的广泛注意。
传承性保护则是利用各种更易于接受的方式将古籍推向大众,让古籍“活”起来,实现古籍从
“藏”到“用”最后至“活”的飞跃。
人工智能技术的发展为这一飞跃提供了条件。人工智能处理古籍的过程大体包含四步:首
先,将古籍扫描并处理成图像文件。其次,通过光学字符识别技术,将图像文件中的文字识别
为计算机可处理的电子文本。再次,通过自然语言处理技术,对所获取的文本进行基础性加工,
包括自动断句、标点以及词语切分等。最后,识别并抽取文本中的专名(如人名、地名、书名)
等概念与知识,为后续深入的古籍知识挖掘提供基础性支撑。
目前,研究者引入序列标注模型,在计算机自动断句、标点、专名识别等领域都取得了很
好的效果。所谓序列标注,即输入字符串,预测每个字符在该位置的专名属性以及是否在该位
置断句。例如,输入“论语云管氏而知礼孰不知礼”,模型应预测为“(B-BOOK)(E-BO
OK)S(B-PER)(E-PER)OOSOOOO”,其中,“B-BOOK”表示书名开头的字,这里
指“论”;“E-BOOK”表示书名结尾的字,这里指“语”;“S”表示其后应断句的字,这
里对应“云”和第一个“礼”;“B-PER”表示人名开头的字,这里指“管”;“E-PER”表
示人名结尾的字,这里指“氏”;“O”表示不做任何操作。每一个字都对应一个或一组符号。
研究者通过多种机器学习模型,训练计算机自动标注文本序列的能力,进而使其完成自动断句、
标点、专名识别等任务。模型预测的综合准确率均达到90%以上。由此,海量的典籍就可以
转化为数字化、结构化的文本,从而降低普通人阅读古籍的难度,实现互联网环境下古籍的传
承性保护。
2022年北京高考语文试题及答案--第2页
2022年北京高考语文试题及答案--第3页
让古籍“活”起来的尝试还有很多。《典籍里的中国》等节
文档评论(0)