- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
?
?
基于内容的英语录音教材标注研究与应用
?
?
闵捷钟岑岑沙沙
摘要:英语录音教材在数量和种类上的飞速发展对其有效管理与利用提出了新的挑战,此时传统的人工标注和组织方式已不能满足数字出版以及教育信息化的需要。文章基于音频信号处理、机器学习等信息技术,提出基于内容的英语录音教材标注,运用自动与人工相结合的处理方法,从多层次、可扩展等角度构建描述录音内容的内容表征模型,并在教育信息化环境中探索该模型及标注框架的应用方式,以期为未来录音教材的建设和管理乃至数字化教育出版物的加工与发布提供参考。
关键词:英语录音教材;内容标注;关键词检出;文本分类;数字教育出版
:G434文献标志码:A:1673-8454(2016)04-00089-04
一、引言
在我国,录音教材是教科书体系中的重要组成部分[1],是纸质教科书中精选内容的音频化,在我国英语、语文、音乐等学科的教学中得到了广泛的应用,迄今已有五十余年的历史。尤其是对英语这一外语类学科的教学,录音教材以其规范的语言表达和内容质量,为教师提供了便捷的辅助工具,为学生创建了良好的听觉情境,对于听说读写等外语学习基本技能特别是听的培养和达成,起到了重要作用。
英语录音教材的产生经过了素材录制、内容编辑、技术加工等音像出版的主要环节[2],在此过程中,录音教材的编辑开发单位积累了大量的资源。最近三十年来,从教科书中的课文同步朗读到教辅中的听力测试,各类英语录音教材的总数量巨大、内容多样,如何对这些资源进行科学、高效的组织和管理,对于录音教材的编制与应用、数字化教育资源的开发和建设具有重要意义。长久以来,英语录音教材的管理主要是以录音磁带、光盘等载体为依托,将播音人员、出版单位、时长、主要内容等信息采用卡片形式通过手工来建立文本索引。然而,在数字技术飞速发展的今天,这种传统的基于人工的资源标注方式却变得日益局限。一方面,面对海量的录音教材,人工处理不仅耗时费力,而且易受疲劳、差错等人为因素影响。另一方面,目前的人工处理大多是对一些客观属性进行标引,而在智慧学习环境,更需要的是基于各种教学功能、内容语义和语音特征等信息为教师或学生提供个性化服务,现有的属性标引方式难以满足实际需求。
在这种情况下,本文基于音频信号处理、机器学习等信息技术,提出基于内容的英语录音教材标注方案,以期在尽量少的人工干预下,自动给出大量未知英语录音教材的多层级内容标签,并从教育信息化环境下的数字教材建设和录音教材数据库应用的角度尝试探索,从而为未来录音教材乃至数字化教育资源的建设和管理提供参考。
二、英语录音教材的内容描述
英语录音教材是将一定的教材内容以音频形式进行呈现的课程资源。相对于纸质教科书的文本形态,录音教材通过播音人员的演绎、背景音(乐)的插入、音频技术的处理等手段,试图营造出生动、真实的听觉环境,给人以亲近感,从而促进教师教学效果的提高、学生英语综合语言运用能力的培养。
从本质上看,英语录音教材仍归属为音频资源:作为一种重要的多媒体信息传播媒质,在人耳所能听见的频率范围内包括语音、音乐、环境音等类型。对于这些音频的内容,可以用反映其声学特点和人类听觉感受的低层特征以及贴近用户理解的语义特征来描述。
然而,不同于一般音频数据,英语录音教材面向教学的特殊地位决定了其语音部分是实现语言教学的重点。无论是内容的选择与录制还是素材的处理与集成,均围绕教学目标和教学内容进行。作为英语录音教材内容中的主体,录音教材的语音部分具有一定的规律性,从形式上看包括单词、语句、对话等基本单元,在不同的学段偏重不同;从语言内容上看,在传递词句等语言表层含义的同时,还隐含了主题、话题等高层语义信息,例如,与《义务教育课程标准实验教科书英语(新目标)七年级上》配套的录音教材中,就大体包括姓名、足球、晴朗等关键词,并涵盖天气、运动、生日、交际等主题。
基于以上分析可知,英语录音教材的内容描述主要体现在以语言为主的语义层面,也就是说,对于一个基本单元,可以分别用关键词和主题两个层级的内容来表示语言低层和高层语义的信息。以此为基础,还可再辅以提示音类别、间奏音乐类型等其他信息,由此构建出的更为丰富的基于不同层级的内容表征模型(见图1),就可用于描述英语录音教材的内容。
三、基于内容的英语录音教材标注方案
基于内容的英语录音教材标注的目的在于,自动得到大量未标注英语录音教材(未知数据)的基于内容表征模型的标注结果(多层级内容标签),并以此作为接口用于实现资源管理以及后端的具体应用,在此过程中允许管理人员或用户进行人工干预,通过修正学习模型来提高标注性能(见图2)。
基于内容的英语录音教材标注本质上是一个机器学习问题,它借助于已准确标记的训练数据来构建学习模型,再以此为依据建立起未知数据与内容标签之间的映射关系。作
您可能关注的文档
- 基于大数据的电力营销管理创新分析-1.docx
- 基于大工程理念的工程实践教学改革探索.docx
- 基于土木工程建筑结构设计的优化分析.docx
- 基于历史自然灾害研究的不可移动文物自然灾害风险管理与预防思考.docx
- 基于信息技术的小学英语教学模式探究.docx
- 基于信息化教学在汽车检测与维修一体化教学改革中的应用价值研究.docx
- 基于互联网金融的商业银行竞争策略研究.docx
- 基于互联网+背景下的在线自主学习能力培养探讨.docx
- 中药化学全套教学课件.pptx
- 《无人机测绘技术》全套教学课件.pptx
- 2024精简护肤洁面趋势报告-TMIC-30正式版.doc
- 2024捕捉华夏民族珍味-咸味主食与咸味零食创新机遇报告-25正式版.doc
- 2024年秋季部编版小学道德与法治二年级上册全册课件PPT必威体育精装版.pptx
- 部编版第十一册第四单元拓展提高教学课件.ppt
- 2024年秋季新西师大版一年级上册数学全册教学课件(新版教材).pptx
- 2024年秋新人教版一年级上册数学全册教学课件(新版教材).pptx
- 2024年秋季新人教版数学一年级上册全册教学课件(新版教材).pptx
- 2024年秋季新人教版数学一年级上册全册课件(新版教材).pptx
- 2024年秋季新人教版一年级上册数学全册教学课件(新版教材).pptx
- 2024年秋季新人教版一年级上册数学全册课件(新版教材).pptx
文档评论(0)