- 1、本文档共12页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
南京大学
汉语中介语口语语料库
建设概况
南京大学 程爱民
CHENG AIMIN,NANJING UNIVERSITY
CONTENTS
• 一、建设背景
• 二、建设理念
• 三、建设目标
• 四、建设现状
• 五、数据库主要功能 (征求意见中)
一、建设背景
近年来,汉语中介语语料库在语言教学和研究中所起的作用日
益受到学界的重视,汉语中介语语料库建设有了较快发展。
目前国内已有多家高校建成了一定规模的汉语中介语语料库,
不但为汉语教学和研究提供了丰富的语料,也为语料库的建
设积累了宝贵的经验。
但从目前已建成的语料库来看,基本上都属于共时笔语语料库,
即采集的语料为学习者的横向书面写作语料,相比较而言,
口语的和纵向的语料仍十分缺乏。而近年来对留学生的口语
能力表现、语音语调学习难点分析、习得习惯、语音或语流
发展等方面的研究越来越多,而基于口语语料的实证研究能
较好地满足这方面的教学和研究需求。
二、建设理念
基本理念:建设一个多母语背景的、可展示汉语多维动态发
展的汉语中介语口语语料库。
1、就人类语言的发展进程来说,书面语的出现远比口语要
晚。从儿童语言的个体发展进程来看,也是先学会口语,
后学习书面语。因此就语言的本质来说,口语是第一性的。
口语和书面语作为两种不同的交际方式,服务于不同的交
际目的,两者各有自己的特点,不可能互相取代。自然口
语中除了字、词、句以外,还包括韵律和语调、说话者边
想边说的种种措辞的心理表征以及语法和语用的标记。我
们打算建立音文同步的口语语料库。
2、二语习得是一个动态的发展过程,学习者并非从目的语规则
的“零知识”突然跳跃到对规则的完美习得,而是要通过一系
列的发展过渡阶段才能到达彼岸。通过收集纵向追踪语料,可
以对二语学习者获得第二语言能力的渐进过程做出准确的描述,
研究贯穿整个学习过程的二语发展步骤和模式,可以帮助我们
认识二语习得规律,在规划和实施二语教学活动时,把握二语
发展中的关键转变点或临界点。因此,对于研究汉语二语习得
过程,既需要截面数据,也需要纵向数据,纵向追踪语料库起
着共时语料库难以替代的作用。我们收集的语料基本上是具有
可比性的纵向发展语料。
3、汉语中介语系统的发展是一个使用准确度、表达流利度、结
构复杂度和类型变化度等多方面协同发展的过程,一个熟练的
说话者能够采用复杂的结构、丰富的词汇和格式流利准确地运
用语言。我们将对语料进行语言特征的多维标注。
三、建设目标
• 建设一个多母语背景的、可展示汉语多维
动态发展的汉语中介语口语语料库。
• 实现音文分开或音文同步在线检索
四、建设现状
一、已完成第一阶段语料收集工作
1. 上述语料的文字转写工作大部分已经完成,已经转写了
400多个小时,约200万字的语料;
2. 声调韵律的分析和显示工具已初步研制成功。
南京大学汉语中介语口语语料库
已收集的数据主要有以下几种类型
(1)外国学生独白式的口语语料:每学期两次以专门话题
为任务,在语音实验室统一由计算机集体采集的个人口语
测试语料,共300人,约300个小时的录音语料。
(2 )汉语母语者与外国学生的对话语料:对外国留学生进
行为期半年到1 年的自然谈话高密度跟踪录音语料,由语
料采集者与外国学生模仿OPI的方式进行自然对话,采集
20多名外国学生,约300 多个小时的多波跟踪录音语料。
(3)外国学生之间的对话语料:外国学生与外国学生在自
然环境下的谈话语料,采集了30多名外国学生之间,共约
100多个小时的自然谈话语料。
(4)学习者背景信息数据:包括学生的性别、年龄、国籍、
母语背景、汉语学习经历、汉语水平等。
(5)学习者其他方面的关联数据:已收集了口语语料库中
部分学习者的学习策略、学习焦虑、纠错反馈信念等方面
文档评论(0)