信息技术藏文编码字符集扩充集A.docx

信息技术藏文编码字符集扩充集A.docx

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

?

?

信息技术藏文编码字符集扩充集A

?

?

扎西

一、背景

1997年,我国的藏文小字符集(基本字符集,简称基本集)被收入了国际标准ISO/IE10646《信息技术通用多八位编码字符集》(对应的我国国家标准编号为GB13000)。同年,我国发布了国家标准GB/T16959-1997《信息技术信息交换用藏文编码字符集基本集》。

由于藏文本身的书写特点和现阶段我国技术水平的限制,仅靠藏文基本集,难以彻底解决藏文信息处理和交换问题。为此,我国专家于2002年向国际标准化组织提交了藏文编码字符集扩充集提案(“大丁”字符集,本标准草案的前身和技术基础),由于非技术原因,该提案未被采纳。但我国的藏文信息化建设却不能因此而停顿,因此,国家标准化管理委员会于2002年底下达了制定藏文编码字符集扩充集的任务。

二、藏文编码国家标准制定的原则

以2004年04月13日藏文编码标准编制工作组第一次会议(北京,电子工业标准化研究所)和2004年6月藏文编码工作组第二次会议(拉萨,拉萨饭店)纪要的内容为准,结合2003年12月成都会议的决议,确定了藏文编码国家标准制定的指导纲要,即“在国际标准框架下制定藏文大字符集编码国家标准,定义垂直预组合的藏文字符,应作为我国藏文信息处理发展的策略;同时,不排斥小字符集的技术方案,并积极跟踪研究动态组合技术”。

三、藏文大中小字符集及字汇定义

基本藏文字符集(Basicset):已经在0F00-0FCF编码的全部藏文字符(又称小字符集,共有195个编码字符和15个未用的编码位置)。所收集的字符及各种用符号分别由“非组合字符”和“组合字符”組成。

扩充字符集A(ExtensionsetA):由基本字符纵向叠加而成的结构稳定的藏文字符和最常用梵音转写字符的集合。

四、扩充字符集A的字符确定依据

1.扩充字符集A共有1536个垂直预组合字符。

2.现代藏文(三次规范后的藏文书写形式)、古藏文(规范之前藏文书写形式)和已成为藏文部分的梵音转写藏文字符,共962个字符。

3.最常用梵音转写藏文字符574个。以西藏收集的大字符集、藏学中心提供的出现频率高的梵音转写藏文字符和其它佛教经典中出现的常用梵音转写藏文字符为主要依据,同时参考了青海师大、西北民大提供的字频统计,确定了574个最常用梵音转写藏文字符。

五、与我国有关的现行法律、法规和相关强制性标准的关系

1.藏文扩充集A与GB/T16959-1997(藏文基本集)的关系

扩充集A是基本集的扩充集;

扩充集A和基本集能表示和交换以现代藏文为载体的所有信息,满足现代藏文信息处理的需要。

2.藏文扩充集A与GB13000的关系

GB13000规定了通用多八位编码字符集(UCS)。它可用于世界上各种语言(文字)的书面形式以及附加符号进行表示、传输、交换、处理、存储、输入及显现。

本标准的编码字符集与GB13000的多八位基本多文种平面的形式一致。适用于藏文的书面形式的表示、传输、交换、处理、存储、输入及显现。

?

-全文完-

文档评论(0)

183****1225 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档