文本和表格信息加工.ppt

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
文本和表格信息加工(一) ——信息的编码 仓颉 楔形文字 往木头里打楔子,上粗下细。这个锤形石柱上整齐刻着的便是古代两河流域的楔形文字。这种楔子形的文字可以上下竖写,也可以左右横写。比起古埃及的图画字,各国古代的象形文字以及中国的甲骨文,它更接近于现代拼音文字。 林语堂和中文打印机 1916年,林语堂就对中文打字机和中文检字产生了很大的兴趣。 1919年商务印书馆制造了中国第一台中文打字机———“舒震东式华文打字机”,由舒震东结合日文打字机的相关技术研制而成。 中文打字机在最初,都有一个容纳常用字的字盘,别的字则按照使用次数的多少放在另外的字盘里,需要的时候由打字员找出来放在常用字盘。使用这样的打字机,必须经过专门训练。 林语堂决定借鉴外文打字机,发明一个更为简单快捷的打字机。 林语堂自己的畅销书,一般都交给赛珍珠夫妇经营的公司来出版。在研制打字机的过程中,资金不够,他曾试图要求公司预支稿费,但是被拒绝。 后来古董商人卢琴斋先生借给他了一笔钱,他又向银行申请了贷款,这才有了自己发明的打字机。 林语堂的打字机一直到1946年5月才完成,高9英寸,宽14英寸,深18英寸,64个键盘取代商务机器的庞大字库,储存7000字。但由于当时中国处于战火中,没有人愿意出资大量生产,他的发明还是没能派上大用场。 CCDOS 1983年,国家计算机工业总局会议把生产IBM PC兼容机定为中国计算机发展的方向。生产IBM兼容PC,硬件厂商没有问题,关键在软件,严援朝接下任务,后为了向专家们证明用软件方案能在IBM PC上显示汉字,严援朝用BASIC写了一个程序,在显示器上画出了一屏“甲”,第二屏显示的全是“田”。严援朝是学摩托罗拉芯片出身,会的是68系列的汇编语言,Intel的汇编指令他从来没接触过,严援朝拿着IBM PC随机带的手册,从头学Intel汇编。6月24日,严援朝正式动手写CCDOS,6月30日写完,一共写了一万多行。CCDOS源代码中,有一句是“6月24日”,别人都不知道是怎么回事,在改进CCDOS的时候都没有删。 王永民与五笔字型 王永民自小就想搞发明创造。时届中年,这个愿望终于在古老的汉字中实现了。20世纪80年代初,面对电脑时代即将来临,如何把汉字输入电脑是当时人们不敢问津的难关,因为这个工作涉及语言文字学、计算机技术、工程心理学等多种学科。于是,王永民这个名字便注定将永远与汉字输入联系在一起了。   王永民和助手们开始把《现代汉语词典》上的1万2千多个汉字逐个分解登记成卡片,然后从几万个统计记录中归并出300多个字根。当时,没有计算机,这项工作全凭手工操作。   但是,要做键盘,首先就得找到一种好的输入方案。此后几年一直在压缩键位这条艰难的道路上跋涉。从138键、90键、75键,直到1980年7月,终于压缩到了62键,重码只有26对。初尝甜头的王永民一发而不可收。1983年春节,王永民和他的伙伴们终于设计出一种能与国际先进水平一比高低的汉字输入方案,这就是“五笔字型”汉字输入法。同年2月29日,“五笔字型”作为一项重大发明通过省级鉴定,专家评估其输入速度达到了世界最高水平。 实践 阅读《五笔字根表口决》,小组合作,讨论并打下下面一段话: 福州第一中学 ASCII 之父——Bob Bemer 在ASCII出现之前,不同的计算机之间无法相互通信。每家制造商都使用自己的方式来表示字母、数字和控制码。那时,在计算机中表示字符的方式就有60多种,更可笑的是,IBM的设备中就使用了9种不同的字符集。电脑之间的相互对话都无法完成,更别说与外界对话了。 1961年5月,Bemer向美国国家标准研究所(ANSI)递交了一份关于制定通用计算机代码的建议。于是,代表着当时大多数计算机制造商的X3.4委员会得以建立并投入工作。 隶属ANSI的这家委员会花了两年多的时间就通用代码达成了一致意见。 实践 试对照ASCII 表写出英语 I’m sorry! 存储到计算机时是如何存储的。 字节 ASCII虽然用7位二进制组合表示英文字符,但实际存储时,最高位均要补0,以补足8位。 I’m sorry! GB2312 GB2312或GB2312-80是一个简体中文字符集的中国国家标准,全称为《信息交换用汉字编码字符集--基本集》,由中国国家标准总局发布,1981年5月1日实施。GB2312编码通行于大陆;新加坡等地也采用此编码。几乎所有的中文系统和国际化的软件都支持GB2312。 GB2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时,GB2312收录了包括拉丁字母、希腊字母、日文平假名

文档评论(0)

wuyoujun92 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档