UCS-2UCS-4中文字符编码TTF字库之间的关系.docx

UCS-2UCS-4中文字符编码TTF字库之间的关系.docx

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

字体和字符编码的关系

Sunny.Man

一、大事的起因

“回车键“?”这个标记怎么样才能显示在文本框内?”一个哥们在群里问。我把这个符号复制到WORD里,然后按“ALT+X”看到了它的UNICODE码,然后告知那哥们这个符号的Unicode码是0x21B5。顺手我把它复制到了我正翻开的UE文件里时,它竟然变成了一个”?”,马上查看它的十六进制码也变成了0x3F。为什么会有这个变化?我又把它复制到了WINDOWS的记事本里,记事本里却显示的好好的”?”。我想更清楚的看一下是不是这个符号,我点击字体,然后选择了“宋体”,并设置了初号。结果更是另我大跌眼镜,竟然变成了一个“”。为什么呢。心中似乎有答案,但又不能完全说明白。还好我有度娘,按着我心里的思路咱一路百度,最终我得到了我认为合理的解释,由于具体的是不是这么回事,我没验证过。所以大家仅供参考。再弄懂这些乱七八遭的事前,先复习了一下相关概念。

二、字符的编码

什么是字符集

字符(Character)是文字与符号的总称,包括文字、图形符号、数学符号等。“*“是一个字符“?”也是一个字符。

一组抽象字符的集合就是字符集(Charset)。字符集常常和一种具体的语言文

字对应起来,该文字中的全部字符或者大局部常用字符就构成了该文字的字符集,比方英文字符集。一组有共同特征的字符也可以组成字符集,比方繁体汉字字符集、日文汉字字符集。字符集的子集也是字符集。

字符编码

计算机只能处理0和1,假设计算机要处理各种字符就需要将字符和二进制内码对应起来,这种对应关系就是字符编码(Encoding)。制定编码首先要确定字符集,并将字符集内的字符排序,然后和二进制数字对应起来。依据字符集内字符的多少,会确定用几个字节来编码。每种编码都限定了一个明确的字符集合,叫做被编码过的字符集(CodedCharacterSet),这是字符集的另外一个含义。通常所说的字符集大多是这个含义。说得通俗些就是0和1只能表示两个字符,为了表示人类使用的字符,就把它们编成一个个的二进制串,每个串表示一个字符。假设你是制度的创立者你完全可以规定,0000001就是”a”,而不用使用1100001(97)这个串.惋惜你不是计算的的编码制造者,所以得随大家一起用人家编好的。固然了这其中的编码都是科学合理的,也不是随心所欲的。

常见字符集

3.1ASCII:

AmericanStandardCodeforInformationInterchange,美国信息交换标准码。目前计算机中用得最广泛的字符集及其编码,由美国国家标准局(ANSI)制定。它已被国际标准化组织(ISO)定为国际标准,称为ISO646标准。ASCII字符集由掌握字符和图形字符组成。在计算机的存储单元中,一个ASCII码值

占一个字节(8个二进制位),其最高位(b7)用作奇偶校验位。所谓奇偶校验,是指在代码传送过程中用来检验是否消灭错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节中1的个数必需是奇数,假设非奇数,则在最高位b7添1。偶校验规定:正确的代码一个字节中1的个数必需是偶数,假设非偶数,则在最高位b7添1。下表就是ASCII编码表:

ASCII值

掌握字符

ASCII值

掌握字符

ASCII值

掌握字符

ASCII值

掌握字符

0

NUT

32

(space)

64

@

96

1

SOH

33

65

A

97

a

2

STX

34

66

B

98

b

3

ETX

35

#

67

C

99

c

4

EOT

36

$

68

D

100

d

5

ENQ

37

%

69

E

101

e

6

ACK

38

70

F

102

f

7

BEL

39

,

71

G

103

g

8

BS

40

(

72

H

104

h

9

HT

41

)

73

I

105

i

10

LF

42

*

74

J

106

j

11

VT

43

+

75

K

107

k

12

FF

44

,

76

L

108

l

13

CR

45

-

77

M

109

m

14

SO

46

.

78

N

110

n

15

SI

47

/

79

O

111

o

16

DLE

48

0

80

P

112

p

17

DCI

49

1

81

Q

113

q

18

DC2

50

2

82

R

114

r

19

DC3

51

3

83

X

115

s

20

DC4

52

4

84

T

116

t

21

NAK

53

5

85

U

117

u

22

SYN

54

6

86

V

118

v

23

TB

55

7

87

W

119

w

24

CAN

56

8

88

X

1

文档评论(0)

159****2579 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档