风华居 > 都市言情 > 重生科技狂人 > 第0239章 推行汉字编码统一标准

第0239章 推行汉字编码统一标准(3 / 4)

关联的概念,即内码、交换码、外码。

内码,是存在于计算机存储器上的序号编码,供CPU、程序以及开发者使用。

就好像现在美国那边百家争鸣、各式各样的个人电脑一样,每个厂商都可以弄一套自己独有的硬件架构,内码也是如此。

不难想象,在IBM象棋计划的工程师们眼里,管你是字母还是汉字,统统都是一个抽象的序号编码。

尤其是受限于现在存储器的容量,各个厂商更有理由设计自己认为合理的编码方案。

原本时空里的技术成熟阶段,英文系统中的内码为ASCII,繁体中文系统中常用的内码为big5,简体中文系统中的内码则为国标码,最后都逐渐统一采用Unicode。

因为不同的系统有可能使用不同的内码。所以在彼此之间交换文件的时候,会发生乱码现象。

解决方法就是交换文件之前,文件提供者先将由内码形式储存的文件,转换成交换码形式后再做交换。文件接收者在接收文件后,再由交换码转成内码。

同样,交换码主要面对的使用者,是CPU、程序以及开发人员。

而外码面对的使用者,则是非技术专业的普通用户,比如拼音码、注音码等各种中文输入法。

像英语这样的表音文字,只有26个字母,处理起来相对简单,内码、交换码、外码三者相同即可;但像汉字这样的表语文字就不行了,光是常用字就有好几千,外码方面,没有键盘能够容纳得下,内码方面也需要考虑存储器容量的问题,这就客观上给汉字的信息化带来了难度。

此外,信息化编码是非常考验技巧的,说是一门艺术也不为过。

比如阿拉伯数字“0”到“9”的序号编码为48到57,对应的十六进制数字是30到39,只需一步简单的逻辑操作,就可以在序号编码和真实数字之间相互转换。

再如英文大写字母“A”的序号编码为97,小写字母“a”的序号编码为65,相减的差是32,所有大小写字母都是这个差距,这并非偶然,同样只需一步简单的逻辑操作,就可以在大小写之间方便转换。

繁体中文当中的异形字,也有类似英文大小写来回转换的需求,但异形字数目往往并非只有两个那么简单。

显然,汉字信息化编码除了技巧之外,还要考虑到中华文化自身的特性。

以前,朱邦复的研究是内码、外码一起抓,对于非技术人士来讲,显然难度太高,而在唐焕介入后,直接让其把精力放在交换码和外码上,按照中华文化的特色来组织繁体字异形字和设计输入法,这才是他的强项。

由于简体字的相对规范,倪光南则被分配了硬件和外码的工作,还有就是字形码,也就是如何在显示器和打印机上显示出来,即常说的字库和字体。

其实现方式分为两种:点阵式和矢量式,前者用0和1的二进制数组代表屏幕上的每一个像素点,简单好用,但消耗大量存储器空间;后者采用数学计算公式,节省存储器空间,但消耗CPU资源。

所以,汉字的信息化是一个庞大的工程,不是拉低智商地上嘴皮一碰下嘴皮,就能贪天之功的。

哲儒的汉卡以及配套软件,从推出到现在,经过了一年左右的时间,才从比较成熟走向非常成熟。

这还只是单纯的技术问题,在现实当中,还会牵扯到巨大的经济纷争,甚至微妙的政_治博弈。

在香江这个放任自流的地方,凭借没有对手的一代方圆电脑所达到的市场占有率,已经形成了事实上的行业标准,但万一来了强大的竞争者,其也不是没

最新小说: 这个导演没有格局 学霸从迎娶女教授开始 四合院:小厨子的幸福生活 斗罗:武魂乌鸦,执掌生死 韩城:我与未来有扇门 斗罗:我的魂技能自选 斗罗:缔造高武从被女神膜拜开始 你不准玩宝可梦! 路明非,不卷你屠什么龙! 战锤:孝出强大