big5
大五码(Big5),又称为大五码或者五大码,是通行于台湾、香港地区的一个繁体字编码方案。大五码是使用繁体中文社群中最常用的电脑汉字字符集标准,共收录13,060个中文字,其中有二字为重覆编码,2003年,Big5被收录到台湾官方标准的附录当中,取得了较正式的地位。这个最新版本被称为Big5-2003。
基本信息
- 中文名
大五码
- 外文名
Big5
产生背景
朱邦复
在Big5码诞生后,大部分台湾的电脑软件都使用了Big5码,加上后来倚天中文系统的高度普及,使后来的微软Windows 3.x等亦予以采用。虽然后来台湾还有各种想要取代Big5码,像是倚天中文系统所推行的倚天码、台湾地区中文电脑公会所推动的公会码等,但是由于Big5字码已沿用多年,因此在习惯不易改变的情况下,始终无法成为主流字码。而台湾以后发展的“国家标准中文交换码”(CNS 11643)由于先天所限,必须使用3字节来表示一个汉字,与现行英语软件欠缺相容,所以普及率远远不及Big5码。
发展沿革
初创
“ 五大码”(Big5)是在1984年由台湾13家厂商与台湾地区 财团法人 信息工业策进会为五大中文套装软件( 宏碁、神通、 佳佳、零壹、大众)所设计的中文内码,所以就称为Big5中文内码,虽然五大套装软件并没有成功,但Big5码却深远地影响中文电脑内码,直至今日。“五大码”的英文名称“Big5”后来被人按英文字序译回中文,以致现在有“五大码”和“ 大五码”两个中文名称。
Big5码的产生,是因为当时台湾不同厂商各自推出不同的编码,如IBM 5550、王安码等,彼此不能兼容;另一方面,台湾当时尚未推出官方的汉字编码,而中国内地所推行的GB 2312编码,亦未有收录繁体字。同时,这个计划对于以台湾为核心的亚洲汉字圈也产生了久远的影响。
发展
操作系统和应用程式(如苹果电脑 Mac OS X 和以 Cocoa API 撰写之程式、Microsoft Windows 2000及之后版本、Microsoft Office 2000及之后版本、Mozilla浏览器、Internet Explorer浏览器、Java 语言等等),已改用Unicode编码。可惜现时仍有一些旧的软件(如VisualBasic 6、部分Telnet或BBS软件),未能支援Unicode编码,故相信Big5缺字的问题仍会困扰用户一段时间,直至所有程式都能改用Unicode为止。
注释:大五码普遍被认为包含13,053字,但在计算0xA259-0xA261的度量衡单位用字 (兙兛兞兝兡兣嗧瓩糎) ,再减去重收了两次的“兀”(0xC94A)和“嗀”(0xDDFC)后,应为13,060字。
应用延伸
20世纪90年代 转码
Big5延伸
非官方Big5延伸
由于Big5码内的万多个字,只是根据台湾地区“教育部”颁布的《常用国字标准字体表》、《次常用国字标准字体表》等用字汇编而成,并没有考虑社会上流通的人名、地名用字、方言用字、化学及生物专业等用字,亦没有放入日语平假名及片假名字母。所以在市面上支援Big5码的软件,有不少都自行在原本的编码外,添加一些符号及用字。
倚天Big5延伸
在倚天中文系统中,为与IBM5550码相容,他们在Big5码添加了以下的字符:
● 在0xA3C0-0xA3E0,添加了33个控制字符的图象。
● 罕用符号区。在0xC6A1-0xC875,添加了圆形1-10、括号1-10、小罗马字i-ix等章节符号、一些部首及笔划结构,日语平假名、片假名及俄语使用的西里尔字母。