科技典故
 
 
獨霸編碼,笑傲江湖──ASCII與Unicode間的分分合合
為了整合電子位元資訊交換的共同標準,統一全球各國分歧殊異的文字符號,獨霸全球字元編碼標準,ASCII與Unicode的分分合合就此展開........
1960年代初期,美國國會圖書館(Library of Congress;LC)籌畫研擬自動編目格式,James Agenboard等人為此開始制訂英文的字元集與交換碼,作為圖書館界書目交換的共同標準。LC交換碼遂成為美國資訊交換標準碼ASCII(American Standard Code for Information Interchange)的雛形。 1968年美國國家標準局特別制定了ASCII碼,作為電腦資料傳輸的標準碼。ASCII的功能在整合電子位元資訊交換的共同編碼標準,藉由IT產業呼籲使用同一套資訊交換碼標準的契機,進而統一全球各國分歧殊異的文字符號,邁向資訊流通一體化的目標。1984年4月,國際標準組織ISO(International Standards Organization)的一些會員國發起制定新的國際電腦字元的編碼標準,由小組ISO/IECJTC1/SC2/WG2(簡稱WG2)主持,針對各國文字符號進行統一性編碼的研發工作,最後定案的標準名為Universal Multiple-Octet Coded Character Set(簡稱UCS),編號則訂為ISO/IEC 10646,進一步成為全球電腦字元的編碼標準。 ASCII的運作邏輯是奠定在「每一字元都有一數字碼對應」的基礎上。電腦顯示的文字與儲存資料之間都有一個對照表,這個表就是ASCII字碼表。數字碼亦稱為內碼(Code),ASCII 內碼由 0至127 的數字組成,其中0到31是系統控制碼(例如ASCII碼7會使電腦發出嗶嗶的聲響);32至127是文字數字或特殊符號的控制碼(例如ASCII碼 65會顯示英文字母 A)。過去ASCII使用7個位元來表示英文字母、數字0至9以及其他符號,後來最高的位元也編入這套內碼中,成為八個位元的延伸ASCII (Extended ASCII),加上許多外文和表格符號,共可表示2^8=256個不同的文字符號。這套內碼便是1977年所制訂編號ANSI X3.4的版本,也是UNIX作業系統和以DOS為基礎的作業系統普遍使用的編碼標準。 ASCII以0到255,也就是8個0與1的二進位數字來代表相對應的字。譬如字元「a」的二進位代碼是「01100001」,若用十進位表達是97;在電腦內部傳輸或儲存時「a」都是數字97,但是要顯示於銀幕時,ASCII字碼表會去資料庫中抓出「a」的字型圖樣,然後在螢幕顯示「a」。現今電腦使用英文內碼在 128至255 的碼區,收錄了一些歐語系的字碼,但是這些並不算是標準的ASCII 字元,因此被稱為「圖形字元集」(Semi-Graphics Character)。 1984年ISO10646草案初稿一經公佈,編碼結構立即遭到美國部份大型電腦業者的反對。由於ASCII字碼表是以8個位元為基礎,只能顯示256個字對照的限制,對於中文與其他外文來說自然不夠,於是一個可對應世界各國文字、以更多位元為基礎、可對照更多個字數的通用編碼的字碼表,便成為各界不約而同的期盼。1988年初,美國Xerox公司及Apple 工程師小組,在Joe Becker為首領導下,倡議新的編碼結構,另外編訂全球字元編碼標準,將電腦字碼表編碼的基本單位,由先前的7或8個位元,擴增為16個位元、65536個字數的編碼空間,以容納全球各語言的字元和常用符號。這個新的電腦字碼表編碼標準就被命名為Unicode。 Unicode草案第1版於1989年9月發表。1991年1月,由IBM、DEC、Sun、Xerox、Apple、Microsoft、Novell等十多家電腦軟硬體廠商與網路資訊服務業者,共同出資成立了Unicode協會(The Unicode Consortium),並由協會設立非營利的Unicode公司。協會成立之後,將原先的工作小組擴編為Unicode技術委員會(Unicode Technical Committee),專責Unicode的字元搜集、整理、編碼等工作。另外推動Unicode成為國際標準的工作,則由Unicode公司負責。1991、92年協會出版了Unicode標準第1版(The Unicode Standard v1.0)。 在Unicode協會持續遊說和施壓後,WG2終於放棄原先選擇的ISO2022的8位元延伸編碼結構,改採Unicode的編碼方式。經過數月的協商談判,1991年10月,WG2和Unicode協會達成協議,將Unicode併入ISO10646,各國語言字元的搜集、整理和編碼等工作就轉由WG2主導,Unicode協會則扮演協助WG2的角色,但雙方依然可各自出版自己的編碼標準。1992年6月Unicode 協會通過DIS(Draft International Standard),1996年正式公布ISO10646的Unicode v1.0,Microsoft 的Windows作業系統便以Unicode為編碼基礎。 ASCII字碼符號並未因此落伍。它還透過藝術家的巧奪天工,變成傳遞到使用者電腦前的視覺素材,成為後工業時代其中一種創意無限的圖案拼貼藝術。