歷史學柑仔店(kám-á-tiàm) 2015/02/02 08:00:00 發表於 • 社會 • 科技
文:郭文華(國立陽明大學科技與社會研究所副教授)
倉頡、個人電腦與漢字基因
轉到左下角,與大易字根相對的,是更早研發,也是中文輸入法的代名詞的倉頡字根。從電影《明日帝國》(Tomorrow Never Dies,1997)的一個場景,可看到它在西方世界的地位。
號稱在劍橋大學得到東方語文學位的007情報員龐德(James Bond),在越南的某情報站看到電腦,便跟華人情報員林慧(楊紫瓊飾演)說他要來負責聯絡。結果,看到所謂「全中文」鍵盤後龐德傻眼,央求林慧過來處理。
對台灣觀眾而言,這自然不是學過中文就可以上手的電腦介面。某種程度上,它可算得上是「台灣之光」或「華人之光」;在電影中它擠掉英文字母,獨自站上鍵盤中央,體現亞洲崛起,運籌世界的夢想。
但撇開民族情感不談,這個場景裡還有一個值得注意的地方-鍵盤的尺寸。不管怎樣複雜的電腦,鍵盤似乎愈做愈小,功能愈來愈強。但事實上,早在電腦發展初期,鍵盤的尺寸就沒太多改變。拿早期因應人口普查而開發的Univac電腦來說,雖然儀表板上功能鍵一大堆,硬體的粗笨就更不用說,但指令輸入的部份卻是類似電動打字機的標準鍵盤。
但這點卻在電腦引進台灣時造成問題。相對英文字母的線性組成,要讓電腦呈現中文,便得外加中文的鍵盤區。但是如果只是直接將打字排版的概念用在上面,不但輸入不便,而且從資料處理的角度看,因為中文是兩維(two dimensional)結構,如果每個字都分別存入,會佔掉不少記憶體空間,削弱電腦其它方面的功能。換句話說,中文鍵盤不但要將鍵數減少,更要對呈現的方式細細思量。
1973年國立交通大學研發的中文鍵盤,紀錄這個技術的突破。當時計算機工程學系的謝清俊教授與研究生劉錫麟以字根為基礎,建構中文輸入的第一個平台。
這個宣稱是「中型」的鍵盤長32鍵,寬20鍵,右邊的中文鍵入區有496鍵,每一個鍵代表一個字根。字根與字根透過「直連」(比方「肯」字是「止」與「月」兩個字根的直連)、「橫連」(比方「林」字是兩個「木」字根的橫連),與「包含」(比方說「周」是「ㄇ」字根裡包含「土」與「口」兩字根的直連)等關係,來直接「造出」中文字。
相較明快打字機的找字運作,這部中文電腦更徹底地拆解、擠壓與組合中文字,比方說怎樣分配字根的大小比例,印出來的字才不會頭重腳輕,左肥右瘦或腹大中空,看起來不像中文。不過,這個做法確實讓「電腦說中文」產生了曙光。據謝清俊表示,用這種方式可以拼出8532個字,記憶空間更減少到四十分之一。
標榜「倉頡造字他拆字」,倉頡輸入法發明人朱邦復以非學院背景,在1973年加入這場字根簡化的競賽。他之前在巴西一家大出版社工作,驚訝於當地對文化轉譯的迅速,也體會中文在這個資訊爆炸時代中不能落後。之後他回到台灣,用了5年時間摸索中文的「字母化」,推出「形意檢字法」。它也是倉頡輸入法的基礎。
這套字母跟英文一樣,只有「日月金木水火土,人心手足口耳目,王石山虫魚犬馬,衣言絲草竹」等26個字母,簡單是夠簡單,但卻無法達到「盲目按鍵」,即只要輸入字母,就可以準確鎖定某個特定中文字的希望。
這個問題一直到1978年才因為中文系出身的沈紅蓮加入,將中文字根據字義與造字原則(指事、會意、形聲)拆成「字首」(非部首)與「字身」,才有所突破。他們維持先前的「字母」概念(但內容與分類上都有調整),使用上將它們轉化成類似明快的字根,用它們來標定字首與字身。
有趣的是,朱邦復雖然堅持漢字要走自己的路,找出其造字原理,但他也堅持這些「字母」絕不能超過標準鍵盤可容納的數目(大易輸入法相較之下使用較多的字根)。對這個妥協他有一套邏輯:他認為這個輸入法要好用,就不能佔用標點鍵與數字鍵。
而因為電傳打字機沒有小寫字母,因此如果要讓它可以用在電傳打字機,也不能動到大小寫的功能,讓一個鍵可以打出兩個字碼。他的盤算是:「既然有英文文字鍵,而英文系統已經成為舉世通用的標準,所以中文必須與英文鍵共用,僅留一鍵供中英文的選擇」。
讓中文鍵盤臣服在QWERTY鍵盤規格的,是這個想法與宏碁的研發團隊。在1980年電子展中宏碁以一台微電腦加終端機與標準鍵盤的「天龍中文電腦」初試啼聲,而後倉頡輸入法隨著QWERTY鍵盤的全球化腳步,取得中文世界的領導權。
透過個人電腦的流行,它將原先早已取得技術優勢的大鍵盤找字人員完全淘汰,成為中文鍵盤的標準配備。甚至,在朱邦復宣布放棄倉頡輸入法的專利權後,市面上出現以它為基礎,但適應不同華文語境與使用者的輸入法,比方簡易/速成輸入法、新倉頡輸入法、快速倉頡輸入法等,更不用提其他以拼字為基礎的輸入法。
固然在倉頡創造之初朱邦復緊追主流,無暇思索倉頡字根如何好用活用,但他的夢想畢竟不僅止於創造一個輸入法,而是中文在資訊世界的定位。事實上,倉頡輸入法的優勢之一不僅是它可以輸入我們想得到的漢字,它還可以根據它的造字原理,為中文世界造出新字來。
這種類似韓國十五世紀的《訓民正音》,將原本為拼音的韓文,改造成可書寫可擴充的「韓文字」(諺文)的革命構想,讓他在電腦內碼的爭議遭人構陷後遠赴美國,更在1999年轉戰香港後提出「漢字基因」的概念,走自己的路。
這個想法簡單說是讓電腦像中文使用者一樣,利用中文處理資訊。先前發表的倉頡輸入法,只是這個基因工程中的「字碼」部份而已。按照朱邦復的說法,這個工程的規模已經遠遠超越讓電腦「說中文」或「懂中文」,而是更深層的,要怎樣讓電腦「用中文思考」。
當然,這個計畫目前為止公開的部份並不多,但從輸入法到電腦的全面思考,誰知道哪天電影《明日帝國》的場景不會實現,倉頡成為連接中文電腦的獨家輸入介面?
注音輸入法與語言學習
相較於大易與倉頡,電腦鍵右上角的注音符號大概是最「台灣」,也是我們從小到大最熟悉的符號。確實,這套在1912年由教育部制定,1918年公布,包含21個聲母(例如ㄅㄆㄇㄈ)、13個韻母(例如ㄢㄥㄤㄦ)、3個介母(ㄧㄨㄩ)符號的拼音系統,至今依然是台灣人學習中文最重要的工具。
用拼音來檢字不是新想法。十四世紀王禎的《農書》描述「以字就人,按韻取字」的活字製作與編排方式。活字按照聲韻分裝於木盤內,以五聲區隔;木盤則放在直徑約七尺,稱為「韻輪」的輪盤上,而「之乎者也」等虛字或數目等常用字則獨立成一門。要排版時工匠依照韻書,從各分韻中選擇印書要用的字。
由於在製作活字時工匠另行製作檢字手冊,按頁按行給每個活字編號,因此在尋找活字時不用知道字的寫法,也無須一字一字去尋找活字,只要根據聲韻唱出字號,坐在轉輪之間的檢字人便可按號索驥。
王禎《農書》中的排版過程。(圖片來源:中華印刷通史)
不過在鍵盤與打字機發展的過程裡,注音符號卻一直缺席。對於用注音學中文的人來說,它似乎就是個學習的過渡,不算正式的書寫文字。以下例子說明這個尷尬狀況。
發明韓文打字機的公炳禹醫師(1907-1995)曾與發明中文打字機的林語堂會面,惺惺相惜。之後熱心的他主動製作以注音符號為鍵盤的「中文打字機」獻給蔣經國總統,認為它可以讓不識中文字者或盲人可以藉此與人溝通,甚至找到工作。想當然耳,這種「幼稚」的打字機並未得到重視,在總統府收下後便石沉大海。
在電腦研發的過程裡,注音也是較晚考慮的輸入方式,主要原因在於它無法鎖定輸入文字。對此,朱邦復說得很清楚:用注音輸入不是不可以,但且不管各地鄉音不同,發音不標準,光國語音只有1300個,文字卻有幾萬個,就知道說一個音重複率太高,需要其他資訊才能找到所需要的字。他的結論是:「如果注音可行,中文輸入早解決了,別人不是傻瓜,動腦筋的中國人可多的是!」
雖然如此,個人電腦開始普及,記憶體也大幅提升後,陪伴大家中文學習的注音輸入法,慢慢建立起自己的位置。事實上,東亞語文中原先就是拼音文字的日文與韓文,雖然在QWERTY鍵盤引進時曾有過字母配置的問題,但在第二次大戰後大多確定標準的鍵盤配置。相較起來,原先以拼字為中心的中文,一直沒發展出「拼音找字」的思考。這些都讓電腦時代的語音輸入產生不同的處理方式。
一個最明顯的考慮是鍵盤配置。我們最熟悉,也是繁體中文Windows內建的配置,是所謂的「大千式」。這個配置說穿了不稀奇,就是將我們過去學過的注音符號表(比方說放在小學生墊板後面那種)直接套在鍵盤上。不過,因為配合發音輸入的順序,因此聲母是放在左邊,往右才是介母與韻母。
與日文相同,注音符號也有不同的配置考量,甚至與英文結盟,開出新的輸入方式。比方說,為遷就熟悉英文鍵盤的使用者,最早開發中文輸入的倚天電腦,將注音符號與發音接近的英文字母放在一起(比方說「ㄆ」與「B」鍵)。之後更將中文輸入裡不會混淆的注音符號(比方說「ㄕ」與「ㄒ」)放在一起,將用鍵簡化到26鍵。
許聞廉發明的自然輸入法也是將英文與注音結合,但更強調聲母韻母的固有順序,與字型的接近(比方說「ㄚ」與「Y」鍵),而將用鍵更壓到25鍵。
在這個趨勢的另一端,則是全用英語的漢語拼音輸入法。雖然跟QWERTY鍵盤配置一樣,大多數人對習慣的輸入法會從一而終,但電腦時代才流行的注音輸入法,並未因為有微軟內建的加持而佔到便宜。不管是自然輸入法或倚天鍵盤都有固定的支持者,多數中文輸入軟體也都會提供鍵盤轉換的功能,不會讓使用者因此「雞同鴨講」。
但電腦畢竟對中文的學習產生衝擊。一個觀察是有電腦後不需要動手寫字,加上用拼音找字,字的寫法就被慢慢忘記。這種說法固然沒有問題,但我們或許還要更深入思考英語與電腦都向下紮根的現在,注音輸入法的意義。這一代的幼兒固然沒有朱邦復指出的「鄉音」問題,但他們是否還需要注音來學中文,頗值得疑問。
一方面,電腦如果是無所不在的個人教師,那用英文鍵盤就可以教育幼兒中文字的寫法唸法,無需注音這組學習工具。但另一方面,拼音輸入的邏輯也會影響語言學習的感覺。
比方說,中文裡有些字有讀音與語音在特定詞彙中有所不同,像「否極泰來」的「否」就要唸成「ㄆㄧˇ」而不是「ㄈㄡˇ」。但是,注音輸入法中並沒有這樣的對應,因此需要一字一字鍵入,而這樣拼出來的詞彙唸法也就與標準讀音有所出入。這些雖然還沒有太多研究,但已經引起不少人「中文低落」的感嘆。
這再次說明技術物不只接受社會影響,它也影響社會。想想看,當實體鍵盤開始讓位給觸控面板時,注音輸入法還會穩穩站在右上角嗎?
四角之外:電話的簡訊鍵盤
提到平板電腦,我們不妨想想電腦之外其它鍵盤的可能性。下面的螢幕畫面有三種鍵盤。左邊的我們很熟悉,是QWERTY鍵盤,但中間與右邊的只有十幾個鍵,配置也很奇怪。是的,它們都是手機。而手機可以鍵入文字,與電腦結合,是新的現象。它鬆綁我們對「輸入」這個動作的想像,更鬆綁了承載鍵盤定義的想像。
電話是有趣的例子。當貝爾(Alexander Graham Bell)在1870年代發明它時,電話的重點是通話而不是號碼盤——如果只有電話線的這一頭與那一頭,哪還需要撥號?
但隨著電話的商業化與電話網的建立,業者就要處理使用者之間的連線機制。在早期,這個部份是電話交換機(telephone exchange),以接線生的人工服務處理。即使這個工作慢慢由自動交換機(撥號)取代,但直到1960年代,在特定場合的通話(比方說長途電話或國際電話)還是需要人工協助。
另一方面,為了準確接通,每支電話,甚至是電話使用戶都有號碼識別。比方說一群人分享一線號碼為「123」的電話,那其中一個使用者的識別號碼可能是「123-J」。
這些都導致可撥式電話的出現。基本上,號碼盤的原理是透過特定的信號組合(比方說撥「1」號代表1秒鐘有1次信號),讓交換機可以因此找到相應的受話者。早期的號碼盤沒有字母,但後來因為電話用戶太多,有時需要字母才能識別(特別是在美國),而加上字母後,一些電話也比較好記。不同的國家有不同的文字/號碼組合,而號碼的編排順序也不見得一樣。
這個號碼與字母結合的識別系統在1960年代按鍵式電話出現後逐步淘汰轉盤,成為電話的標準介面。但此後直到1980年代傳呼機(俗稱「BB call」)與大哥大出現之前,基本上字母是號碼的附屬品。
在台灣傳呼機十分簡單,只是傳送來電要求或提供新聞(尤其是股市)資訊而已。但香港與日本都曾發展出用傳呼機遞送簡單訊息的文化。當時的輸入方式固然有由傳呼台傳達,但也有用戶以號碼顯示,約定俗成的「傳呼機文字」(如「01」代表「先生」,「520」代表「我愛你」等)。
只是,當文字顯示或語言傳輸的傳呼機開始流行時,手機也逐步進軍一般市場,提供更多服務。某種程度來說,它的簡訊功能承接傳呼機,而號碼盤的文字符號也與號碼分庭抗禮。大家雖然同用電話線路,但你撥你的號,我傳我的碼。
那非西方語文如何與這個新鍵盤系統接軌?日文部分,如先前看到的手機,是列出五十音的聲母(あかさたなはまやらわ),再進去選字母。韓文是將子音與母音分開,按韓文字書寫方式(比方說是左右合併、上下合併,還是先左後右再下)輸入。但與漢字無關,多達37個的注音符號要怎樣塞進數字盤上,就得好好思量。
一個常見排法是按照大家學習的順序,先聲母再韻母再介母放在數字鍵中,最後是聲調與標點符號。另一種排法是將大家學過的標點符號表直排到數字鍵上。但如同早期的中文電腦一樣,手機廠牌會想加強方便,為號碼鍵盤設計不同的輸入法。
相較注音配置的紛紛擾擾,中國最流行的「T9輸入法」(Texton9Keys)善用其拼音優勢,直接與英語鍵盤接軌。它標榜只用英文,輸入法會根據漢語語境與用字習慣,選最適合的字。當然,不耐煩「拇指神功」的使用者也有選擇。他們可以購買配備類似電腦鍵盤的手機,或者是像前面舉出的例子一樣,利用手寫板或虛擬鍵盤。
鍵盤雖小,但從它們的變化與整合可看出資訊科技物品發展的趨勢。過去的工作站與個人電腦各有其職,但現在卻因為作業系統的強化而日益接近。手機與個人電腦過去固然井水不犯河水,它們的延伸物個人數位助理(personal digital assistant)或掌上型電腦(palmtop computer)與智慧型手機卻幾乎毫無差異。
它們可打電話、上網、照相、聽音樂,而它們的鍵盤也愈來愈互通。更何況,在人人使用數位鍵盤的時代,客製化鍵盤或輸入法不是這樣困難。只要有「按鍵組合-中文字」的對照表,就可以創造出新的輸入法。
如果到了那一天,說鍵盤的「四角密碼」還有意義嗎?
從「我手寫我口」到「我口說我手」
而這一天已經不遠。2011年底蘋果推出新一代手機iPhone 4,其中最炫的功能大概是稱為「Siri」的人工智能助理軟體。廣告中它與使用者無所不答,從查天氣問交通,找餐廳約訂位,到一些私密性的話題,Siri給人的印象是——如果鍵盤是「我手寫我口」的介面,那Siri是否象徵「我口說我手」的時代到來?
Siri所使用的自然語言處理,如同這篇文章介紹的很多創新一樣,不是新科技。以中文來說,早在1982年台灣大學資訊工程系的李琳山便與語言學家合作,陸續開發「金聲」系列的中文辨識軟體,而這個技術也日臻成熟,廣泛應用在電話總機或客戶服務上。
但是語音辨識只是這類電子產品脫離鍵盤的第一步。要讓這些環繞在我們四周的產品超脫一個口令一個動作的格局,需要可以與使用者相互溝通對話的人工智慧系統。
在目前Siri使用者的回應裡,顯示它不止有所謂「答案庫」,儲備一些情境中需要的答案,也有一定的分析能力,將上千上萬無厘頭的問題,回推到這個答案庫裡,對答出有脈絡意義,不致於雞同鴨講的答案。這篇文章不是要破解Siri,但我們願意指出在「超鍵盤」的世界裡,人與機器互動的新趨勢。
幾年前微軟推出上面的MSN廣告,訴求網路的無限商機。它的廣告詞寫著:「101,這是標準鍵盤的數字。一開始,它們不用過來打字。現在,是用來敲開8,174,242個原本不相干的人生!……發明鍵盤的人一定沒想到,MSN出現後,鍵盤的功能變得這麼神奇」。
確實。不過短短數年,MSN已經被更多社交系統競爭甚至取代,這或許也是它的創辦者所沒有想到的,但鍵盤依舊在那裡,上面依然刻著愈來愈少人理解的身世密碼。它是二十世紀的羅塞塔石碑(Rosetta Stone),銘印著打字機時代到資訊年代裡人類社會與文明的秘密。