登入  |  English
感謝您對「自由軟體鑄造場」的支持與愛護,十多年來「自由軟體鑄造場」受中央研究院支持,並在資訊科學研究所以及資訊科技創新研究中心執行,現已完成階段性的任務。 原網站預計持續維運至 2021年底,網站內容基本上不會再更動。本網站由 Denny Huang 備份封存。
也紀念我們永遠的朋友 李士傑先生(Shih-Chieh Ilya Li)。
自由專欄 等待新漢碼-漢字的數位化與中華文化的衝擊(下)

等待新漢碼-漢字的數位化與中華文化的衝擊(下)

三、中文在一字一碼的架構下固化了

我們中文漢字在每字指定一碼的架構下,「以筆書寫,自由創造」的漢字本來生命力不見了,因為這漢字在數位世界中「固化」了!

這樣的固化現象是無所不在的,其效應也是無聲無息地不易被察覺的。 為了更具體的剖析說明這種失去活力的「固化」過程,這裡再舉幾個 例子來加以說明。

百年來,對人類非常重要的日常用具──電燈,按倉頡以來中文形聲 造字的法則,最終應是進化為「電登」這個「字」(注意「電」「登」 兩個部首併寫成一個漢字,因為「現在電腦還沒這個字碼」,所以這 裡無法顯示)(這個新字應是唸做「登」)。

想一想,當電燈剛出現時,中國仍處於油燈的時代,借用火旁油燈的「 燈」再加上一個電字來修飾當時的燈字。另外,像網際網路(互聯網) 更已經是這數位時代生活密不可分的一部分,按倉頡造字進化的原理, 它的新字應該是「互罔」,這便是一個文字活力成長的機制。

近幾十年,我小時候的油燈現在已幾乎看不到了,「電燈」普及了, 我們已經不需要再說「開電燈」「關電燈」來與油燈分別,而直接說「 開燈」「關燈」,這是語言本身隨著生活時代不斷演進的例子。你只 要仔細觀察,這種例子俯拾皆是。

其實,這個新時代新增的字很多,像 MODEM 這個英文字便是從 "MODulation and DEModulation" 複合而成,然而,由於目前中文碼 是「一字一碼」,因此這個「調變解調機」(或用「數據機」簡化) 就被「困住」了,只因為中文沒有字碼也「不容易」另定字碼!

這都是因為現在使用的是一字一碼的定碼機制,我們所能做的,就只 是用現有的字碼來組新詞,無法造新字!儘管時代不斷地演化,重要 用品和概念不斷地出現,我們卻無法進一步跟著簡化。

於是,英文字在進化,中文字卻僵在原處!

四、中文在一字一碼的架構下僵住了

在這個案例中,中文僵住了!OK,也許會有人說,「中文僵住了又怎 樣?日子還不是一樣在過?」

當然,在 BIG5 時,用電腦、打手機簡訊也都可以啊!沒錯,但是, 其結果就是下面的光景在不知不覺中大量普遍地在進行著:

以「中央處理器」和 "CPU" 為例,許多人在生活中、文章中會不知 不覺地會直接用 "CPU" 而放棄寫冗長的「中央處理器」,真的,實 在太累了,可是一用 CPU,就有許多小孩、老人和那些非資訊背景的 人不知道意思了!(像 ADSL、MODEM 這種字也都是一樣的情形)。

而這樣的情況不只是發生在資訊界,也同樣發生在學術、工程、科學、 醫療、農業、生物、經濟、管理…等等所有進化中的領域。這樣的情 況越久,中文所不能表達(或因不實用而被棄置不用)的字詞就會累 積得更多,長久下去,中文就這樣無聲無息漸漸地與時代脫節,也就 慢慢失去一個語言的實用性與優越性!

各位要覺悟到,這種漢字的困局,是漢字的使用者必須自己關心解決 的問題,外人不會替你解決,UNICODE 不斷地編碼,只是在解決跨國 市場全球化的需求而已,至於這架構的好壞,對漢字文化的未來衝擊, 外人怎麼可能替我們認真的面對!

五、字碼在無聲無息無所不再地影響我們!

字碼的影響力是無聲無息的,無所不在的,我們在不知不覺中,受到 這種基本機制所制約而不自知。

為了讓各位更清楚地看見中文碼對中文活力的影響,讓我們再舉下面 的這些例子來觀察思考:

CPU 是電腦的心臟,在這個數位時代是如此的重要,所以常常被使用 到。前面提到,大家寧可寫 "CPU" 而不用「中央處理器」,因為寫 起來太冗長了。然而,換個角度,也是因為我們無法用「電心」(注 意,這是一個漢字,因為 BIG5、GB、UNICODE 裡還沒有「指定」這 個字,因為沒有這個字碼,所以也無法用電腦顯示)這是個極簡潔而 恰當的新字。同樣的,就像英文可以把 Personal Computer 簡化成 "PC",但中國人卻得永遠寫成「個人電腦」,難怪會有很多人直接寫 PC。另外像「光碟」這個數位時代的關鍵儲存裝置,因為沒有「光枼」 這個字,所以只能用「光碟」,但「光枼」(這是一個字)就明顯比「 光碟」兩個字來的有效率。(「電腦」的新「字」你一定馬上可以想 得到如何寫了!停下來想一想,其實,字的演化是這麼自然而且簡單。)

再如英文 BIT 在電腦方面我們叫做「位元」或「比特」,BYTE 則譯 做「位元組」或「字節」,但其實 BIT 的零一單位就是在易經八卦 中的「爻」(音「姚」或唸成英譯的「必」也很好),而 8 個 BIT 叫「爻八」(一樣,要併寫成一個漢字,唸「拜」,再自然不過了), 依此原則可以進一步造出 16BIT WORD,32 BIT WORD 的字,這樣的 自然演化其實只是還給漢字本有的活力而已。

六、新中文碼的時代需求

我們需要一個能承載數位中文漢字的字碼架構。

前面的分析應該能讓你感受到,數位漢字碼若要能承載中華文化中的 活力,就必須具有新字詞的演化架構,因為這個質素代表著數位漢字 在中華文化中能繼續具有重組與創新能力,而這些本來就是傳統漢字 既有的本質機能,並且也是一個文化要能繼續生存發展所需具備的。

這種獨特的構字能力,進一步來說,主要就是形聲造字法,這是漢字 特質,也是漢字的活力和魅力所在。如果無法造新字,其結果就是迫 使文辭變得冗長生硬,因而漸漸失去它的簡潔與優雅,減損了文字效 率與實用價值,最後,終將面臨被更簡潔有效的文字系統所取代的命 運。

漢字是把概念分類和發音濃縮到小小的方塊內,這種二維的表達,比 一維的英文字串,承載了更豐富而精緻的資訊,實在是有效而理想的 文字表達方式。我們只有找出漢字在數位世界中進化的活路,才能夠 讓漢字繼續保持它的實用與優雅。

相較於英文,漢字的優點,其實俯拾皆是,這方面的探討很多,無庸 贅述。在這裡僅舉一個簡單例來說:「鱐、鯦、鱞、魨、鰉、鱨、鱴、 魦、鰇、鰗」,雖然你可能都沒見過,不過大概知道不是魚的名稱、 就是跟魚有關係的事物,甚至已經可以想像,大概是屬哪一型的魚。 有了魚的部首,「有邊讀邊,沒邊讀中間」,就算讀音不甚確定,也 是八九不離十。反觀英文就沒這個好處,Tuna , crucian , salmon , bass, abalone , trout , scombroid,雖然都唸得出來,但沒有事 先學過,根本看不出任何關連,恐怕只有魚類學者才能弄明白真正的 義涵。

◎ 結語

自從英文電腦發展以來的這幾十年來,我們進行了一場「電腦中文化」 的努力。然而,在電腦普遍使用的今天,事實上我們已經漸漸地從硬 體與技術的限制中解放出來,整個資訊產業正從「硬體技術」主導的 產業轉移到以「資料內容」為主導的產業。因此「電腦中文化」也進 入了「中文電腦化」的新階段,我們要從中文的真正本質與需求來運 用電腦,而不再遷就於電腦硬體與技術。

當今的字碼,不管是 BIG5、GBK、或 Unicode 都是人為指定的一字 一碼架構,而使得數位化的漢字失去既有的生命力,不僅使得漢字變 成一種僵化的文字,也使得漢字漸漸地降低了他的實用性。這樣的「 歷史錯誤」是我們要嚴肅地重新審視的。

中文碼對一個數位中華文化的發展,其影響可說是既深且遠,並且是 無所不在的。在這中華文化邁入數位新世紀當中,中文字碼的架構正 從根從本地影響了我中華文化的未來,希望我們能及早發現這個議題 的嚴肅意義,期能引發各界深思熟慮,尋求解決之道。

作者註:本篇文章希望讓大眾發現潛藏在我們生活中的字碼是如何地 影響著我們中華文化的現在與未來。如果能獲得你的認同,歡迎轉載 與拷貝,讓我們一起來等待新漢碼的未來。

關於作者:
陳昌江,網名阿江,部落格;畢業於台灣科技大學電機系,曾任易符智慧科技董事長(易符科技從事 CPU及嵌入系統的開發其中也包括中文字形及其相關的中文造字系統),現為「剎那搜尋工坊」籌備處負責人,主要從事中文資料庫之搜尋及中文缺字之處理。

本文章參考易符智慧科技所發表「中文資訊的表達與易符無限字庫」,針對當今中文數位化之困局加以剖析闡述,文中許多觀念源於中央研究院謝清俊教授之啟發及葉健欣先生之導入,特此銘謝。全文依據創用CC「姓名標示 2.5 台灣」授權條款出版,授權條款之詳細內容,請參考此處



您也許有興趣閱讀以下文章:




自由軟體鑄造場電子報 : 第 70 期 Sun 宣佈 Java 將採用 GPL

分類: 自由專欄