專訪文鼎科技總經理兼技術總監吳福生先生
捐贈軟體在開放原碼的領域裡看似平常,但實際上文鼎公司捐贈中文字型之舉,對開放原碼的中文化可說是影響甚鉅--不僅在軟體或作業環境上,都提供了中文化 重大的催化作用。我們甚至可以說這是:文鼎的一小步卻是中文化的一大步。希望藉著此一專訪讓大家更了解中文字型的發展現況外,也能分享文鼎在開放領域的經 驗。
Q: 文鼎的新聞網頁上,有一些過去對財產權方面的糾紛消息。您認為採用開放原碼,對文鼎財產權會有什麼影響嗎?
A: 就字型廠商而言,希望有更多的應用使用於更多的平台上。
因此文鼎深深認知若要扶持Linux 的發展,文鼎能貢獻的就是提供合法的字型,使Linux平台能蓬勃發展,這是因為文鼎有深刻的體會「智慧財產權」如何 影響一個產業的發展。文鼎在網頁上發布的智慧財產權糾紛勝訴消息,乃是十一年前競爭廠商假法律手段所進行的字型市場競爭,雙方牽扯的案件多達二、三十件, 層面擴及司法、行政、 證券交易、公平交易等領域,文鼎雖獲得最後的清白,但因對手的司法干擾而致發展受困,因此發生多次的經營危機。所以文鼎願意開放四套字的原始碼,協助 Linux 的成功。
就文鼎而言,擁有的日文、中文繁體、中文簡體、韓文、香港外字等字型不下三百套,因此開放這四套字來說,對文鼎的影響是有限的,文鼎也期盼Linux的成功,因為這樣的發展對文鼎長期來說也是正面的。
Q: 文鼎捐贈很多字型給學校,不會影響到利基嗎?這樣做的好處是什麼?
A: 文鼎不敢說捐了很多字型給學校,文鼎是捐了一套《文鼎標準楷體》給教育部轄下的所有學校來使用,這一套字是全國唯一經過教育部認證通過的「標準寫法」字 型。其實除了這套字外,現在在市面上所銷售的其他家字型,甚至微軟視窗系統下所附的任何標榜「標XX體」字型,都是未經認證的。
文鼎基於回饋社會,也希望年輕學子所使用的字型是合法、正確、經認證的字型,因此願意提供出來,讓學校來使用。文鼎作此決定時,未奢求能從中獲取什麼,只是認為提供這套字出來,對文鼎影響不大,但卻深富意義,因此我們就做了!
文鼎人有一個使命,我們發展的是「漢字造字工藝」,我們身負承載文化的文字開發工作使命,我們開發的產品能更豐富、美好地承載文化,溝通大家的意念,這是多麼有意義的工作啊!
Q: 除了字型開發之外,文鼎還致力於字碼轉換。可不可以談一下你們的「ATE EUC解決方案」?它最大的突破在哪裡?
A: ATE-EUC (Arphic Text Exchange-Enhanced Unix Code) 是讓中文 Windows 上支援戶役政 4-byte EUC 碼及 CNS 國標碼的字型應用環境。
在台灣現有資訊應用系統的中文內碼使用上,有 BIG-5 擴充碼、CNS 國標碼、電信碼、王安碼、財稅碼…等,而中文 Windows 只支援 BIG-5 碼及 Unicode2.0,限制了能使用的字數及內碼。
文鼎 ATE-EUC 突破了 Windows Double-Byte 編碼架構,在 MS Windows 系統上架構出 4-Byte EUC 碼系統平台,提供戶役政中文碼輸入、查詢、編輯、顯示與列印之功能。此平台提供文鼎戶政明體 TrueType 字型及輸入法,還有 Active X 文字編輯元件,除了可在 Word 下編輯戶役政字,還可提供 Client/Server 或 Web-based 架構程式 開發者,開發支援 4-byte EUC 碼的應用系統。目前文鼎 ATE-EUC 已經在健保局的部分系統上建置使用。
文鼎戶政明體 TrueType 字型包含 7 萬 3 千多個戶政用字,符合 CNS11643 標準。支援中文版 Windows 98、NT、2000、XP系列。提供 EUC 輸入法:EUC 倉頡輸入法、EUC 注音輸入法及 EUC 內碼輸入法。
Q:「文鼎科技是國內第一家支援 Linux 作業平台的字型軟體公司 (包括支援 Red Hat Linux、Open Linux、Power Linux 及 Linux CLE 中文套件)」。可不可以談一談文鼎在這個 Linux 中文化所做的貢獻。
A: Linux文化著重在於開放與自由使用的理念,避免將科技掌握在少數人或公司的手中,提高資訊知識與技術的擴展速度,解決部分的數位落差,以及促進社會的 進步。文鼎為了響應此理念,使得 Linux 系統能在台灣與中國發展,因此捐贈了 BIG-5 及 GB 共四套字型,供對Linux 有興趣的機關團體及個人免費使用及修改。文鼎因此陸續收到世界各地的 Linux 專家 email 過來的感謝函。
Q: 「文鼎在最近釋出四套 Ture Type 字型作為自由軟體,並公開公眾授權 (PL: Public License) 書,藉由授權條款中附加解除條件的做法,為自由軟體的運作注入新的活力。」為什麼會想到要加入自由軟體的行列?貴公司跟香港等有接觸,你們在中國也會考慮 GPL 的方式嗎?
A: 如上所言,文鼎為了支持 Linux 文化而加入自由軟體行列。文鼎在香港係透過代理商 AD Computer 進行業務活動,對於香港 Linux 團體並沒有直接接觸,但由於香港是使用 BIG-5 碼加香港外字(最新標準有 4,818 個外字),因此文鼎提供的兩套 BIG-5 字型在香港也可以使用。至於中國標準編碼為 GB 碼,文鼎有兩套 GB 字型,也已經以 GPL 方式開放使用。
Q: 可不可以就文鼎所觀察到/接觸到的,談一談在中國的情形?他們的字型問題、編碼的問題、自由軟體的現況?
A: 中國政府因為國家安全、扶植國內軟體產業、以及市場龐大等因素,極力推廣 Linux 以及國產軟體,包括一般軟體與字型。尤其將字型視為中國文化的基礎,因此訂定許多標準與規範,對於一般常用的點矩陣字型(bitmap font),如 16x16, 24x24, 32x32 等強制要求廠商要使用官方製作的字型,而系統用的 TrueType 字型,則需取得官方的檢查認證。
1980 年大陸頒布了第一個漢字編碼字元集標準,即 GB 2312-80《資訊交換用漢字編碼字符集基本集》。該標準採用雙位元組(16 位元) 編碼,總共定義 8,836 個碼位,收納了 6,763 個漢字及 682 個常用符號,總共有 7,445 個字元,剩下的部分空碼位有 1,222 個定義為使用者造字區。此字集以前幾乎是唯一的標準,即使到目前為止也是使用最廣泛的。
2000 年發布實施 GB18030-2000《訊息交換用漢字編碼字符集基本集的擴充》,是由中國國家質量技術監督局所發布的,要作為一般電腦系統在大陸地區銷售時必須遵循 的基礎性標準之一。GB 18030 收錄了 27,000 多個漢字,總編碼空間超過 160 萬個碼位,預留了人名、地名用字的擴充空間,以解決一些生、偏、難字的問題。如此可爲出 版、郵政、戶政、金融、地理資訊系統等需要用到人名、地名的系統,提供一個新的標準平台。
Q: 文鼎對於華文字型/編碼的未來,看法或建議是什麼?
A: 對於世界性的華文編碼將以 Unicode 為主,作為主要軟體系統作業及文件字碼交換平台。華文的主要使用國家中國、台灣及日本多會在本身現有國家標準上,配合 Unicode 的進展以及本國現實需要,訂立自己的新標準。在中國的編碼,未來會以 GB 18030 為基礎再擴編,日本以 JIS 0208(6,355個漢字)、JIS 0212(5,801個漢字)及 JIS 0213(3,685 個漢字)為基礎再擴編。而台灣業界標準為 BIG-5 編碼,由於外字區只能容納約 6 千個字,且各單位都有自己的造字碼位,大幅擴充機會有限。台灣的國家標準為 CNS 11643,目前標準已定義漢字 4 萬 8 千多個字,戶政以實際使用 7 萬多個字,未來除了漢字的擴編,也計畫將 Unicode 所定義的各國所有文字及符號收編在內,目標除了作為台灣政府及格機關團體的交換碼外,也能與世界接軌。
至於中研院資訊所謝清俊博士所發明的『漢字構字法』,是一個很好的漢字編碼方法,利用部件及構字式可以表示現在及古代的所有漢字。但由於與現有編碼方式及應用系統差異很大,如要推廣使用,尚需克服許多困難。
Q: 談一下 PDF與中文字型,您覺得未來還有哪些挑戰與進步的空間?
A: PDF 是國際通用的可攜式文件格式,可以跨系統、跨電腦平台及跨語系,沒有任何阻礙地交換、顯示及列印文件內容,所以 PDF 格式在字型內嵌 (Font Embedding) 部分,已經處理地十分成熟,無論是 Unicode、中文 Big-5 碼、簡體 GB 碼、日文 JIS 碼… 等文件,都可以自由的交換顯示。PDF 格式對 Unicode 及 Big-5 code 等中文字型,雖可以順利地處理,但是對台灣還在使用的其他中文字碼系統的字型就無能為力,如戶政系統的 EUC code,就已經是 4 byte 7 萬多字;還有台灣的國家標準碼 CNS 11643,目前 Adobe Acrobat 軟體或其他 PDF 軟體,都還無法處理這部分的字碼及字型內嵌問題。所以 PDF 格式如何與 EUC 碼、CNS 碼等結合,是未來的挑戰。
Q: 「文鼎字型公司為國內首家專業投入 Linux 領域的字型公司,並與 CLE 團隊技術合作,慷慨捐贈合法字型提供 XFree86 中文應用程式發展使用,也因此讓 Linux 有了進軍桌上型工作站更好的機會。」文鼎有沒有計畫未來還有持續的貢獻?會是字型以外的嗎?
A: 文鼎支持開放與自由使用的理念,但文鼎畢竟是一家民營公司,需要營利才能生存,並對員工及股東有所交待,因此在能力可及的範圍內,將盡量對社會貢獻。目前 在 eTaiwan 計畫下,主計處主導的『中文資訊應用環境』開發建置計畫,將以 CNS 碼作基礎,用Java開發各個元件,以開放軟體的方式供各政府機關使用,這其中的許多元件便是由文鼎所開發提供。
相關網址:
https://www.arphic.com.tw/
Posted by wendy at November 8, 2003 07:39 PM | TrackBack
Comments
文鼎除了那四套過時的字型外,對 Open Source 而言毫無建設。
Posted by: statue at November 10, 2003 02:26 AM
1. 文鼎字型僅包含 Big5 編碼區,希望能擴展到 Unicode 1.1 以上,以讓文鼎字型能夠往國際通用字型的標準邁進。
2. 文鼎PL細上海宋並不符合教育部的規格,該字體的寫法為簡體寫法,在使用上無法將此套字型擴展為教育用途,甚為遺憾。
Posted by: statue at November 10, 2003 02:30 AM
Statue 先生,言過其實了。
一、 誠如 unix 已經有幾十年的歷史,但它並未「過時」;
或者是所書寫的「漢字」,已經有數千年的歷史了,但它依然未過時。
因為,上述兩例是不停地在演進中。
而文鼎四套公眾授權的字體過時了嗎?
在授權合約上,列有:
「...允許非營利性質之免費使用,即允許包括修改、編輯在內之使用發佈權。...」
既然文鼎同意做任何的修改、編輯。那麼「文鼎捐出門,修行在個人」
過不過時,其實有志者是有責任的。若不去下工夫「演進」,為何說它過時?
若全台灣沒有人要去下工夫「演進」,那麼為什麼要「open」?
二、 談到「工夫」、談到「公眾授權」,那麼為什麼這四套字「對 Open Source 而言毫無建設」
TrueType 的 Source 就是字型檔本身。
字型允許修改,TrueType 的規格、及許多工具,在網上很容易就找得到。 這些資源對字型最底層的理論與技術之研究,已經十分充足,只欠下工夫之人。
在「open」上:
這四套字在一般的使用者拿來打打字、印印表這種初級的運用; 或是在高手的手裡,做成無窮的可能 如同先生所提的:「... 僅包含 Big5 編碼區,希望能擴展到 Unicode 1.1 以上 ...」
因為 open 的授權,高手才能合法的運用這四套 Source。
難道「Open Source」的精神是:廠家需要將先生的每一樣需求,都無條件做到? 且完成後,還得再公眾授權「open」? 何況 Apple 公司仍然擁有 TrueType 技術的多項專利。 除非 Apple 公司 open,或是這些專利到期。 文鼎也沒有資格將一些工具的 Source「open」!
「對 Open Source 而言毫無建設」,是不是文鼎多開放幾套字才是「對 Open Source 有很大的建設」?
三、 談到「上海宋」。明明標註著「上海宋」,而不是「標準宋」。為什麼要拿來當標準字體使用? 在網上,看到一些「遺憾」也有一陣子了,為什麼還是想不通?
以上的回應,希望能與先生一同進步。
ChGKan
Posted by: ChGKan at November 10, 2003 08:54 AM
抱歉, 的確是我打太快了, 第一映像就是文鼎的字型不適用, 文鼎PL上海宋的字型的確是不合適於標準字體使用. 而文鼎PL中楷由於小字閱讀不易, 是故很難作為平常桌面平台使用的字型, 這樣子的感覺讓人覺得文鼎的誠意不足. 當然的, 兩個字型在大字的顯示上的確十分漂亮, 對於當時的一些要求也做的十分好, 像是倚天擴充字的補增等.
『盡量避免使用文鼎PL細上海宋於教育用途,該字型有許多字的字形會造成教育用途上的誤導,為了避免誤人子弟,盡可能的不要使用該字體。』
文鼎字型的確在 open source 剛起步時, 有著十分重大的意義, 代表我們終於有一套 open source 的字型, 在這一路下來的確功不可沒.
對字型的部分, 要普通的使用者下去增補是一件不簡單的事情, 當然以 open source 的精神而言, 要就自己下去做, 但是對於字型的製作而言, 移花接木的技術並不適用, 單純的將幾套字型結合起來對於整個瀏覽而言只會造成眼睛的傷害, 而讓我們自己去刻新字並不是難題, 只是刻出來的字與原本的字體必定會有許多差異性, 這也是會造成字型的使用上與推廣上更為不易. 字型並不像是傳統的程式碼, 可以慢慢的加上自己的修正來讓字更多, 更完整, 他還包含著審美觀等等有技術的人通常無法處理的部分. 這對於文鼎而言, 擁有數百套中文字型的字型廠商, 卻不能實際上的繼續給予社群支持, 令人深感遺憾.
再跟您抱歉一次, 我想它的貢獻是有的, 只是他的缺點也不少, 更是不好修正.