
序
乙巳四月卽至,蜀地氣候乖張。月初猶聞油菜花頭殘雪;倏爾艶日高懸,單衣汗流。至月中,黃沙漫捲,重衾不暖。方數(shù)日,又炎威再熾,空調難歇。昔者四時行而百物生,今草木榮悴失時,雀鳥惶惶易巢。冬夏無序,春秋失期。惟余慨之:此誠發(fā)佈新字體之良時也。(?。?/p>
正文
1. 介紹
抱歉,一開頭讓大家看了一段奇怪的文字,但細心的大家一定發(fā)現(xiàn)了(?),這段文字(包括我接下來的所有文字)的用字是不同尋常的,他旣不同於目前港臺所用的繁體標準,也和之前大衆(zhòng)所認知的所謂“大陸標準繁體”不盡相同。
我用的這一套標準其實就是我國新近頒佈實施的《古籍印刷通用字規(guī)範字形表》(GB/Z 40637-2021)標準繁體(以下簡稱《古籍表》、「古籍表字形」)。
這個《古籍表》
是在北京師范大學資深教授王寧先生的帶領下,以漢字學科學理論為指導,以我國第一部大型辭書《辭源》所收文言詞匯為切入點,在對海量古籍數(shù)字化資源進行統(tǒng)計測查基礎上,確立嚴謹、科學的規(guī)范原則和驗證條例,按照定字數(shù)、定主形、定筆數(shù)、定字音、定編碼的“五定”目標,歷時6年研制完成的。這是新中國成立以來對傳世古籍印刷字的第一次整理規(guī)范。
該標準規(guī)定了古籍印刷通用字收字和宋體字形規(guī)范原則,給出了14250個古籍印刷通用字的字形、字音以及在國際編碼字符集ISO/IEC 10646中的碼位,適用于傳世古籍的印刷出版,以及現(xiàn)代書刊的繁體版印刷。該標準的發(fā)布實施,對于推動語言文字規(guī)范化標準化信息化,傳承弘揚中華優(yōu)秀傳統(tǒng)文化,建設社會主義文化強國都具有重要促進作用。
用不太準確但最容易理解的話説:此表是我國大陸地區(qū)第一個正式的繁體字規(guī)範。
我願稱之爲 真·國標繁體。
2. 讚
那麼可能有人要問了,爲什麼我們需要這樣一個繁體字規(guī)範呢?
很簡單,因爲我們很長時間裏都缺這麼一個東西。衆(zhòng)所周知,國朝以簡體爲正,自上世紀五十年代頒佈簡化漢字方案以來,各種語言文字改革皆是在對簡體系統(tǒng)進行修補與規(guī)範,而所謂的繁體一直沒有一個正式的規(guī)範。像《第一次異體字整理表》其本身是一個簡化漢字的起手式,而非給繁體字定正字。後來《漢字簡化方案》一直到《通用規(guī)范漢字表》所列的繁體、異體也只是告訴大家我們現(xiàn)在所用的簡體字是從哪些字簡化而來的,也不是對繁體字的正字做了一個規(guī)定。繁體作爲一種被棄之不用了的東西,被看作是一種“古代文字”,且在如今國人對港臺某一撮人觀感日益惡化的背景下,用繁體甚至被認爲是前朝餘孽、境外敵對勢力的象徵。這是很不健康的,畢竟在大陸,還是有很多學語言文字專業(yè)或者從事相關研究的人、對傳統(tǒng)文化熱愛的人、學習書法的人、漢字廚,乃至於裝愛逼標榜自己與衆(zhòng)不同的人,都有著使用繁體字的需求。這些人可能在人群中所佔比例不大,但在十四億人口的基數(shù)下,人數(shù)比境外用繁體的人還多也説不定。
在這樣的情況下,沒有我們自己的繁體字規(guī)範就很不好了。沒有規(guī)範,人們就只能按照現(xiàn)有的簡體字規(guī)範去猜測“規(guī)範繁體”的樣貌。這就出現(xiàn)了很多對於繁體來説很不舒服的操作:比如按照《第一次異體字整理表》的規(guī)定,把很多歷史上普遍承認且使用的正體打成了異體(像災、異就以災、異爲正);還有一些諸如 爭/爭、換/換 這種一般認知上算繁簡體區(qū)別——但按簡體規(guī)範是新舊字形區(qū)別的字,在繁體書裏也按新字形寫 爭、換。這些操作,把現(xiàn)代繁體印刷書籍的面貌弄得很奇怪,所以很多時候,人們都自發(fā)地不按照這種“規(guī)範”來做,國內繁體書籍的用字因此相當混亂,通規(guī)字體、港臺標準混雜使用,很多時候用啥字都是按照作者或編輯自己的習慣來,沒什麼標準可言。
你沒有規(guī)範,你不去制定、主導、引領規(guī)範,就會被其他地方的規(guī)範帶著走,被其他地方的規(guī)範奪取話語權與代表權,這是很不好的。繁體字不僅僅是古代文字,也不是只有港臺人會用的文字,他是堂堂正正的中國原生文字,是每個中國人都可以拿來學習使用的溝通古今、連接未來的工具。
所以説《古籍表》的頒佈,填補了相關領域一個很大的空白。結束了我們“無法可依”的歷史。
3. 歎
不過,這個表也不是沒有毛病的,目前主要有四方面的問題:
① 正異體的取捨不明
表裏包含了一些意思完全相同的正異體字,比如晉??晉,但沒有明確説用哪個爲正。可能後續(xù)會出分級字表來解決這一問題,現(xiàn)在只能靠《辭源》字頭來猜定了。
② 對近代白話文用字的支持不太好
據(jù)《古籍表》宣稱其適用于傳世古籍的印刷出版,以及現(xiàn)代書刊的繁體版印刷。然而現(xiàn)代書刊會用到的一些近代常用字、分化字並未收錄進《古籍表》,比如剪、呆、嚐、慾、揹、餚、崗等等,最離譜的是連“古”這個字都被漏收,非常令人費解。這些字在文言及古、近代白話中都是會用到的,但可能因爲《古籍表》所用的統(tǒng)計數(shù)據(jù)大多數(shù)是古籍,就沒能照顧到這一塊。但畢竟其宣稱了可用於現(xiàn)代書刊的繁體版印刷,那麼還是有必要將近現(xiàn)代白話文(特別是民國時期大量的白話文書籍、文章)的實際用字也納入考慮,以供現(xiàn)代文參考使用。
③ 表內部件類推不完善
古籍表相對通規(guī)字而言,修正了很多部件的寫法。但是可能因爲種種原因,這些修改部分並沒有完美地落實到每一個字上,使表內殘留了一些類推不完善的字。
這個倒是不算大問題,畢竟看了表之後我們都能理解到其修改意圖,做字體時自己按規(guī)律做就好,或者保持原樣也無妨。
④ 配套設施極其不完善
重點來了,這套標準,説是新近頒佈的,其實也正式發(fā)佈了好幾年了,但似乎沒在市面上砸出什麼水花。都這麼久了,大衆(zhòng)還是沒有啥配套的東西可用。
要想把這套東西用起來,起碼需要兩個重要的東西——輸入法和字體。
輸入法負責標準字碼的打出,字體負責標準字形的顯示。
現(xiàn)在市面上的輸入法一般都支持繁簡轉換,但是繁體幾乎都是按照港臺(甚至就只是臺灣)標準來做的。
或者像微軟拼音那種不知道哪兒搞的“類國標野雞轉換標準”。
我曾經還給搜狗拼音發(fā)過功能建議,當然結果是沒人搭理。
所以目前還沒有看到哪個輸入法大廠説是要支持這個。
當然,我們是可以用開源輸入法(rime)實現(xiàn)打古籍表字的目的的,原理也很簡單,加入一個簡體或者繁體與古籍表字的對照表進去就行了。在github上也有別人做的現(xiàn)成的古籍表opencc文件可用。
就是得自己折騰折騰,不太方便。
而字體方面,是有一個《古籍表》本身印刷用的方正古籍規(guī)範宋,不過一般人不怎麼好下載到,且版權字體也不好隨便使用。
除此之外,倒還有兩個免商字體,一個是我之前發(fā)的京華老宋體,還有一個是基於思源宋做的文津宋體,這兩個都可以用樣式集的方式,把字體換成古籍表標準的形式。
但是這個用法實在是略有門檻,一般人很難直接放在手機或電子書使用。
當然,抱怨這麼多問題不是説《古籍表》不好哈,這都是需要時間慢慢改、慢慢完善的。
像前兩個問題,就得靠專業(yè)人士繼續(xù)努力研究補充,而後兩個問題則需要各字體、軟件廠商去支援開發(fā)。
而我,作爲一個野生奏字人,感覺自己除了抱怨,似乎也可以做點什麼——爲其添點磚、加點瓦。
所以這次,我做了這麼一個工具包,其中就包含了輸入法和字體兩大配套設施:
工具包發(fā)佈
前搖完成,終於到了正式發(fā)佈環(huán)節(jié)。
1. 輸入法
首先是輸入法,我折騰了兩個rime輸入法方案。

一個是基於小狼毫自帶的朙月拼音修改的朙月拼音-古籍規(guī)範版,朙月拼音本來就是用的繁體詞庫,轉換起來很方便,一個字表就可以搞定。
一個是基於白霜詞庫修改的白霜拼音,這個是一個很強大的多功能簡體詞庫,支持各種符號、emoji輸入,還可以拆字輸入,對於用慣了微軟拼音拆字功能的人來説很親切。而因爲是簡體詞庫,所以除了轉換字表,還要配一個詞表,以處理那些一簡對多繁的字。
而轉換用的字、詞表的基礎都來自於github上的古籍表opencc項目,然後我根據(jù)自己使用時覺得不舒服的地方,調整了一些過於古舊的用字(纔、喫、翫之類的)的出現(xiàn)優(yōu)先級,以防默認出詞面貌看起來太老古董。
這兩個方案我試著打包弄成了可以直接安裝的exe文件,畢竟想著儘量要降低使用門檻,卽裝卽用肯定是最好的(也方便我換電腦時安裝)。就是裝的時候注意??最好別亂改安裝路徑和用戶文件夾位置,不然可能會用不了…
當然,你也可以選擇自己折騰,單獨的yaml文件和opencc文件我也有提供出來,可以用到其他旣有方案裏去。
2. 字體
然後是字體,這我老本行了,可謂輕車熟路。這次我一下做了兩種,一種黑體一種宋體。

黑體基於思源黑體改造,擴B區(qū)的字取自遍黑體
宋體基於思源宋體改造,擴B區(qū)的字取自文津宋體
得益於思源豐富的地區(qū)字形,拆拆湊湊很方便就可以改出一個古籍表版本。而關於那些部件不統(tǒng)一的字,我有選擇性地擅自進行了統(tǒng)一。

然後黑體和宋體各提供了兩個版本,一個是僅包含古籍表表內字的純古籍表版,一個是把古籍表外的——思源本來有的那些字一股腦放進去的“F”版本(當然這些表外字就沒有按古籍表規(guī)範修改,保持思源原樣)。

各位可以按需選用。日常看書寫東西可以用F版,確保不缺字。
如果要作爲做字體的參考或者煉丹的底子,就可以用純古籍表版,以免被表外字誤導。
(沒錯,其實這次弄這倆字體,本來就是作爲煉丹工具性質的
除了這倆思源改,我的竹音仿宋和東鄉(xiāng)明朝還在緩慢製作中,都是優(yōu)先基於古籍表的構型規(guī)範做的。單獨的京華老宋體古籍表版本正在調試中,後續(xù)會擇日放出(坑+1)
除了這些“魚”,我還準備了一些“漁”:我把我做字體時用到的、總結的各種字表都放在了包裏。各位做字同仁可對照這些表,把自己的國標字體改造成古籍表標準。(後面我可能也會專門開一個文章來寫下這倆具體的區(qū)別。(坑又+1))

誠然本人學識有限,不免會有錯漏之處,如使用時遇到什麼問題,望諸位能評論反饋。
費力搞這些東西不爲別的,一是填補相關領域空白,二是滿足我自己用,三是方便之後煉丹。
也希望能讓更多人瞭解並方便地把古籍表字形運用起來。
也算是進行一個拋磚引玉了吧。
好東西,支持一下(本條用工具包中輸入法輸入)