怎樣通過漢字查詢西夏字

我發現很多朋友想通過漢字查詢同義的或同音的西夏字,卻不知道怎麼查,這裡就寫個教程。

比如,想查詢“一”的對應西夏字,只要在漢字查詢那一欄輸入漢字“一”,然後回車,查詢“一”的解釋。然後在“其他語言”那一欄就可以找到對應的西夏字。“同義西夏字”指的是意思相同的西夏字,而“同音西夏字”指的是讀音相同的西夏字。如果沒有查到,則表明您查找到漢字沒有對應的西夏字!

鑑於很多人需要的都是人名的翻譯,這裏解釋一下人名翻譯可能遇到的問題。一般情況下翻譯人名、地名都採用音譯。所以如果需要翻譯的漢字並沒有對應的同音西夏文(表音的西夏文),可以採用同音的漢字翻譯。比如:“嘉”並沒有對應的同音西夏文,這時候便可以查詢和“嘉”同音的字,如:“加”。這個字倒是有同音西夏文。若要更嚴謹一些,可以考慮查詢和“嘉”在《廣韻》中相同小韻的漢字,這樣這些字的中古音都比較接近,翻譯出來更加嚴謹。

 

西夏文輸入法的設計(一):困難之處

一直都很想做一個西夏文輸入法,因爲網上找不到一個能用的西夏文輸入法。以前看到一個叫“中華西夏文處理系統”的輸入法,據說是根據鄭碼設計的,可惜部提供下載。我最討厭這種部提供下載的東西,所以只能自己設計一個西夏文輸入法。

首先遇到的第一個問題是編碼設計。我們有五筆輸入法、倉頡輸入法、鄭碼輸入法等漢字輸入法。這些輸入法的取碼方法都不同、重碼率也各有高低。比如倉頡的重碼率就比五筆低,這根編碼的取碼的方法有關。所以怎樣取碼西夏文就顯得格外關鍵。

根據維基百科所述:

“由於本以漢字檢索為目的,倉頡取碼依據視覺辨識原理,能反映漢字的細微特徵,幾乎所有不同字形或異體字,都有不同的編碼,因此重碼率為當今中文輸入法最低者……”

注意,這裏提到倉頡輸入法”能反映漢字的細微特徵”,這點格外關鍵,因爲西夏文筆畫繁雜,有些時候差一筆字就不同,所以怎樣反映“西夏文的細微特徵”則成爲西夏文輸入法編碼設計的關鍵所在。我曾經想根據倉頡輸入法的編碼給西夏文取碼,可是才取碼100個字就發現重碼率很高,不難想象這麼設計後6000多個的西夏字的重碼率會有多高。所以倉頡編碼行不通。《夏漢字典》是根據四角號碼進行檢字的,如果根據四角號碼來設計西夏文輸入法重碼率也不低,所以也行不通。

第二個問題是西夏文的正字還沒有確定,也就是說我們不知道每個西夏字的準確寫法是什麼。最新版《簡明夏漢字典》和老版《夏漢字典》在字形上就有很多不同,對照《同音》後我就更迷惑了。而《同音》的不同版本對於同一個字也有不同寫法。比如有些字在《同音》的某個寫本中有“橫折撇”這一個筆畫,在其他寫本中則編成了一橫和一撇兩個分開的筆畫。所以我猜測在設計西夏文輸入法時“橫折撇”和一橫加一撇必須用同一個編碼。如果每個西夏字的準確寫法沒確定,西夏文輸入法則很難設計。

第三個問題是西夏文還沒被unicode收入,目前能用的西夏文字體不多。本網站採用的西夏文字體是基於今昔文字鏡的西夏文字體修改而來的。而今昔文字鏡收入的的6000多個西夏字則分佈在兩個字體文件裏。我一直不明白爲什麼非得要兩個文件才夠,一個就不夠嗎?希望unicode早日收入西夏文,不然西夏文映射到漢字的分區上也不是個解決辦法。

目前我的想法是對6000多個西夏字進行拆分分析,整理出常見的偏旁、部件、結構,然後對每個結構取碼。這個計劃的工程量巨大,不過好在已有前輩做過此類的工作,我就直接採用他們的分析結果,希望能對西夏文輸入法的取碼設計有所幫助!

 

說說九疊篆

前幾天看到一則新聞“泉州惠安一闽南古厝门联现神秘文字 字体难辨认”,大概是說惠安一個古厝的大門上有一副令人看不懂的對聯,如下圖顯示:

畏天之威,畏聖之言
畏天之威,畏聖之言

根據專家考證,該對聯寫的是”畏天之威,畏聖之言”,語出《論語 季氏》:“君子有三畏:畏天命,畏大人,畏聖人”,字體類似九疊篆。根據記者調查,該對聯屬一老華僑劉春江家,爲其家訓。從文字的角度來說,該對聯只能稱作疊篆,而不是九疊篆,因爲九疊篆中的折更多。

疊篆大概起源於宋金時期。所謂疊篆就是爲了使官印更加丰滿,增加官印的圖案效果,將篆體字的筆畫反覆曲折、折疊而成的篆書字體。從唐以來的官印來看,疊篆是從繆篆發展來的。唐宋印的疊篆在轉折處大多爲圓弧狀,還帶有小篆的痕跡,而到了遼金時期的疊篆,轉折處多化方爲圓,重疊數量增多。元代的官印是從金代發展來的。明代的官印繼承元代的疊篆,對於疊數有嚴格的規定,而明代之前的疊篆則沒有統一的標準。

靖康之變後,北宋印璽被劫,官印多散失民間,現存世的不多,如“內府圖書之印”,其中”之”字十三疊,“印”字九疊,都是筆畫少的字被多次重疊。

內府圖書之印
內府圖書之印

再如“中書門下之印”,中書門下爲中央官署。

中書門下之印
中書門下之印

實際上,宋朝的疊篆僅限於皇帝璽印、爵位印、中央官署和京師衙役。只有少量官印中有疊筆,疊數爺不多。金代開始官印多用疊篆,如“元帥府印”、“都元帥府之印”、“元帥監軍之印”、“興安西北等路元帥府印” 、“都統之印”、“副統之印” 、“山東路副統軍之印”、“万戶往字号印” 等。

元帥之印
元帥之印
都元帥府之印
都元帥府之印
元帥監軍之印
元帥監軍之印
興安西北等路元帥府印
興安西北等路元帥府印
都統之印
都統之印
山東路副統軍之印
山東路副統軍之印
萬戶往字号印
万戶往字号印

金代的所有官印都有疊筆,但不一定每一個字都有疊筆。如“山東路副統軍之印”中的“印”字沒有疊筆。由於宋金時代的疊筆制度記載有限,根據推測,疊筆之法有幾種:如直線變曲線。通過對直線加曲,使簡單、稀疏的筆畫變複雜、稠密。採用俗體字,如“万戶往字号印”中的“万“是“萬”的俗體字,“号“是“號”的俗體字。這是因爲有些筆畫複雜的字沒有空間加疊,故採用其俗體寫法。張金梁的《明代朝廷印璽研究》中提到了明代九疊篆的疊法有三種情況:

“一是独体字及上下、上中下结构的字,从上至下必须要有九条横出现;二是左右、左中右结构的字,视具体情况,可以各部皆九叠,最少其中有一部为九叠。左右结构者一般以笔画多的主要部分为九叠,左、中、右结结构者,则多以中部为九叠,左右两部可按自然和谐的形体进行安排;三是极个别左右结构不好处理的字,便采取左右两部分横画层数相加为九来表现……不是朝廷官员者,不遵“九叠篆”官印规定,每字叠数不定,都在十叠以上,不知是否寓有凌驾于百官之上之意……”

黃貴妃圖書
“黃貴妃圖書”,沒有遵守“九疊篆”官印規定
黃妃醮印
“黃妃醮印”,也沒有遵守“九疊篆”官印規定
如来大寶法王之印
“如来大寶法王之印”,其中“法”字左右相加爲11疊

雖然宋代的疊篆未能成爲官印格式,卻成爲了同時期的遼、西夏的官印格式。由於契丹文、西夏文是基於漢字筆畫設計的,特別是許多契丹字是直接根據漢字刪減或增加筆畫製成,故其印文也採用疊篆。如西夏文“首領印”,印文白文,西夏文,右起橫讀。印背刻西夏文款“首領,正德二年”。正德爲西夏崇宗年號,正德二年爲公元1128年。

西夏首領印
西夏首領印
西夏首領印
西夏首領印
西夏首領印
西夏首領印

同樣地,遼代也有印文爲契丹文的疊篆印。由於契丹文尚未被完全破解,加上我們不了解正體契丹文與疊篆寫法,因此很多契丹文疊篆印的內容只能識別出一部分,甚至完全不能識別。

文物 1983.08 p.82.
六院?之印,1965年出土與内蒙古自治區赤峰市翁牛特旗,現藏於赤峰市博物館
六院?之印
六院?之印

這枚疊篆印有兩列共5個契丹大字,右列2個字、左列3個字。有意思的是,在所有存世的契丹文印中,這可能是唯一一個印文內容在印章的側邊以正體契丹文的形式又被重複刻了一遍的契丹文印:

側邊楷體契丹文
側邊楷體契丹文

(可點擊上面的契丹大字查看具體解釋)

根據側邊的楷體契丹文,我們得知此印的內容是“六院?之印” *[?] uru [?]-un doro,中間那一個不識的字可能是六院的某位官員的官職。

無獨有偶,元代國師八思巴創造的八思巴文也有疊篆寫法及疊篆印。如至元十六年中書禮部造“侍衛軍副都指揮使印”及“通領釋教大元國師 ꡉꡟꡃ ꡙꡞꡃ ꡚꡞ ꡂꡨꡓ ꡈꡗ ꡝꡧꡦꡋ ꡂꡟꡠ ꡚꡜꡞ”(需安裝八思巴文字體方可見)。

侍衛軍副都指揮使印
侍衛軍副都指揮使印
通領釋教大元國師
通領釋教大元國師 ꡉꡟꡃ ꡙꡞꡃ ꡚꡞ ꡂꡨꡓ ꡈꡗ ꡝꡧꡦꡋ ꡂꡟꡠ ꡚꡜꡞ

八思巴文爲拼音文字,是基於藏文字母創造的,而八思巴文印章則是模仿漢字疊篆進行加疊,因此酷似漢文。以下是正體八思巴文及疊篆八思巴文的對比。

正體八思巴文
正體八思巴文
Screen Shot 2014-10-15 at 1.45.53 AM
疊篆八思巴文

疊篆不僅僅出現在官印上,更出現在錢幣上。例如底下這枚九疊篆“本命元神”花錢。由於九疊篆僅限於官方使用,加上這枚九疊篆錢帶有明顯的官方色彩和權威性,因此很可能是宮廷用作賞賜之物。

本命元神
本命元神
本命元神
本命元神

再如這枚宋仁宗鑄九疊篆“皇宋通寶”,雖難辨真僞,但由於存世數量稀少,因此非常珍貴。

皇宋通寶
皇宋通寶

還有這枚“大安通寶”,可能是西夏錢,難辨真僞。

大安通寶
大安通寶

古今文字集成簡介

古今文字集成上線于2014年8月。我做這個網站的初衷是創建一個能夠給廣大網友提供一站式中文信息查詢服務的網站。現有的類似網站有很多,如:

等等等等……這些網站各有所長,有的能提供關於字詞甚至成語的詳細解釋,但缺乏漢字字形演變及讀音演變之類的信息;有的專注于音韻方面的資訊;有的則專注于某一本辭書字典的解釋,如《康熙字典》、《說文解字》。古今文字集成則是彙集了目前電腦裡能通過字體顯示的所有漢字的各類信息,包括解釋、字源、音韻等,兼彙集了類似漢字的契丹字、西夏字、女真字的各類信息(收集整理中,還未上線)。

這個博客主要發佈網站的更新信息及各類語言文字的專業資料及研究。請大家多多支持,謝謝!!