明快打字機(一)── 上下形檢字法規則整理
簡介
雖然說上下形檢字法是明快的前身,按林太乙所寫《林語堂傳)中所述,明快打字機是於一九四七年五月二十二日對公眾發表。而上下形檢字法的,是記於1970出版的林語堂《當代漢英詞典》中的。故此,應為林語堂將其明快打字機的檢字方式加以改良,成為上下形檢字法。下文先引述林語堂於封面內面中的說明,再說明這些規則實際的取碼情況。
上下形檢字法
所有的字,取其上下,沒有例外。
上下形一共33個,分為十類,即「了十廿三四五六七」等本來形體。
1.只按位置取碼
只按形狀在字的高低取碼,與筆順無關。
2.左右結構
字可為截然為左右名為S;不可截然分左右者名為NS(輸入法中記為N)。
3.五十部首
康熙214部首,取其常用者50,其餘盡併為S類,部首必在上形,不在上形者,仍為S類。警上形卄(20)不在言部,漿上形𠃊(21)不在水部。
4.餘形上部
同上下形之字,以餘部上形為次序。
對上述規則的說明
只按位置取碼
- 一般程況是先論上下,再論左右。
- 「辵、廴」部的上形一律按右邊部件的左上角取碼,即視作「辶」較右方部件為低,而書中字體兩者為平齊)。例「造」取碼10.83,不應取63.83。
- 是否應和倉頡相同,有多種取形方式時保留筆劃轉角的字根有待相確。保留筆劃轉角的例子:「七」應作10.70,而非30.70(有70.70的容錯碼),「干」應作31.10,而非30.10。反例:「力」作91.50,不作12.50。
左右結構
依傳統形式分割,左右兩者有可獨立成字時分割較好,例:「北」應作22.70,而非22S.70。大多情況下都有容錯碼。
五十部首
- 大致上和鄭碼的第一主根類似,或倉頡的複合字類似,實際上和部首概念沒有大關係。下文稱之為輔根。
- 部首字本身需單獨拆碼。例如「木」應作10.01,而非10B.00。大多情況下都有容錯碼。反之,「心」可作72.72,而不需另外再取。
餘形上部
- 與四角字碼的附角形式相似。
- 一般只有帶附根的字,和左右分割的字帶附碼。即「ABCDS」帶附碼。
- 非左右分割的字中, 只有「囗、風、匚、鬥、門、亠𧘇、鬼」帶有輔碼。
- 「廴、辶、是」等字沒有輔碼。
- 附碼相同的字按筆劃排列。
- 同樣00-02不會組成上形,即沙應為63A.91-2,而非63A.91-0。
推行困難的原因
重字率高
相比起四角號碼檢字法,上下形檢字法只用了五個字元來表示兩個字形特徵,即使是加上輔根和附角的重碼率亦相當高。加上沒有使用像四角一樣避免「囗、門、鬥」(由整個「囗」「門」「鬥」組成的字(不包括這三個字自身),下方取內部的筆。)重碼的方式,因此引致大量重碼。特別是「門」部,雖然有輔根「52B 門」,但所有門部字下形都是折鈎,即故此「門」部的所有字編碼都是「52B.00」。考慮到「52.00」只收了一個字「擘」,即設立了52B這個輔根卻只避免了和一個字的重碼,設置相當不合理。
對半包圍的處理不統一。
對於半包圍的字,上下形有三種處理手法:
一.視作右方部件較高,先取右方部件的碼。(廴、辶)
例:迴 41.83 延91.83
二.和正常字的處理方式一樣,先取左方部件的碼。(風、麥、毛、鼠)
例:麵 10.83 颱42.70 毯90.70 鼦90.70
兩種處理方法都有其不當之處,方法一打破了取左上的原則,而且沒有了餘形上部,不能再再字形切割,沒有了附碼。方法二引致內部部件的碼沒有被取,引致大量重碼,可謂不合理。
總結
由於只取上形和下形兩碼的關係,故此使這檢字法更像是基於部首檢字法的升級版,對於難檢字和大量字庫時見顯得力不從心。故此連中文大學的當代漢英字典都不支持使用上下形檢字法,落入洪流之中是無何奈何的事情。
明快打字機作為中文輸入法的先騎,假若可以借現今電腦技術將其複刻,不失為一件美事,但我在調查時卻發現網上對明快打字機的編碼規則沒有詳細的描述,假若有意複刻明快打字機的可以聯繫我。
延伸閱讀
Mullaney, T. S. (2018). The Chinese typewriter: a history. MIT Press.
Tsu, J. (2011). Lin Yutang’s Typewriter. Sound and Script in Chinese Diaspora, 49–79. https://doi.org/10.2307/j.ctvjnrskk.7