查碼程式新增了一個重要的功能:加入 Extension A/B 的字!

下載網址:
  加字加詞檔
http://liu.twbbs.org/liuzmd1/liu.box/
  字型: chweng大的網站 (注意:Vista 已有內建,不需要再安裝此字型)

這個網頁有介紹 Extension A/B 的由來,文中所提到的 擴展A區 和 擴展B區 就是 Extension A 和 Extension B。簡單來說,查碼程式加入了大概五萬個罕用字(約六萬個編碼)的拆碼,並且出了一個相對應的加字加詞檔給偽蝦使用,對於經常需要使用罕用字的人來說會很有幫助。

但是並不是每一台電腦都有裝 Extension A/B 的字型,所以很多人沒辦法看到這些字。就目前所知,Vista 的電腦可以看得到,而 XP 看不到,要另外安裝字型。不過本查碼程式是用圖片來顯示這些罕用字,所以不管你有沒有安裝 Extension A/B 的字型,都可以正常的使用查碼功能。

以下是一些查碼的範例

  • 在批踢踢的 Liu 板的 2588 篇,有人問 玄頁 這個字怎麼拆?用查碼程式查 LWTB,在右上方的 Extension A/B 裡可以看到這個字,點進去之後就可以看到這個字的拆碼,同時也附上全字庫的連結,連進全字庫之後就可以知道這個字念 ㄒㄩㄢˋ。

  • 如果有裝 Extension A/B 的字型,也可以用"複製貼上"的方法輸出 𩑹 來查碼(要有裝字型才看得到這個"玄頁")
    
  • 在批踢踢的 Liu 板的 2705 篇,有人問 金音 這個字怎麼拆?用查碼程式查 ALD ...... 沒有這個字!去 全字庫 查詢之後找到這個字的 網頁,發現這個字只有 CNS 和 EUC 的編碼, CNS: 11-4D6F 戶政EUC: 8EABCDEF 而沒有 Unicode 的編碼,所以這個字即使在 Vista 上也看不到,當然更打不出來。

  • 在批踢踢的 Liu 板的 2859 篇,有人問 奇 上面加草字頭要怎麼拆。這個字更慘,連全字庫上都沒有登錄。

  • 查碼程式也可以使用萬用字元 * 和 ?,所以也可以查 a?b 或 cb*d 之類的碼。

  • 如果只知道 CNS 編碼,也可以用此編碼來查字,例如 3-216F 或 11-212B。

  • 如果只知道 Unicode 編碼,也可以用此編碼來查字,例如 U+7C21 或 u+5229。

以下是一些可能會遇到的問題:

  1. 問:這些字的嘸蝦米碼確定都對嗎?
    答:不確定!其實應該做這個編碼的是行易公司,而行易也的確做了一個查怪字程式,只是這個查怪字程式的資料沒有公開,也沒有編入第 10 和 11 字面的字,所以我們才以個人的力量來完成 Extension A/B 的編碼。


  2. 問:編碼的時候是只有編入基本字根,還是連簡速字根都有加入?
    答:原則上是以基本字根為主,另外儘量加入簡速字根以及大量的容錯拆法。


  3. 問:很多字的編碼怪怪的,比如說這個字 ,應該是拆成 CNC 就好,為什麼還有 CDC 或 CNCL 的拆法?
    答:如上所述,我們在編碼的時候會儘量納入容錯拆法。在行易公司的查怪字程式裡,所有的「色」都有 NC 和 DC 兩種拆碼,所以我們碰到這類的字形都會「儘量」加入 D 和 N 兩種拆法。至於 巴 也是一樣,我們會儘量加入 C 和 CL 兩種拆法,即使我們明知 巴 本身就是一個字根 C。


  4. 問:可是還是有很多奇怪的編碼,比如說 怎麼會拆成 ZLOH?應該是 ZYPH 吧!中間那個字形明明比 厂 多了一筆!
    答:在嘸蝦米剛開始發展的時候,還沒有 Extension A/B 這種東西,甚至沒有 Unicode,所以一開始的字根設計在現在來看就有不少的落差。以這個字形來說,從查怪字程式裡可以看出劉先生把這樣的字形都編成 L,所以我們也把這個字形訂成 L。


    實際上還有很多類似的例子,不少罕用字長得很奇怪,單用標準字根是拆不出來的,所以行易公司在查怪字程式裡加入了大量的容錯拆法和「類比字根」!碰到這一類的字得多用一點「想像力」,多試幾種可能的拆法才比較有機會拆出來,重點不在於某一個拆碼是不是完全符合標準字根,而在於嘸蝦米使用者是否能夠很有效率的檢索到這個字。

  5. 問:如果真的對某個字的拆碼很不滿意,可以要求修改嗎?
    答:當然可以,請在該頁面的下方留下你的心得,講講你認為要怎麼拆比較好,大家可以一起討論要怎麼改。


  6. 問:如果查不到字該怎麼辦?
    答:先試著用不同的拆法試試,如果還是不行的話,到 全字庫網站 去搜尋。實際上全字庫網站裡還有一兩萬個非常罕用的字是 Unicode 裡沒有的,這些字沒辦法顯示在電腦上,也沒有辦法打出來。


  7. 問:Extension A/B 的字型要去那裡抓?
    答:我自己是安裝微軟的「新細明體套件」,這個套件在微軟的網站上已經抓不到了,不過去網路上搜尋一下,還有很多地方可以下載,比如說 chweng大的網站 。但是請特別注意,有很多人說新細明體套件的字比較醜,比如說 ChrisTorng的這篇文章;用了之後如果不滿意,請參考 這篇文章 來移除。當然,除了新細明體套件,還有很多字型可以用,就麻煩各位自行搜尋了。


  8. 問:Extension A/B 的加字加詞檔要去那裡抓?
    答:http://liu.twbbs.org/liuzmd1/liu.box/。請注意一件事,為了避免 Extension A/B 的字和原本參考檔的字衝突,我的設計是拆碼的後面都要加一個分號 ; ,也就是說要輸入這些 Extension A/B 的字,要使用像「RORF;」這樣的拆碼而不是「RORF」


  9. 問:要怎麼使用加字加詞檔?
    答:請將此加字加詞檔與偽蝦的主程式放在同一個目錄,並且確定在偽蝦裡已經啟用了加字加詞的功能。


  10. 問:使用了這個加字加詞檔之後,偽蝦啟動的速度變得很慢,這是怎麼回事?
    答:本加字加詞檔非常大,有可能使偽蝦啟動及更新加字加詞檔的速度變慢,實測的結果有可能會造成偽蝦需要35秒才能啟動,所以請自行評估是否真的要載入這麼大的檔案。我們的建議是挑選某些會用到的罕用字,再自行放入自己的加字加詞檔。


本次編碼是由批踢踢上的 Ciwx, Linpien, Solaris10 合力完成,而 CNS11643 的資料則是來自於 行政院主計處電子處理資料中心及中文數位化技術推廣基金會 的 全字庫網站。

liuzmd1 發表在 痞客邦 PIXNET 留言(6) 人氣()


留言列表 (6)

發表留言
  • 小蕭
  • 有事請教

    請問我已安裝了新細明體套件,但是還是有多字無法顯示,像KAUR的字就無法,請問此套皁有分類別嗎?
  • 這樣講,雖然 KAUR 那個字被放在「Ext A/B」的加字加詞檔裡,但是它其實不是一個真正的「Ext A/B」的字,而是一個「來自台灣的相容漢字」,這在查碼程式裡有顯示。

    這一類的字在新細明體套件裡無法顯示,所以你看不到是正常的,不用擔心。

    liuzmd1 於 2009/01/17 23:11 回覆

  • 小蕭
  • 再請教

    非常感謝您的答覆
    那請教如果我要使用此字,是否需用造字方式才能取得此字,還是有其他的辦法,請您不吝賜知,非常感謝您
  • 造字是一個方法,而最根本的方法是找一個支援這些字的字型,不過我從來沒認真去找過那個字型可用就是了。

    來自台灣的相容漢字,英文是"CJK Compatibility Ideographs Supplement",google 了一下,網路上應該可以找得到一些可用的字型,就請您自己試一下了。

    liuzmd1 於 2009/01/20 19:43 回覆

  • 小蕭
  • 非常感謝

    非常感謝您!
  • plart
  • 7.0版要如何如入Extension A/B

    請問xp上用7.0版要如何加入Extension A/B?

    又其他字型要到那裡下載?(個人認為標楷體較好看。)
  • 這篇文章一開始就有寫了,去 chweng大的網站 http://blog.chweng.idv.tw/archives/221 下載 extension a/b 的字型,有沒有其他的字型我就不曉得了。

    liuzmd1 於 2009/04/27 15:27 回覆

  • 小蝦米
  • 5 問:如果真的對某個字的拆碼很不滿意,可以要求修改嗎?
    版主好,使用嘸蝦米也好多年了,最近剛好在練簡碼,無意中發現某字的拆碼,令我不是很滿意,剛好提出來討論一下,「門」這個字有兩種拆法「MI」及「MY」,
    「MI」為建議碼,「MY」為簡體字的拆法。嘸蝦米有一字多拆的功能,然而在兩碼快速字表中,同一個字使用到兩種拆法,我覺得是種浪費及多餘。
    而兩碼字的編碼中「講」「構」拆碼分別為「IY」「TY」,有個字也滿常會打到,就是我想提議變更的字「購」
    為什麼這個字不用「MY」呢?「冓」這個部首為簡速字根「J」,所以「購」的簡速拆法為「MBJ」。
    「門」字己有建議碼「MI」了,為何不把門「MY」的拆法從兩碼快速字表拿掉,
    而把「MY」的拆法給「購」,這樣個人感覺會更好。

    (不知道我這些話,行易公司的人會不會看見 XD)
  • 應該是不會看見... 畢竟這裡只是查碼程式的部落格,你應該直接打電話到行易公司去反應。

    liuzmd1 於 2009/11/20 11:10 回覆

  • 小蕭
  • 增加新功能

    請教:嘸蝦米於2010/1.有更新7.06版,請問又增加何功能?