目前日期文章:200709 (5)

瀏覽方式: 標題列表 簡短摘要

嘸蝦米查碼程式加入符號表以及 bug 修正

  • 加入「符號表」

    前兩個禮拜寫了一篇有關於符號輸入的文章,也得到了一些回應。在此我花了一點時間把官蝦、偽蝦的符號重新整理一次。

    最終的結果我放在蝦米族樂園的網頁上,同時也在查碼程式最上方提供這個連結,請參考 http://liu.twbbs.org/liuzmd1/manual/symbol.html

  • 修正有關於查碼字串含有 [ ] ' 的 bug。
  • 修正 big5 日文有問題的部份。

liuzmd1 發表在 痞客邦 PIXNET 留言(0) 人氣()

有人在批踢踢上問「嘸蝦米打得出 這個符號嗎?」
先講結論,嘸蝦米打不出這個符號,但是如果有人要用的話,可以自己加字加詞,當然,我說的是用偽蝦加字加詞,除非你有買嘸蝦米 6.0。

結論講完了,以下是討論的部份。首先請參考這個網頁

http://zh.wikibooks.org/w/index.php?title=Unicode_2000-2FFF&variant=zh-tw

這一頁列出了一大堆各式各樣奇奇怪怪的符號,而在嘸蝦米裡面有編了一些這樣的符號,但是沒有編得很全。舉例來說,

U+2016 這個符號 (先看左邊的 2010 對到上面的 6 就是 U+2016)在嘸蝦米裡面有編碼 http://liu.twbbs.org/_Cv

但是 U+2017    在嘸蝦米裡面就沒有被編進去

再舉一個例子,這個正方形框框裡打一個勾的符號 ,unicode 編碼是 U+2611(左邊找到 2610,對到上面的 1),沒有被編進嘸蝦米裡面。

實際上,從 U+2610 到 U+2619 都沒有被編進嘸蝦米裡,但是,同一排的 U+261A    就有編 http://liu.twbbs.org/_IU

實際上,這是我們多年以來的大疑問,

1. 為什麼行易要這麼辛苦的為這些符號編嘸蝦米碼?有多少人會想用嘸蝦米來打這些稀奇古怪的符號?真的有必要嗎?

2. 既然要編這些符號的嘸蝦米碼,為什麼不編齊?結果有的有編碼,有的沒編碼!

3. 既然編了這些符號,為什麼不好好宣傳?嘸蝦米書上沒有把所有有編碼的符號列表下來,網站上也沒寫。講難聽一點,如果這世界上沒有嘸蝦米查碼程式,如果我現在沒有寫這篇文章,有幾個人會曉得 http://liu.twbbs.org/_Ic 這個符號 可以用嘸蝦米打出來?

4. 有時間去編那些符號,為什麼不把「中日韓漢字字符區」裡面沒編進嘸蝦米 5.7b 的一千多個字給補齊?(所以才有後來的補破網)吔 顯然比 http://liu.twbbs.org/_Iv 要來得常用多了。

liuzmd1 發表在 痞客邦 PIXNET 留言(0) 人氣()

*** 本篇對於 「Firefox toolbar 線上查碼」的介紹原本是由 PTT BBS 的 ledia 板友
*** 所發表,原文請進 PTT BBS 的 liu 板,在精華區的 9 -> 24 可看到。

*** 由於 ledia 板友在寫那篇文章的時候,我們的查碼程式還是舊版的,所以他的文章
*** 裡有一些資料必須稍作修正。我取得了 ledia 板友的授權,
***
***     姓名標示-非商業性 2.0 台灣
*** Attribution-NonCommercial-ShareAlike 2.0 Taiwan
***
*** 而得以修改他的文章,並且散佈他所製作的 boshiamy.png。另外要特別說明的是,
*** 我把 ledia 板友作的 boshiamy.png 改放到蝦米族樂園來,以免當他某一天離開學
*** 校的時候,這個圖片就失傳了 :)
***

這篇文章是寫給所有使用 Firefox (火狐) 的蝦友,如果您有查碼的需求,但是不想每次都連到我們的網頁來查碼,您可以試著使用 Firefox 內建的搜尋模組(右上角那個文字區),來「搜尋」我們的查碼網頁!

用法:
  1. Firefox 2.0(含)以上的使用者請下載 boshiamy.xml   
    舊版本的 Firefox 1.x 使用者請下載 boshiamy.pngboshiamy.src
  2. 使用 windows 的人請把下載的檔案存到 Firefox 目錄的 searchplugins 資料夾,例如  C:\Program Files\Mozilla Firefox\searchplugins\
  3. 使用 Unix 的人,請以 root 或有安裝程式的權限,將檔案存到 firefox 目錄的 searchplugins 下, 例如 /usr/X11R6/lib/firefox/lib/firefox-1.0/searchplugins/
  4. 拷貝完之後重開 firefox, 右上角就可以選擇"米"字樣查碼(小技巧: ctrl + 上 或 ctrl + 下可以切換搜尋引擎),試著打個字進去(例如 "嘸")並且按 Enter,如果有顯示出該字的拆碼就成功了。
  5. 想多了解 Firefox 的搜尋引擎嗎?請參考 Mozilla Taiwan 的網頁

liuzmd1 發表在 痞客邦 PIXNET 留言(0) 人氣()

查碼程式作了一些改變:
  • 查 Extension A/B 的字,會給出這個字的大圖,以便能清楚看出這個字長什麼樣子。

  • 之前沒有注意到 +RSFWLCB 的選字模式是從 5.0 版才開始,現在修正了這個錯誤。(加 V 選字是本來就有的)

  • 查字的時候,如果有蝦米心得,原本的作法是在額外資訊的地方出現一個 本頁最下方有蝦友心得。現在這句話後面會加一個 (點這裡),點下去之後可以直接跳到心得的地方,不需要再用滑鼠拉。

  • 再次改變了查碼頁短網址的格式。

  • 程式碼的小小修改。

liuzmd1 發表在 痞客邦 PIXNET 留言(0) 人氣()

查碼程式新增了一個重要的功能:加入 Extension A/B 的字!

下載網址:
  加字加詞檔
http://liu.twbbs.org/liuzmd1/liu.box/
  字型: chweng大的網站 (注意:Vista 已有內建,不需要再安裝此字型)

這個網頁有介紹 Extension A/B 的由來,文中所提到的 擴展A區 和 擴展B區 就是 Extension A 和 Extension B。簡單來說,查碼程式加入了大概五萬個罕用字(約六萬個編碼)的拆碼,並且出了一個相對應的加字加詞檔給偽蝦使用,對於經常需要使用罕用字的人來說會很有幫助。

但是並不是每一台電腦都有裝 Extension A/B 的字型,所以很多人沒辦法看到這些字。就目前所知,Vista 的電腦可以看得到,而 XP 看不到,要另外安裝字型。不過本查碼程式是用圖片來顯示這些罕用字,所以不管你有沒有安裝 Extension A/B 的字型,都可以正常的使用查碼功能。

以下是一些查碼的範例

  • 在批踢踢的 Liu 板的 2588 篇,有人問 玄頁 這個字怎麼拆?用查碼程式查 LWTB,在右上方的 Extension A/B 裡可以看到這個字,點進去之後就可以看到這個字的拆碼,同時也附上全字庫的連結,連進全字庫之後就可以知道這個字念 ㄒㄩㄢˋ。

  • 如果有裝 Extension A/B 的字型,也可以用"複製貼上"的方法輸出 𩑹 來查碼(要有裝字型才看得到這個"玄頁")
    
  • 在批踢踢的 Liu 板的 2705 篇,有人問 金音 這個字怎麼拆?用查碼程式查 ALD ...... 沒有這個字!去 全字庫 查詢之後找到這個字的 網頁,發現這個字只有 CNS 和 EUC 的編碼, CNS: 11-4D6F 戶政EUC: 8EABCDEF 而沒有 Unicode 的編碼,所以這個字即使在 Vista 上也看不到,當然更打不出來。

  • 在批踢踢的 Liu 板的 2859 篇,有人問 奇 上面加草字頭要怎麼拆。這個字更慘,連全字庫上都沒有登錄。

  • 查碼程式也可以使用萬用字元 * 和 ?,所以也可以查 a?b 或 cb*d 之類的碼。

  • 如果只知道 CNS 編碼,也可以用此編碼來查字,例如 3-216F 或 11-212B。

  • 如果只知道 Unicode 編碼,也可以用此編碼來查字,例如 U+7C21 或 u+5229。

以下是一些可能會遇到的問題:

  1. 問:這些字的嘸蝦米碼確定都對嗎?
    答:不確定!其實應該做這個編碼的是行易公司,而行易也的確做了一個查怪字程式,只是這個查怪字程式的資料沒有公開,也沒有編入第 10 和 11 字面的字,所以我們才以個人的力量來完成 Extension A/B 的編碼。


  2. 問:編碼的時候是只有編入基本字根,還是連簡速字根都有加入?
    答:原則上是以基本字根為主,另外儘量加入簡速字根以及大量的容錯拆法。


  3. 問:很多字的編碼怪怪的,比如說這個字 ,應該是拆成 CNC 就好,為什麼還有 CDC 或 CNCL 的拆法?
    答:如上所述,我們在編碼的時候會儘量納入容錯拆法。在行易公司的查怪字程式裡,所有的「色」都有 NC 和 DC 兩種拆碼,所以我們碰到這類的字形都會「儘量」加入 D 和 N 兩種拆法。至於 巴 也是一樣,我們會儘量加入 C 和 CL 兩種拆法,即使我們明知 巴 本身就是一個字根 C。


  4. 問:可是還是有很多奇怪的編碼,比如說 怎麼會拆成 ZLOH?應該是 ZYPH 吧!中間那個字形明明比 厂 多了一筆!
    答:在嘸蝦米剛開始發展的時候,還沒有 Extension A/B 這種東西,甚至沒有 Unicode,所以一開始的字根設計在現在來看就有不少的落差。以這個字形來說,從查怪字程式裡可以看出劉先生把這樣的字形都編成 L,所以我們也把這個字形訂成 L。


    實際上還有很多類似的例子,不少罕用字長得很奇怪,單用標準字根是拆不出來的,所以行易公司在查怪字程式裡加入了大量的容錯拆法和「類比字根」!碰到這一類的字得多用一點「想像力」,多試幾種可能的拆法才比較有機會拆出來,重點不在於某一個拆碼是不是完全符合標準字根,而在於嘸蝦米使用者是否能夠很有效率的檢索到這個字。

  5. 問:如果真的對某個字的拆碼很不滿意,可以要求修改嗎?
    答:當然可以,請在該頁面的下方留下你的心得,講講你認為要怎麼拆比較好,大家可以一起討論要怎麼改。


  6. 問:如果查不到字該怎麼辦?
    答:先試著用不同的拆法試試,如果還是不行的話,到 全字庫網站 去搜尋。實際上全字庫網站裡還有一兩萬個非常罕用的字是 Unicode 裡沒有的,這些字沒辦法顯示在電腦上,也沒有辦法打出來。


  7. 問:Extension A/B 的字型要去那裡抓?
    答:我自己是安裝微軟的「新細明體套件」,這個套件在微軟的網站上已經抓不到了,不過去網路上搜尋一下,還有很多地方可以下載,比如說 chweng大的網站 。但是請特別注意,有很多人說新細明體套件的字比較醜,比如說 ChrisTorng的這篇文章;用了之後如果不滿意,請參考 這篇文章 來移除。當然,除了新細明體套件,還有很多字型可以用,就麻煩各位自行搜尋了。


  8. 問:Extension A/B 的加字加詞檔要去那裡抓?
    答:http://liu.twbbs.org/liuzmd1/liu.box/。請注意一件事,為了避免 Extension A/B 的字和原本參考檔的字衝突,我的設計是拆碼的後面都要加一個分號 ; ,也就是說要輸入這些 Extension A/B 的字,要使用像「RORF;」這樣的拆碼而不是「RORF」


  9. 問:要怎麼使用加字加詞檔?
    答:請將此加字加詞檔與偽蝦的主程式放在同一個目錄,並且確定在偽蝦裡已經啟用了加字加詞的功能。


  10. 問:使用了這個加字加詞檔之後,偽蝦啟動的速度變得很慢,這是怎麼回事?
    答:本加字加詞檔非常大,有可能使偽蝦啟動及更新加字加詞檔的速度變慢,實測的結果有可能會造成偽蝦需要35秒才能啟動,所以請自行評估是否真的要載入這麼大的檔案。我們的建議是挑選某些會用到的罕用字,再自行放入自己的加字加詞檔。


本次編碼是由批踢踢上的 Ciwx, Linpien, Solaris10 合力完成,而 CNS11643 的資料則是來自於 行政院主計處電子處理資料中心及中文數位化技術推廣基金會 的 全字庫網站。

liuzmd1 發表在 痞客邦 PIXNET 留言(6) 人氣()