Canna


かな漢字変換サーバ かんな



オープンソースは世界中のハッカーによって開発が続けられている。 かな漢字変換用の辞書やソフトウェアも、世界中のかな漢字変換ユーザ (=日本人?)によってオープンなスタイルで開発が続けられていくべきである。

dotplan: 既存のフリーな辞書への差分を作る。 スクリプトやGUIツールはGPLで作成する。辞書はSKK等のGPL辞書へのcommitを 考慮してPublic Domainとする。したがってツール群はレッドハット社内で 開発できるが、辞書は個人的な作業だけとする。
  1. 単語辞書を作る。
  2. 郵便番号辞書の変換スクリプトを作る。(完成)
  3. 電話帳を買ってきて人名辞書の完璧なものを作る。(可能らしい)
    →これは、全国の電話帳400冊をOCRでスキャンして作成する必要がある。
      NTTは電話帳の電子データ化は時代の要請であると認識しているのでそのうち
      電話帳のCD-ROMが発行されるでしょう。それまではムリ。
    
  4. SKKの辞書からのコンバータを作る。
  5. GTK+ベースのGUI辞書ツールを作る。(当然ですね)
  6. さまざまな方言の文法を解説したサイトを参照しつつ、各種方言に対応する。
  7. かんなのさまざまな設定もMS-IMEのようにGUIでできなければならない。
  8. jisx0213, Unicodeにも対応できなければならない。
  9. Googleのヒット件数を基にして頻度情報を自動的に作成するツールを作る。かんなの頻度情報はたしか256段階だから総件数で割って256掛けとけばいいだけ。オライリーの「Google Hacks」をもっとよく読まねば。
けっこう野心的な計画だな。まあムリ。
とりあえずリンクから:

かんな辞書(拡張版)
Cannaサポート辞書 - 子音(シオン)
『かんな』の部屋
かんな指南
かんなのお話し
かんなプロジェクト

かんなの郵便番号辞書はかんなに統合されました。
かんな辞書 - Public Domain

現在の辞書: pubdic-bonobo-20021025.tar.bz2


現在のステータス:
Yukihiro Nakai <nakai at gnome.gr.jp>