漢字缶プロジェクト


目的

JIS X0213:2004(以下JIS漢字2004)を利用したい、あるいは、いずれ利用しなくてはならなくなる。
インターネットの電子図書館青空文庫明日の本棚をはじめ、数多くのJIS漢字2004プロジェクトが既に存在しています。また、BTRONをベースとしたOS 超漢字では、もっと多くの文字を取り扱うことができます。多くは、フォントなどの表示環境まで含めた実用的な形になっています。
漢字缶プロジェクトでは、現在、入手容易な環境で、表示にはこだわらずに、漢字のコードについての情報を蓄積することを目的としています。JIS漢字2004の情報が完成した後も、次世代の漢字規格が発表された場合に、先行してコード情報を準備しておくことが、このプロジェクトの目的です。

現在の実行環境

Microsoft ® AccessのMDBにデータを格納しています。他の形式も検討しましたが、現時点ではこの形式で配布します。
Microsoft ® Accessを購入しなくても、無償のRuntimeを入手すれば、データの参照および更新については可能です。Runtimeの入手方法は、追って掲載する予定です。(*1)

なにができるの?

  1. 使ってみる
  2. ダウンロードして使ってみてください。使い方はあなたの自由です。
  3. 参加してみる
  4. 「莫迦だな〜。こんな間違いがあるよ。」なんてことを見つけたら、教えてください。反映させていただきます。ただし、修正したMDBの形で返送しないでください。「ここ」が間違えているよと指摘してください。報告の書式は追って掲載させていただきます。(*2)当面は自由書式でお願いします。
    ライセンスはこれがいいとか、Tableの構造はこう変更した方がいいなどというアドバイスも受け付けています。ただし、漢字の読みや意味についての情報を追加する予定はありません。MDBの巨大化を防ぐため、必要とあれば別MDBとして作成する可能性はあります。
  5. 広めてみる
  6. 漢字コードについての情報が必要だけれども、適当な情報元がなくて困っている人に教えてあげてください。皆が無駄な作業が減って幸せになれます。たぶん…

使い方

zip形式で圧縮した、MDBおよび関連ドキュメントを配布します。
展開した上、ご利用ください。

2005/07/30公表の事情
おりしもβ1が公開されたMicrosoft ® Windows Vista ™では、Unicode3.2対応フォントに対応し、自然JIS漢字2004へ対応されるそうです。
マイクロソフト:新OSで漢字148字変化 非表示混乱も(毎日新聞)
という記事が今日の朝刊に掲載されたこともあり、水面下ですすめてきたプロジェクトを、急遽公開することにしました。

ライセンスも検討中の段階ですが、未定です。いずれにせよ、勝手に使って構わないよという立場ではあります。ただし、使ったことで損害が発生したからって訴えないでねという状態を整えるために、できれば既存のオープンなライセンスの中から選んでいこうと考えています(例:Creative Commons)。
ダウンロード(α版0.10)

底本および参照資料

JIS X 0208:1997 7ビット及び8ビットの2バイト情報交換用符号化漢字集合
JIS X 0213:2000 7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合

* JIS X 0213:2004 7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合 に対応中

増補改訂 JIS漢字字典 芝野耕司 編著 ISBN4-542-20129-5
JIS漢字字典 芝野耕司 編著 ISBN4-542-20127-9


kojiiso@kt.rim.or.jp
©2005 Kanjikan Project, All rights reserved.