freewnn: Wnn/manual/intro annotate

annotate Wnn/manual/intro @ 2:b605a0e60f5b

- reverted jdata.h - fixed the bug which occurred on changing length of bunsetsu.

author	Yoshiki Yazawa <yaz@cc.rim.or.jp>
date	Thu, 13 Dec 2007 17:42:01 +0900
parents	bbc77ca4def5
children

rev	line source
0 bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	2 ＷｎｎＶ４について
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	3
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	4 ０，序
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	5
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	6 Ｗｎｎのバージョン４について、バージョン３からの変更点を中心にまとめて
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	7 おきます。一応、バージョン４．０について述べますが、これからのバージョ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	8 ンアップでどのようなことが計画されているかといったことも述べます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	9
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	10 変更点は、主に、次の４つの領域に分けられます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	11
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	12 (1) 変換
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	13 (2) 辞書
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	14 (3) ライブラリ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	15 (4) アプリケーション
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	16
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	17 (1) 変換アルゴリズムの改良は、今回のバージョン・アップの中心課題でした。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	18 これまで、Ｗｎｎでは、接頭語、接尾語、助数詞などに対する処理があまいこ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	19 とが指摘されてきました。これを解決するために、今回のバージョンでは、大
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	20 文節という概念を導入し、接頭語、接尾語、助数詞などを、本体となる文節と
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	21 合わせて一つの大文節とみなして変換を行ないます。これについては、後で詳
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	22 しく述べます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	23
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	24 (2) 辞書に関しては、以下の点について変更されました。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	25 ●辞書の読みに、2 バイトコードを許す。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	26 ●自立語の品詞の種類を増やす。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	27 ●ユーザ・形式、システム・形式の間の差違を、単語登録可能かどうか
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	28 の点だけに留める。(それに伴い、名前も、登録可能形式、固定形式とする。)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	29 ●辞書ファイル、頻度ファイルにパスワードを設ける事により、辞書、頻
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	30 度の更新が可能な人を制限する。それにより、辞書の大きさを問題にしなけれ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	31 ば、登録可能形式のみを用いて辞書の管理を行なえるようにする。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	32 ●atou, atos, utoa, stoa というコマンドを、atod (テキスト to 辞書)、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	33 dtoa (辞書 to テキスト) にまとめ、登録可能形式、固定形式の選択を、オプシ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	34 ョンで行なう。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	35 ●変換方式の変更に伴う変更を、付属語ファイルにくわえる。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	36 ●付属語ファイルをクライアント毎に指定することを可能にする。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	37 ●辞書の upload, download の機能を加える。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	38
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	39 (3) 今までのライブラリは、サーバ内でクライアントの変換の状態を記憶し
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	40 ていたので、「連文節変換をする」、「ある文節の次候補を取る」、「文節の
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	41 区切りを切り直して変換を行なう」、「頻度の更新を行なう」といったプリミ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	42 ティブで編集を行なってきました。しかし、これは、変換の流れを一つ固定し
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	43 ているため拡張性に乏しいと思われます。実際に、幾つかのアプリケーション
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	44 では、ここで提供している以外の操作を行なうために、このプリミティブの上
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	45 に新しいライブラリを独自に作って、それを用いています。しかし、ここで提
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	46 供しているプリミティブが一つの変換の流れを仮定した比較的高機能なもので
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	47 ある以上、どうしても無理が生じてきます。実際、頻度の更新が正確に行なわ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	48 れないなどの障害が出てきています。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	49
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	50 そこで、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	51 ●これらの操作を、よりプリミティブな操作である、「読みとなる文字列に
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	52 対して連文節変換を行ない第一候補を返す」、「読みとなる文字列に対して単
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	53 文節変換を行ない第一候補を返す」、「読みとなる文字列に対して単文節変換
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	54 を行ない全ての候補を返す」、「ある辞書エントリの頻度値をある値にセット
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	55 する」といった操作に分け、低レベル・ライブラリとして提供する。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	56 ●より高機能な操作は、高レベル・ライブラリとして、低レベル・ライブラ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	57 リを用いて構成し、Ｃライブラリの形で提供する。そのライブラリと異なる操
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	58 作を行ないたい場合は、低レベル・ライブラリを用いて自分でライブラリを作
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	59 ることを可能にする。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	60 という方針で、ライブラリを設計することにしました。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	61
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	62 また、変換に用いる辞書セット、付属語辞書、パラメーターなどの設定は、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	63 クライアントごとに持つのではなく、サーバ内に「環境」というものを設け、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	64 それに対して設定を行なうことにより、一つのクライアントが複数の環境を用
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	65 いたり、一つの環境を複数のクライアントが用いたりすることを可能にしまし
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	66 た。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	67
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	68 これらの変更により、サーバ内に、クライアントの変換の状態、辞書の状
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	69 態などを持つ必要がなくなり、サーバがステートレスになりました。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	70
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	71 変換アルゴリズムの変更にともない、ライブラリの返す情報の構造は、V3 と
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	72 かなり異なっています。その点を含めて、低レベル、高レベル・ライブラリを
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	73 用いる時の注意点について、後にふれます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	74
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	75 (4) アプリケーション
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	76 現在までは、開発者側で用意するアプリケーションは、フロントエンド・プ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	77 ロセッサwnn のみでしたが、今回は、wnn をバージョン４用に書き換えた uum
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	78 に加えて、gmw ウィンドウ・システムの中から、直接Ｗｎｎの機能を用いるた
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	79 めのｇ言語 Wnn インターフェース、および、それを用いた仮名漢字変換機能
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	80 付のストリング・フォルダなど(このシステムは、総称して WoG と呼ばれ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	81 ている)を提供します。uum は、このバージョンで一応のものを提供しますが、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	82 WoG は、もう少しかかりそうです(一応動くものは出来ている。)。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	83
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	84
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	85
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	86 １．変換アルゴリズム
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	87
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	88 V4 の変換アルゴリズムは、V3 の場合と同じく、文字列の最後から前に向かっ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	89 て文節を切り出す作業が基本となります。その際、V3 では、文節の定義とし
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	90 て
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	91
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	92 文節 := 自立語一つ + 付属語連鎖
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	93 付属語連鎖 := 付属語*
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	94 (ただし、自立語と付属語、付属語と付属語は接続条件を満たし、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	95 文節内で最後の語は、ある特定の品詞の集合(文節の最後に
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	96 来ることのできる品詞の集合)に属している。)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	97
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	98
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	99 という定義をもちいていました。ここで、自立語は、辞書ファイルのエントリで
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	100 あり、それぞれの自立語は、読み、自分の品詞、変換後文字列、それに頻度を
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	101 持っています。また、付属語は、付属語ファイルのエントリであり、読み、自
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	102 分の品詞、それに前にこれる品詞の集合(接続ベクトルと呼ばれる)を持ってい
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	103 ます。付属語どうしの接続関係、および、付属語と自立語の接続関係は、この
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	104 接続ベクトルによってチェックされます。付属語が漢字を持っていないことに
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	105 注意して下さい。付属語が漢字を持っていないことにより、付属語連鎖がどの
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	106 ような品詞の付属語から構成されているかという情報を持たなくていいので、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	107 簡易で、高速な変換アルゴリズムを実現することができるのです。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	108
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	109 V3 の解析では、接頭接尾語の処理、助数詞の処理は行なっていませんでし
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	110 た。これらの語は、自立語として一文節を構成することにより処理されていま
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	111 す。しかし、接頭接尾語をこのように一文節として取り扱っていたのでは、誤
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	112 変換が多くなることは避けられません。例えば、人名につく接尾語「さん」よ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	113 り「三」の方が評価値が高い時に、「こばやしさん」を変換すると「小林三」
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	114 となるといった誤変換が現れます。もし、「小林」が人名で、人名には「三」
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	115 より「さん」が優先的に付くという情報があれば、この種の誤変換は少なくす
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	116 ることが可能だと考えられます。このような誤変換を少なくするには、文節の
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	117 定義を拡張するか、あるいは現在の方法を少し拡張し、文節間のつながり具合
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	118 を見る方法をとることが考えらます。Wnn Ver.4で採用した方法は、両者の折
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	119 中案と言えるものです。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	120
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	121 Wnn Ver.4では、「大文節」と「小文節」と呼ばれる、二つのレベルの文節
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	122 を考えます。「小文節」の定義は、Ver.3における「文節」の定義と同等であ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	123 り、「大文節」は、小文節の列で、接続条件を満たすものと定義されます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	124
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	125 ここで、自立語、付属語と呼ばれているものは、我々が直感的に自立語、付属語
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	126 として理解して来たものと異なります。しかし、ここではこれらの名前を
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	127 流用する事にします。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	128
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	129 語 := 自立語 \| 付属語
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	130 小文節 := 自立語 + 付属語連鎖
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	131 大文節 := 小文節+
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	132 付属語連鎖 := 付属語*
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	133
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	134 (ただし、小文節内で、自立語と付属語、付属語と付属語は接続条件を満たし、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	135 小文節内で最後の語は、後ろの小文節の自立語と接続条件を満たす。最後の小文
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	136 節の最後の語は、ある特定の品詞の集合(大文節の最後に来ることのできる品
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	137 詞の集合)に属している。最初の小文節の自立語は、ある特定の品詞の集合
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	138 (大文節の先頭になれる品詞の集合)に属している。)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	139
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	140
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	141 (例) 小文節、大文節の例
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	142
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	143 第２回の小文節は
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	144 -- -- ---- -- ------
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	145 小小小小小
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	146 ------------ ---------
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	147 大大
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	148
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	149
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	150 約１２３グラムぐらいの
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	151 -- ------ --------------
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	152 \| \| \|
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	153 \| \| 小(助数詞+付属語)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	154 小 \|
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	155 (接頭数詞) 小(数詞列)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	156
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	157
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	158 お食べ下さい
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	159 -- ---- ------
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	160 小小小
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	161 ------ ------
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	162 大大
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	163
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	164
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	165 小文節同士の接続条件は、上で述べたように、後の小文節の自立語と前の小文節
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	166 の最後の語の間の接続条件として与えます。この情報は、それぞれの自立語毎に
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	167 持っていては情報量が大き過ぎるので、自立語品詞ごとに品詞の前端ベクトル
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	168 として持つものとします。自立語品詞の前端ベクトルは、辞書ではなく、付属語
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	169 ファイルに与えます。これらは、それぞれの辞書に固有なものではなく、付属
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	170 語間の接続情報と共に指定されるべきものだからです。この意味で、付属語ファ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	171 イルという名前は不適切で、接続情報ファイルとでも名前を変えるべきかもし
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	172 れませんが、「付属語ファイル」のほうが馴染みがあって、付属語ファイルを
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	173 指定するライブラリ関数名でも、set_fuzoku という名前がわかりやすいので、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	174 この名前を引続き使うものとします。辞書の持つ情報については、基本的に
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	175 Ver 3 と変わっていません。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	176
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	177 どれが小文節になるかは、付属語ファイルによります。上に挙げた例は、現在
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	178 使っている付属語ファイルによるものです。最後の例に対して、一つの大文節
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	179 になって欲しいと要望する人もいるでしょう。これからも、自然で正確な変換
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	180 を目指して、付属語ファイルの内容は書き換えられていくでしょう。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	181
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	182 ＃自立語の品詞については、後ろに続く付属語を規定するという役割と、前に続
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	183 ＃く小文節を規定するという役割を兼ねています。これでいいかということにつ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	184 ＃いて議論がありましたが、今更変えることはないでしょう...
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	185
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	186 今までの「文節」に当たるものは、この「大文節」です。この定義に従って
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	187 大文節を切り出した後は、基本的には、Ver.3 と同様な操作を行ないます。す
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	188 なわち、大文節を n 個切り出してきて、それらの評価値の和が最大なものの
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	189 最後の大文節を確定するという動作を、文字列の前端に来るまで繰り返すので
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	190 す。今まで文節の評価値を計算していたところが、「大文節」の評価値を計算
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	191 することになるのですが、パラメータの数は、Ｖｅｒ.3 よりずっと多くなり、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	192 パラメータの定め方が結構大変で、四苦八苦しています。しかし、パラメータ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	193 の定め方いかんで、かなり良い変換が得られそうです。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	194 (興味のある方は、パラメータをいじって遊んで下さい。)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	195
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	196 あと、変換に関して、細かい点が色々変わっていますが、そのなかでも
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	197 数字に対する変換が、面白いです。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	198
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	199 たとえば、「2456」を変換すると、2456 が返ってきて、次候補として、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	200
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	201 2456 ２４５６二四五六二千四百五十六２，４５６
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	202 2,456 弐阡四陌伍拾六
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	203
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	204 が返ってきます。ここで、二千四百五十六を選択すると、次に 123 などの数
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	205 字を変換した時に、百二十三が返ってくるという具合に、どの形式で以前選
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	206 択されたかを内部的に記憶しています。また、アスキ文字も、a を変換したら
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	207 ａも返ってくるという具合に、半角、全角間の変換をサポートしています。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	208
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	209 (以前選択された値のセットは、頻度値の設定のライブラリで行ないます。)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	210
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	211 また、pubdic の付属語ファイルでは、(現在のところ、)数詞同士がつながっ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	212 て大文節を作るようになっています。ですから、「ごじゅうに」を変換すると、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	213 「五十二」という大文節になります。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	214
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	215
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	216 ２．辞書
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	217
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	218 今までは、辞書に、読みとして許される文字の字種がかなり制限されていま
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	219 した。一方で、読みに任意の２バイトコードを許すようにすれば、漢字仮名変
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	220 換の可能性が出てきます。漢字仮名変換は、音声合成と組み合わせれば、文章
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	221 の「自動読みあげ」に応用できます。また、フリガナをつけたり、索引などを
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	222 読みの順にソートしたり、一度変換したものを再変換したり、あるいは、実際
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	223 に存在する文章からバッチ式に頻度を集めたり、応用範囲の広い技術です。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	224 Ver.4 では、読みを２バイトで扱っています。よって、読みの部分と漢字
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	225 の部分をひっくり返した辞書を作ることによって、漢字仮名変換を行なうこと
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	226 ができます。実際に漢字仮名変換に使ってみた結果では、かなりの正確さでで
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	227 変換されました。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	228
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	229 ＃辞書に関しては、現在、uum, WoG などは、かな漢字変換用の環境と、漢字
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	230 ＃かな変換用の環境をつくって、それぞれにかな漢字変換、漢字かな変換の辞書
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	231 ＃を設定して、環境を切り変えていますが、この場合、かな漢字変換の辞書を追
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	232 ＃加した時に、漢字かな変換の辞書も追加する必要があります。また、単語登録
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	233 ＃した場合にも、逆変換用の辞書にも単語登録する必要が出てきます。これらの
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	234 ＃ことは、WoG では、自動的に行なうように出来ていますが、uum はそこまで真
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	235 ＃面目に作っていません。このように、辞書と逆変換辞書の間の統一をとるのは、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	236 ＃困難です。さらに、辞書と逆変換辞書の間で頻度を共有できないなどの問題点
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	237 ＃があります。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	238 ＃そこで、一つの辞書に、読みからのインデックスと漢字からのインデックスを
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	239 ＃両方つけようという計画があります。これは、辞書のサイズが大きくなるのと、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	240 ＃変換のスピードがやや落ちるというトレードオフが問題ですが、時間があれば、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	241 ＃やりたいと思っています。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	242
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	243 自立語品詞の種類は、今まで 32 個に制限されていましたが、これは、256
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	244 まで拡張されました。それに加えて、複合品詞をほぼ無制限に定義することが
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	245 できます。これらの品詞に関する情報は、品詞ファイル
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	246 (/usr/local/lib/wnn/hinsi.data)に書かれています。自立語の品詞は、サー
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	247 バが用いるだけではなく、辞書を作る時、辞書をテキストに戻す時などに必要
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	248 になる情報です。また、クライアントも、単語の品詞に関する情報を表示する
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	249 時、単語登録で品詞を指定する時などに必要となる情報です。これらの品
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	250 詞に関する情報は、クライアントからは、ライブラリを用いてサーバに聞くこ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	251 とにより得られます。しかし、atod, dtoa などの辞書ユーティリティプログ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	252 ラムは、直接品詞ファイルを読みにいきます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	253
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	254 付属語ファイルを書くためには、新しい自立語品詞が必要になることが多々あ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	255 るでしょう。かといって、勝手に書き換えられては困るものです。ユーザごと
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	256 に持てるようにすればいいかも知れませんが、辞書を用いる時に、異なる品詞
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	257 情報を元に作られた辞書を混ぜて使うことはできないため、かえって混乱をき
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	258 たすことになります。そのような複雑なものは、管理し切れないと思われます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	259 そこで、「品詞ファイル」(/usr/local/lib/wnn/hinsi.data)は、世の中に一
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	260 つだけ存在するということにしました。品詞ファイルに対しては、エントリの
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	261 追加は認めるが、削除、並べ変えは認めません。品詞ファイルは、以下のよう
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	262 に、品詞、複合品詞の情報を書き並べた単純な構造をしています。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	263
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	264 ....
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	265 ....
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	266 名詞
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	267 人名
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	268 地名
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	269 人地名/人名:地名 ;人名, 地名
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	270 ....
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	271 ....
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	272
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	273
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	274 ＃jserver を複数動かす事、あるいは、辞書ファイルや付属語ファイルを書き変
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	275 ＃えるために、品詞ファイルも各サイトで書き変えていくことを考えると、品詞
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	276 ＃ファイルの管理は、一つの課題となってきそうです。また、atod, dtoa など
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	277 ＃を動かそうとすると、品詞ファイルがあるpath に存在していなくてはならず、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	278 ＃問題となります。(atod, dtoa もjserverと通信した方がいいのかも知れませ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	279 ＃ん。)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	280 ＃
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	281 ＃そこで、現在のところ、それぞれの辞書ファイルや付属語ファイルに品詞ファ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	282 ＃イルの情報を持たせようという計画があります。品詞名と、品詞番号の対応関
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	283 ＃係は、各辞書ファイルや付属語ファイルが持ちます。そして、辞書を読み込む
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	284 ＃時に、jserver 内の番号と対応付けを行なって、辞書による、品詞番号と品詞
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	285 ＃名との対応関係の違いを吸収しようというものです。これは、辞書の読み込み
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	286 ＃時の処理が多くなって、クライアントの立上りが遅くなるという欠点と、辞書
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	287 ＃のサイズが少し大きくなるという欠点がありますが、非常に有望な方法だと思
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	288 ＃います。次のリリースまでには、実現したい機能です。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	289
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	290
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	291 今までは、ユーザ形式、システム形式の２種類の辞書を用いていました。前
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	292 者は、単語登録可能だけど、頻度ファイルを外部に持つことができない形式で、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	293 後者は、単語登録はできないけれど、頻度ファイルを外部に持つことができ、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	294 同じ語数の場合、辞書を小さく作ることができる形式でした。しかし、ユーザー
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	295 形式の辞書が頻度ファイルを外部に持つことを可能にするのは技術的に決して
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	296 難しい問題ではなく、そうすることにより、辞書の大きさが比較的問題になら
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	297 ないサイトでは、辞書の形式としては今までユーザ形式の辞書と呼ばれていた
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	298 もの１種類だけで済むようになります。そこで、Ver.4 では、今までユーザ形
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	299 式の辞書と呼ばれていたものに対して、頻度ファイルを外部に持つことを許し
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	300 ました。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	301
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	302 こうなると、ユーザ形式、システム形式という名前は不適切です。そこで、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	303 今までユーザ形式と呼ばれていたものは登録可能形式、システム形式と呼ば
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	304 れていたものは固定形式と名前を改めました。ユーザ形式の辞書が広く使わ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	305 れることを考え、辞書の内部形式も、辞書を引くのが早くなるような変更を加
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	306 えてあります。また、今まで存在した語数などに対する制限はほとんどありません。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	307 ただ、漢字文字列が(外部UJISで)255バイト以内という制限は残っています。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	308
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	309 辞書の大きさは、今までとほとんど変わっていないと思います。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	310
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	311 辞書 kihon_1 語数 59,717
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	312
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	313 テキスト形式 1,567,388
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	314 旧ユーザ形式 1,783,214
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	315 旧システム形式 956,294
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	316 登録可能形式 1,735,680
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	317 固定形式 1,190,742
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	318
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	319
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	320 登録可能形式の辞書を皆で共有することにより、辞書の内容に「バグ」があっ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	321 た時に、動的にバグを修正することができます。今までだと、一旦テキスト形
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	322 式に直して、バグを直して、それを再びインストールするという手続きを踏ま
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	323 なくてはならず、面倒なばかりか、それをすると、今まで個人が持っていた頻
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	324 度ファイルがすべて使えなくなるという非常に不便な状態にあったわけです。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	325
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	326 ただ、辞書の品質を保つためには、誰でも単語の登録、削除が行なえるので
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	327 は問題があります。そこで、辞書にパスワードをつけることにしました。これ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	328 によって、辞書のメンテナンスをする以外の人が、間違って、あるいは悪意的
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	329 に辞書を書き換えるということを防ぐことができます。このパスワードは、辞
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	330 書を書き換えるのを防ぐだけで、辞書を変換に用いることを制限するものでは
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	331 ありません。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	332 もちろん、個々のユーザが自分の辞書にパスワードをつけて用いることも可
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	333 能です。その時、辞書を使う度にパスワードを打ち込むのではやっていられま
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	334 せん。そこで、高レベル・ライブラリでは、初期化ファイルの辞書指定のとこ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	335 ろでパスワードの入っているファイル名を指定することにより、ライブラリが
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	336 そのファイルを読んで、パスワードをサーバに送るようになっています。後は、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	337 UNIX ファイルシステムの read permission でパスワードの入ったファイルを
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	338 保護すれば良いのです。辞書と同様に、頻度ファイルもパスワードを付けられ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	339 るようになっています。パスワードの入ったファイル名は、高レベル・ライブ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	340 ラリでは、V3 の wnnrc に相当するものをパースして、辞書などのの初期設定
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	341 をするものが存在するのですが、その初期化ファイルの中で、パスワードファ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	342 イル名を指定できるようになっています。ですから、uum では、通常の使用で
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	343 は、パスワードを入力する必要は生じません。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	344
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	345 ＃辞書のパスワードについては、辞書をちゃんと管理するためには必要がある
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	346 ＃と思ってつけましたが、実際には、そんなめんどくさいもの誰も使わないで
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	347 ＃しょう。:-)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	348
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	349 Ｗｎｎでは、頻度ファイルの他に、辞書の内部にも、頻度情報を一組持って
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	350 います。この頻度情報は、旧バージョンでは、ユーザ形式辞書では頻度として、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	351 システム形式辞書では、頻度ファイルを作る時の初期値として用いられていま
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	352 した。すなわち、新しく頻度ファイルを作った時には、辞書内の頻度部分の内
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	353 容をコピーして、頻度の初期値としていました。しかし、これでは、後で頻度
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	354 を集めてテキスト形式の辞書に戻そうとした時に、頻度値の集計が難しくなり
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	355 ます。また、頻度値として、もともとの値と自分が使った値と別々に見たいと
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	356 いう要求もあるでしょう。そこで、Ver.4 では、頻度ファイルを新しく作った
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	357 時には、すべての項目の頻度値が０であるような頻度ファイルを作り、頻度
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	358 値として、辞書内の頻度値と頻度ファイルの頻度値を足したものを用いること
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	359 にします。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	360 自分一人しか使わない辞書の場合、頻度ファイルを辞書の外部に作るのは無
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	361 駄です。また、複数の人で同じ頻度を用いる場合にも、頻度は辞書内にあった
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	362 方がいいでしょう。そういうわけで、頻度ファイルを指定せずに辞書を用いる
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	363 と、辞書内の頻度を用い、それを更新するようになっています。ディスクの容
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	364 量が足りないなどの理由で、頻度ファイルを共有する場合に、楽になります。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	365
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	366 また、pubdic などで集計した頻度を、元となる頻度として反映する場合に、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	367 個々のユーザの頻度ファイルを作り直さなくても、辞書内頻度を用いる状態で
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	368 辞書を読み込んで、頻度値変更のライブラリを使って頻度値を新しい値にセッ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	369 トし直すことが可能になります。一つの辞書に対して、辞書外に頻度ファイル
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	370 を作って使用するという使用法と、辞書内の頻度を用いるという使用法を併用
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	371 するのは、一般には望ましい使い方ではありません。そのようなことを防ぐた
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	372 めに、辞書の頻度部分にもパスワードをつけることが可能になっています。そ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	373 れによって、(パスワードが一致しない場合、)頻度ファイルを指定せずに、頻
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	374 度を更新するモードでその辞書を使用する事が不可能になります。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	375
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	376 ＃ pubdic プロジェクトが、Wnn V4 で、どのような形態で辞書を管理してい
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	377 ＃くのかは、私は知りません。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	378
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	379 誰にも使うことのできないパスワード(辞書を作る時に、atod -n -N で事が出
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	380 来ます)が辞書本体、辞書頻度部分についている場合、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	381
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	382 辞書本体辞書頻度部分
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	383
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	384 パスワード有パスワード有頻度ファイルを用い、登録不能
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	385 パスワード無パスワード有頻度ファイルを用い、誰でも登録可能
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	386 パスワード有パスワード無頻度は共有、登録はできない
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	387 パスワード無パスワード無頻度は共有、誰でも登録可能
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	388
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	389 といったところでしょうか。もちろん、頻度部分にパスワードがついてなくて
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	390 も、頻度ファイルを辞書外部に作って辞書を用いることは可能ですし、パスワー
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	391 ドの無い辞書でも、今までとおり、辞書本体、あるいは頻度部分をリード・オ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	392 ンリーで用いることもできます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	393
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	394 頻度については、新しく、頻度値を用いてエントリの一時的削除を行なうこ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	395 とを可能にしました。すなわち、頻度値をある値にセットすれば、そのエント
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	396 リーは、変換の時に用いられないというものです。このある値は、ライブラリ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	397 では(実頻度) -1(WNN_ENTRY_NO_USE) になっています。頻度ファイルを指定し
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	398 ていない場合には、辞書内頻度値がこの値ならば、また、指定している場合に
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	399 は、頻度ファイル値もしくは辞書内頻度値のどちらかがこの値ならば、そのエ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	400 ントリは、一時削除されたことになります。これによって、皆で共有して使用
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	401 している辞書に自分にとって不適当な単語が存在している場合に、それを変換
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	402 の対象から除外することができます。テキスト形式では、削除されたエントリ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	403 は頻度の部分が "-" で示されます。テキスト形式で、エントリを消す時に、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	404 コメントアウトなどの方法で実際に消してしまうと、atod で辞書を作ってそ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	405 れを dtoa で再びテキストに戻した時に、エントリーが消えてしまいます。頻
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	406 度部分を "-" にする事により消したエントリは、実際に消えたわけではあり
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	407 ませんから、辞書の内容を編集する時に、便利です。高レベル・ライブラリで
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	408 は、エントリの一時削除のためのライブラリ関数が用意されています。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	409
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	410 Ver.4 では、辞書にコメントを付けることが出来るようになっています。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	411 (コメントというより、ニックネームと言った方がいいかも知れません）uumで
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	412 は、これを、単語登録などの時の辞書名の指定に用いるようにしています。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	413 usr/pubdic/pd-chimei といった辞書名を見ながら登録する辞書を選ぶよりも、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	414 「地名辞書」といったニックネームを見ながら登録する辞書を選べた方が便利
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	415 なのは、理解していただけるでしょう。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	416
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	417 また、コメントは、各辞書エントリにつけることも可能となっています。これ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	418 は、テキスト形式に直して辞書を編集する時も見えますので、辞書の編集時に
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	419 便利だと思われます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	420
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	421 辞書のパスワード、コメントなどは辞書の作成時に指定しますが、すでに存在
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	422 する辞書に対して、これらの部分を書き換えるコマンドが用意されています。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	423 これは、今のところ、新バージョンのｇｍｗ上で動くように作ってあります。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	424
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	425 いままで atou, atos, utoa, stoa と呼ばれていたコマンドは、atod (テキ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	426 スト to 辞書)、dtoa (辞書 to テキスト) の二つにまとめられています。登
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	427 録可能形式、固定形式の選択は、atod のオプションで行ないます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	428
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	429 辞書のテキスト形式に対しても、見やすさの観点から変更が加えられていま
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	430 す。品詞は数字ではなく、品詞名が現れます。頻度値として、圧縮された値で
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	431 はなく、実際の使用頻度(に近い値）が出されます。atod を行なう時に辞書を
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	432 ソートし直すので、テキスト形式の辞書を作成する時には、辞書項目はどのよ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	433 うな順でも構いません。これにより、テキスト形式の辞書の編集がしやすくな
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	434 ります。dtoa は、読みの順にソートされた形で出力します。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	435
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	436 付属語ファイルは、ｊｓｅｒｖｅｒ内に一つ存在するのではなく、環境毎
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	437 に設定できるようになりました。環境については、ライブラリの項を参照して
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	438 下さい。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	439
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	440 ＃これによって、名簿などを入力している時には付属語がつながらないような
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	441 ＃状態で入力するだとか、手紙文を入力している時には大阪弁などの口語も入っ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	442 ＃た付属語ファイルを用いるといった設定が可能になります。残念ながら、現在
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	443 ＃の uum や WoG では、この機能を簡単に利用できるようにはなっていません。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	444 ＃将来への課題です。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	445
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	446 変換方式の変更にともない、付属語ファイルの内容、および、ａｔｏｆコマン
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	447 ドも変更を受けています。このことについては、ここでは省略します。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	448
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	449 辞書をクライアントからｕｐｌｏａｄ、ｄｏｗｎｌｏａｄする機能が付け加
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	450 えられます。これにより、ユーザの個人の辞書や頻度ファイルを、自分のホー
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	451 ムディレクトリの下に置くことが可能です。jserver は、ファイルの同一性の
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	452 チェックを厳しくやっているので、nfs でマウントされた同一の辞書を二つの
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	453 計算機から upload しても、jserver 内では一つのファイルとして扱われます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	454
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	455 ＃ WoG では、デフォルトの設定で、ユーザのホームディレクトリの下にユー
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	456 ＃ザ毎の辞書や頻度ファイルは置かれるようになっています。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	457
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	458
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	459
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	460
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	461
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	462 ３．ライブラリ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	463
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	464 Ver.4 では、ライブラリとして、jserver との通信と基本的に１対１に対応し
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	465 ている低レベル(ｊｓ)ライブラリと、ｊｓライブラリを用いて作られた、高レベ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	466 ル(ｊｌ)ライブラリがあります。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	467
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	468 低レベル・ライブラリは、細かいプリミティブから構成され、高レベル・ライ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	469 ブラリは、仮名漢字変換の流れに沿った高レベルの処理を実現しています。例
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	470 えば、変換に関しては、ｊｓライブラリでは、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	471 読みに対して、連文節変換をした第一候補を返す(kanren)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	472 読みに対して、単文節変換をした第一候補を返す(kantan_dai, kantan_sho)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	473 読みに対して、単文節変換をした全候補を返す (kanzen_dai, kanzen_sho)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	474 あるエントリの頻度値をある値にセットする(hindo_set)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	475 といった関数が基本となります。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	476
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	477 これに対して、ｊｌライブラリは、変換の履歴を文節の列として持っており、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	478 読みを与えて、連文節変換をする(ren_conv)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	479 文節の区切りを変えて変換し直す(nobi_conv)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	480 ある文節の次候補を返す。(zenkouho, zenkouho_dai)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	481 (変換の履歴に基づいて)頻度値の更新を行なう(update_hindo)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	482 といった関数が基本となります。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	483
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	484 低レベル・ライブラリの関数は、js_ ではじまる名前を持っており、高レベル・
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	485 ライブラリの関数は、jl_ ではじまる名前を持っています。ここでは、まず、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	486 低レベル・ライブラリについて説明し、その後に、高レベル・ライブラリにつ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	487 いて説明します。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	488
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	489
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	490 ３．１　低レベル・ライブラリ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	491
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	492 まず、低レベル・ライブラリにおいて使用される以下の概念について、まとめ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	493 ておきます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	494
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	495 クライアント
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	496 環境
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	497 ファイル
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	498 辞書Ｎｏ．
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	499
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	500 ●クライアント
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	501 jserver と通信路を持つアプリケーション・プログラムのことをクライアン
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	502 トと呼びます。複数の計算機上で jserver が動いている時に、一つのプログ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	503 ラムは、複数の jserver のクライアントに同時になることが出来ます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	504
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	505 ●環境
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	506 仮名漢字変換の実行結果は、使用する辞書と頻度ファイル、使用する付属語
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	507 ファイル、あるいは、変換パラメータの設定といったものによって、変わって
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	508 きます。これらの設定は、jserver 内に「環境」と呼ばれるものを作り、それ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	509 に対して行ないます。そして、変換の操作は、引数として読みの文字列と共に、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	510 環境を指定して行ないます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	511 一つのクライアントは、jserver 内に複数の環境を作り、変換の度に異なる
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	512 環境を用いることができます。また、一つの環境を複数のクライアント間で共
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	513 有することも可能です。その時には、その環境に対する辞書追加などの操作は、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	514 その環境を使用している他のクライアントにも反映されます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	515
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	516 環境は jserver 内に作られるものですが、js_ライブラリでは、jserver id
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	517 とその jserver 内の環境の idのペアを環境としています。ですから、環境
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	518 の指定は、変換を行なう jserver の指定を含んでいます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	519
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	520 ●ファイル
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	521 Wnn においては、辞書ファイルなどのファイルを jserver 内に読み込む動
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	522 作と、ファイルを辞書として用いるなどといったファイルの使用を開始する動
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	523 作は、区別されています。それは、jserver が用いるファイルには、辞書ファ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	524 イル、頻度ファイル、付属語ファイルといった種類があり、種類ごとに使用方
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	525 法は異なるのですが、ファイルとしての動作(メモリ上への読み込み、書きだ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	526 し、使用されていないファイルをメモリ上から捨てる)は、どの種類のファイ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	527 ルであっても共通だからです。特に、ファイルの読み込み、書き出しに関して
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	528 は、jserver が直接行う場合と、クライアントが読み込んで jserver に送信
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	529 する(あるいは、逆に、jserver から受信してクライアントのファイルシステ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	530 ムに書き込む)場合があります。クライアントのローカルからの送信か、サー
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	531 バーのファイルシステムからの読み込みかをファイルの種類ごとに、ファイル
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	532 の使用開始時に指定するのより、ファイルの読み込み、送信を一つのプリミティ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	533 ブとした方が明確だろうという趣旨です。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	534
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	535 高水準ライブラリでは、ファイルの作成と読み込みと使用を一つにまとめたラ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	536 イブラリ関数群が用意されています。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	537
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	538 ●辞書Ｎｏ．
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	539 辞書は、頻度ファイルを指定して使用することも、指定せずに使用すること
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	540 もできます。ですから、環境にセットするのは、辞書と頻度ファイルの組、ま
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	541 たは、辞書だけです。環境に辞書をセットする事によって ID が返されますが、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	542 この ID を辞書Ｎｏ．と呼びます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	543 辞書Ｎｏ．に付随する情報として、辞書ファイル、頻度ファイルの他に、辞書
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	544 のプライオリティ、辞書のenable/disable、辞書、頻度の書き込み許可の情報
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	545 があります。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	546
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	547 ○簡単な例を通した低レベル・ライブラリの説明
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	548
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	549 以下、かな漢字変換、及び、漢字かな変換を行なう簡単なプログラムを例とし
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	550 て、低レベル・ライブラリの使い方を説明します。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	551
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	552 ＃変換関係のライブラリの引数や、パラメータの個数は、配布開始までに
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	553 変更されるかもしれないので、このままでは、動かないかもしれません。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	554
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	555 -------------------------------------------------
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	556 #include <stdio.h>
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	557 #include "jslib.h"
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	558 /#include "commonheader.h" /
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	559
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	560 #define FZK_FILE "/usr/local/lib/wnn/dic/pubdic/full.fzk"
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	561 #define KIHON_DIC "/usr/local/lib/wnn/dic/pubdic/pd-kihon.sys"
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	562 #define SETTO_DIC "/usr/local/lib/wnn/dic/pubdic/pd-setsuji.sys"
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	563 #define REV_DIC "/usr/local/lib/wnn/dic/pubdic/pd-kihon.sysR"
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	564 #define REV_DIC_SETTO "/usr/local/lib/wnn/dic/pubdic/pd-setsuji.sysR"
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	565
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	566 WNN_JSERVER_ID *js;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	567 struct wnn_env env, rev_env;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	568 static struct wnn_ret_buf rb = {0, NULL};
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	569
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	570 int dcnt,scnt;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	571
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	572 char yomi[1024];
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	573 char kanji[5000];
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	574
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	575 int kihon_file, setto_file, rev_file, fzk_file, rev_setto_file;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	576 int kihon_dic_no, setto_dic_no, rev_dic_no, rev_setto_dic_no;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	577
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	578 main(argc, argv)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	579 int argc;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	580 char **argv;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	581 {
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	582 char *mname = "";
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	583 rb.buf = (char *)malloc((unsigned)(rb.size = 0));
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	584 if(argc > 1) mname = argv[1];
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	585
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	586 if((js=js_open(mname)) == NULL) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	587
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	588 if((env=js_connect(js, "kana")) == NULL) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	589 if((fzk_file = js_file_read(env,FZK_FILE)) == -1) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	590 if((kihon_file = js_file_read(env,KIHON_DIC)) == -1) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	591 if((setto_file = js_file_read(env,SETTO_DIC)) == -1) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	592
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	593 if(js_fuzokugo_set(env,fzk_file) == -1) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	594 if((kihon_dic_no = js_dic_add(env,kihon_file,-1,1,WNN_DIC_RDONLY, WNN_DIC_RDONLY, NULL, NULL)) == -1) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	595 if((setto_dic_no=js_dic_add(env,setto_file,-1,1,WNN_DIC_RDONLY, WNN_DIC_RDONLY, NULL, NULL)) == -1) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	596 p_set(env);
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	597
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	598 if((rev_env=js_connect(js, "kanji")) == NULL) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	599
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	600 if((fzk_file = js_file_read(rev_env,FZK_FILE)) == -1) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	601 if((rev_file = js_file_read(rev_env,REV_DIC)) == -1) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	602 if((rev_setto_file = js_file_read(rev_env,REV_DIC_SETTO)) == -1) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	603
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	604 if(js_fuzokugo_set(rev_env,fzk_file) == -1) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	605 if((rev_dic_no = js_dic_add(rev_env,rev_file,-1,1,WNN_DIC_RDONLY, WNN_DIC_RDONLY, NULL, NULL)) == -1) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	606 if((rev_setto_dic_no = js_dic_add(rev_env,rev_setto_file,-1,1,WNN_DIC_RDONLY, WNN_DIC_RDONLY, NULL, NULL)) == -1) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	607 p_set(rev_env);
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	608
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	609 #ifdef DEBUG
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	610 printf("Now discard file push any key\n");
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	611 getchar();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	612 js_file_discard(rev_env, rev_file);
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	613 printf("Now discard file\n");
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	614 #endif
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	615
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	616 henkan();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	617 js_close(js);
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	618 }
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	619
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	620 henkan()
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	621 {
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	622 wchar u[1024];
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	623 struct wnn_env *c_env = env;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	624 struct wnn_dai_bunsetsu *dp;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	625
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	626 for(;;){
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	627 if(c_env == env){printf("yomi> ");fflush(stdout);}
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	628 else {printf("kanji> ");fflush(stdout);}
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	629 if(gets(yomi) == NULL)return;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	630 if(yomi[0] == '!')return;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	631 if(yomi[0] == '@'){
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	632 c_env = (c_env == env)? rev_env:env;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	633 continue;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	634 }
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	635 strtows(u,yomi);
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	636 dcnt =js_kanren(c_env,u,WNN_BUN_SENTOU, NULL, WNN_VECT_KANREN, WNN_VECT_NO,&rb);
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	637 dp = (struct wnn_dai_bunsetsu *)rb.buf;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	638 print_kanji(dp,dcnt );
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	639 }
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	640 }
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	641
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	642 print_kanji(dlist, cnt)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	643 struct wnn_dai_bunsetsu *dlist;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	644 int cnt;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	645 {
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	646 int i;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	647 struct wnn_sho_bunsetsu *sbn;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	648
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	649 if (dlist == 0) return;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	650 putchar('\n');
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	651 for ( ; cnt > 0; dlist++, cnt --) {
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	652 sbn = dlist->sbn;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	653 for (i = dlist->sbncnt; i > 0; i--) {
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	654 putws(sbn->kanji); printf("-");
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	655 putws(sbn->fuzoku); printf(" ");
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	656 sbn++;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	657 }
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	658 printf("\|");
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	659 }
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	660 putchar('\n');
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	661 fflush(stdout);
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	662 }
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	663
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	664 p_set(env1)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	665 struct wnn_env *env1;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	666 {
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	667 struct wnn_param pa;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	668 pa.n= 2; /* n_bun */
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	669 pa.nsho = 10; /* nshobun */
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	670 pa.p1 = 2; /* hindoval */
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	671 pa.p2 = 40; /* lenval */
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	672 pa.p3 = 0; /* jirival */
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	673 pa.p4 = 100; /* flagval */
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	674 pa.p5 = 5; /* jishoval */
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	675 pa.p6 = 1; /* sbn_val */
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	676 pa.p7 = 15; /* dbn_len_val */
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	677 pa.p8 = -20; /* sbn_cnt_val */
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	678 pa.p9 = 0; /* kan_len_val */
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	679
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	680 js_param_set(env1,&pa);
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	681 }
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	682
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	683
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	684 putwchar(x)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	685 unsigned short x;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	686 {
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	687 putchar( x >> 8);
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	688 putchar( x );
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	689 }
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	690
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	691 putws(s)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	692 unsigned short *s;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	693 {
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	694 while(s) putwchar(s++);
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	695 }
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	696
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	697 strtows(u,e)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	698 wchar *u;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	699 unsigned char *e;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	700 {int x;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	701 for(;*e;){
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	702 x= *e++;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	703 if(x & 0x80) x = (x << 8) \| *e++;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	704 *u++= x;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	705 }
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	706 *u=0;
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	707 }
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	708
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	709 err()
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	710 {
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	711 printf(wnn_perror());
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	712 printf("\n bye.\n");
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	713 exit(1);
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	714 }
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	715
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	716 このプログラムの実行例を示しておきます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	717
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	718 % kankana
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	719 yomi> だいぶんせつは、しょうぶんせつのれつで、せつぞくじょうけんをみたすものと
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	720 ていぎされます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	721
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	722 大- 文節-は、 \|小- 文節-の \|列-で、 \|接続- \|条件-を \|満た-す \|もの-と \|定義-さ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	723 れます。 \|
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	724 yomi> このぷろぐらむのじっこうれいをしめしておきます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	725
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	726 この- \|プログラム-の \|実行- 例-を \|示-しておきます。 \|
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	727 yomi> @
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	728
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	729 kanji> 大文節は、小文節の列で、接続条件を満たすものと定義されます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	730
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	731 おお- ぶんせつ-は、 \|こ- ぶんせつ-の \|れつ-で、 \|せつぞく- \|じょうけん-を \|み
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	732 た-す \|もの-と \|ていぎ-されます。 \|
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	733 kanji> このプログラムの実行例を示しておきます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	734
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	735 この- \|ぷろぐらむ-の \|じっこう- れい-を \|しめ-しておきます。 \|
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	736 > ^D
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	737
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	738 -------------------------------------------------
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	739 プログラムの説明
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	740
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	741 このプログラムを用いで、低レベル・ライブラリの使い方について説明します。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	742
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	743 #include "jslib.h"
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	744
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	745 include/jslib.h には、ｊｓライブラリで用いる構造体、マクロなどの定義が
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	746 なされています。ライブラリで提供する関数名、構造体名、マクロ名は、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	747 "js_" または、"wnn_" (高レベル・ライブラリでは "jl_") という名前をつ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	748 けていますので、名前の衝突が起こらないように注意して下さい。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	749
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	750 static struct wnn_ret_buf rb = {0, NULL};
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	751
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	752 rb.buf = (char *)malloc((unsigned)(rb.size = 0));
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	753
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	754 今までのライブラリでは、変換などの変値を入れる領域は、ライブラリを呼ぶ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	755 側で用意し、その領域に入り切らない場合には、エラーになりました。一般に、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	756 ライブラリを用いる側で、どれだけの領域が必要かはわからないので、大きな
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	757 問題となります。そこで、Ver.4 では、必要があれば、ライブラリの側で
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	758 reallocを行なうという仕様になっています。不定長の変値を返す関数は、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	759 (struct wnn_ret_buf *) の引数を取ります。このポインタの先には、malloc
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	760 または realloc で取られた領域と、その大きさのペアが与えられる必要があ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	761 ります。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	762
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	763 if((js=js_open(mname)) == NULL) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	764
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	765 この一行で、jserver との通信路を設立し、jserver のクライアントになりま
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	766 す。mname には、jserver の存在する計算機名が与えられます。計算機名として
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	767 ヌル・ストリングが与えられた時には、UNIX ドメインの通信を行ないます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	768 js_open は、返値として、jserver_id を返します。この通信路は、js_close
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	769 をによって明示的に切断するか、プログラムが終了するまで有効です。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	770
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	771 if((env=js_connect(js, "kana")) == NULL) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	772
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	773 次に、js_connect により、環境を jserver 内に作ります。どの jserver 内
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	774 に環境を作るかは、引数で jserver_id を渡すことにより指定します。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	775 "kana" は、環境名です。js_connect は、同じ環境名を持つ環境が jserver
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	776 内存在する時にはその id を返しそれ以外の時には新しく環境を jserver 内
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	777 に作り、その id を返します。環境名は、複数のプロセスで一つの環境を共有
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	778 するために用います。すなわち、他のプロセスが同じく "kana" という環境名
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	779 を引数としてjs_connect を呼んだ場合、そのとき得られる環境は、ここで
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	780 作られたものと同じです。他のプロセスと共有することの無い環境(間違って、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	781 共有されたくない環境)を作りたい場合がありますが、その場合には、第一引
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	782 き数として空文字列を渡してやります。それにより、jserver は常に新しい環
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	783 境を作り、それを返します。その場合、返されてきた環境が、共有されること
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	784 はありません。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	785
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	786 環境の使用を終るには、js_disconnect を用います。また、通信路が閉じられ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	787 た時には自動的に環境の使用を終えます。環境は、その環境を用いているクラ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	788 イアントがなくなった時に、jserver 内からなくなります。以下のライブラリ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	789 関数では環境を引数としたものが多く存在しますが、それらの環境は、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	790 js_connect でそのプロセスが受け取ったものである必要があります。それは、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	791 他のプロセスに勝手に環境に対してアクセスされることを防ぐためです。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	792
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	793 if((fzk_file = js_file_read(env,FZK_FILE)) == -1) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	794 if((kihon_file = js_file_read(env,KIHON_DIC)) == -1) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	795 if((setto_file = js_file_read(env,SETTO_DIC)) == -1) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	796
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	797 ここで、付属語ファイル、および辞書を jserver に読み込んでいます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	798 js_file_read は、そのファイルが jserver 内に存在しない時には、ファイル
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	799 jserver 内に読み込みその Fid(ファイル ID) を返し、jserver 内に既に存在
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	800 している時にはその id を返します。また、js_file_send は、クライアント・
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	801 サイトのファイルを読み込むのに使用します。jserver は、ファイルの同一性
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	802 のチェックを厳密に行なっていますので、クライアントとサーバから同一のファ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	803 イルを読み込んだとしても、同一のファイルがメモリー上に二つ以上存在する
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	804 ことはありません。js_file_read, js_file_send を行なうことにより、ファ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	805 イルは環境に接続されます。Fid は、jserver 内でユニークに存在するもので
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	806 すが、そのファイルに対してアクセスするためには、ファイルが接続された環
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	807 境を持っている必要があります。js_file_send, js_file_receive は、現在の
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	808 バージョンでは、まだサポートされていません。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	809
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	810 jserver のサイト上のパス名の指定は、フルパスで指定するか、JSERVER_DIR
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	811 と呼ばれるディレクトリからの相対で指定するかします。JSERVER_DIR は、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	812 jserverrc の中で指定されています。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	813
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	814 jserver 内に読み込まれたファイルは、js_file_discard によって、環境か
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	815 ら切り離されます。また、環境が先に消滅すれば、自動的にその環境から切り
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	816 離されます。そして、ファイルに対して接続している環境が無くなった時、そ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	817 のファイルは jserver 内から消滅します。ファイルによっては、jserver が
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	818 読み込んでいる間に内容が更新されているため、その更新された内容をファイ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	819 ル・システムに書き戻す必要が出てきます。それを行なうのが、js_file_write,
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	820 js_file_receive です。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	821
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	822 js_file_write, js_file_receive で、読み込んだファイルと異なるファイル
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	823 に書き出すことが可能です。その場合には、ファイルがすでに存在していれば、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	824 それが wnn のファイルの場合のみ、上書きされます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	825
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	826 ＃ js_file_write, receive が明示的に呼ばれた時以外に、ファイルが
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	827 ＃jserverないから消滅する時に自動的に書き戻しを行なってはどうかという意
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	828 ＃見もあったが、クライアント・サイトのファイルの場合には不可能なので、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	829 ＃しない。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	830
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	831 この他に、ファイルに関するライブラリとしては、js_file_list (環境に接
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	832 続されているファイルの情報一覧を得る)、js_file_list_all (jserver に読
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	833 み込まれているファイルの情報一覧を得る)、js_file_info (特定のファイル
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	834 についての情報を得る。)があります。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	835
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	836 また、アプリケーションを書くためには、jserver のあるサイトのファイル・
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	837 システムに関する情報を得る必要が生じてきます。そのために、jserver サイ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	838 ト上でのパス名を引数として取るライブラリとして
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	839
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	840 js_access 指定されたファイルの(jserver に対する)アクセス権を調べる。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	841
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	842 js_file_stat 指定されたファイルの内容(辞書、頻度ファイル。付属語ファイル
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	843 の別、ファイルに付けられているコメント)を得る
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	844
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	845 js_file_loaded 指定されたパス名のファイルが jserver 内に
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	846 読み込まれているかどうか調べる。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	847
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	848 ファイルシステムに関して、始めてアプリケーションを使う人のためのユーザ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	849 辞書や頻度ファイルを作る必要があります。そのためのライブラリとして、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	850
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	851 js_mkdir 指定された名前のディレクトリを作る。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	852 相対パスは、JSERVER_DIR からの相対で指定する。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	853 指定されたところにどこでも作ってしまうので、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	854 jserver に強い権限を与えてはいけない。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	855 (root で走らすなどもってのほか。)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	856
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	857 js_dic_file_create
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	858 指定された名前で、語数 0 の登録可能形式の辞書を作る。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	859
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	860 js_hindo_file_create
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	861 指定されたファイル id を持ったファイルの頻度ファイルを
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	862 指定されたパス名で作る。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	863
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	864 js_dic_file_create_client
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	865 指定された名前で、語数 0 の登録可能形式の辞書をクライ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	866 アントサイトに作る。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	867
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	868 js_hindo_file_create_client
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	869 指定されたファイル id を持ったファイルの頻度ファイルを
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	870 指定されたパス名で、クライアントサイトに作る。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	871
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	872 js_file_remove Wnn のファイルをファイルシステムから消す。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	873
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	874
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	875 があります。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	876
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	877 if(js_fuzokugo_set(env,fzk_file) == -1) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	878
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	879 これは、fzk_file という file_id で示されたファイルを env の付属語ファ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	880 イルとして設定しています。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	881
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	882 if((kihon_dic_no = js_dic_add(env,kihon_file,-1,1,1,-1,NULL, NULL)) == -1) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	883 if((setto_dic_no=js_dic_add(env,setto_file,-1,1,0,0,-1,NULL, NULL)) == -1) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	884
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	885 これは、kihon_file, setto_file という file_id で示されたファイルを
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	886 envの辞書として設定しています。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	887
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	888 js_dicadd(env, file_id, hfile_id, prio,
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	889 rdonly, hrdonly, passwd_file, passwd_hfile)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	890
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	891 によって、file_id で示され
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	892 たファイルを、hfile_id で示されたファイルを頻度ファイルとし、prio で示
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	893 された優先度で、辞書、頻度がそれぞれ rdonly, hrdonly で示された状態で
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	894 env に追加することを意味しています。頻度情報として辞書ファイルの内部に
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	895 もつものを使用する場合には、第三引数で -1 を設定します。また、rdonly
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	896 は WNN_DIC_RW の時、読み書き可能、WNN_DIC_RDONLY の時更新不能を意味し
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	897 ています。また、辞書には、パスワードがついていることがあります(参照)。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	898 パスワードつきの辞書、頻度を、リード・オンリーでない状態で用いたい時に
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	899 は、それぞれのファイルのパスワードを第八、第九引数として与える必要が
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	900 あります。dic_add は、返値として、辞書Ｎｏ．を返します。それ以降の辞書、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	901 頻度ファイル関する操作は、この dic_No を用いて行ないます。付属語ファイ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	902 ルは環境に対して一つ存在するものですが、辞書は、一つの環境に複数設定し
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	903 てそれら全てを変換に用います。ここでは、二つの辞書を設定しています。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	904
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	905 環境に設定されている辞書Ｎｏ．に関する情報を得るライブラリとして、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	906 js_dic_list があります。また、辞書Ｎｏ．を環境から無くさずに、一時的に無
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	907 効にするためのライブラリ (js_dic_use)があります。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	908
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	909 辞書Ｎｏ．を環境から外すには、js_dic_del を用います。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	910
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	911 環境に対する設定としては、辞書、付属語ファイルの他に、変換パラメーター
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	912 があります。変換パラメータに関しては、js_param_set によって設定を行な
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	913 い、js_param_get によって現在の設定の状態を得ます。変換パラメータに関
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	914 しては、デフォルト値が jserverrc に書かれていて、環境が js_connect で
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	915 作られた時には、その設定が用いられます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	916
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	917 if((rev_env=js_connect(js, "kanji")) == NULL) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	918 if((fzk_file = js_file_read(rev_env,FZK_FILE)) == -1) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	919 if((rev_file = js_file_read(rev_env,REV_DIC)) == -1) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	920 if((rev_setto_file = js_file_read(rev_env,REV_DIC_SETTO)) == -1) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	921
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	922 if(js_fuzokugo_set(rev_env,fzk_file) == -1) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	923 if((rev_dic_no = js_dic_add(rev_env,rev_file,-1,1,WNN_DIC_RDONLY, WNN_DIC_RDONLY, NULL, NULL)) == -1) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	924 if((rev_setto_dic_no = js_dic_add(rev_env,rev_setto_file,-1,1,WNN_DIC_RDONLY, WNN_DIC_RDONLY, NULL, NULL)) == -1) err();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	925
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	926
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	927 上記のかな漢字変換用の環境とは別に、もう一つ、漢字かな変換用の環境を作
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	928 り、それに対して設定を行なっています。ここで、fzk_fileとしては、同じファ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	929 イルIDが返ってくるはずですが、fzk_file に関係するfile_read を再度行なっ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	930 ていることに注意して下さい。先程述べたように、その環境に対して
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	931 file_readを先に行なっていないと、そのファイルがその環境で使えないからです。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	932
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	933 henkan();
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	934
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	935 henkan の中身は、御覧のように、読み文字列を得て、内部 UJIS コードに変
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	936 換して、仮名漢字変換を行ない、結果を表示するというものです。jserver と
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	937 の通信は、日本語のコードとして、全て内部 UJIS を用いて行ないます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	938
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	939 dcnt =js_kanren(c_env,u,WNN_BUN_SENTOU, NULL, WNN_VECT_KANREN, WNN_VECT_NO,&rb);
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	940
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	941 これは、連文節変換を行なうライブラリ関数です。先に説明した通り、変換
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	942 の関数は、全て、環境(c_env)と、読み(u), 結果を入れる領域へのポインタ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	943 (&rb)を引数として持ちます。後の４つの引数は、変換結果に影響を与える
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	944 パラメータとなるものです。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	945 第３、４引数は、変換文字列の先頭に関する設定、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	946 第５，第６引数は、変換文字列の終端に関する設定です。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	947
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	948 前にも述べたように、Ver.4 では、大文節と小文節を扱います。連文節変換で
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	949 は、変換の結果返してくるものは大文節の列ですが、指定の仕方によっては、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	950 先頭の大文節および最後の大文節は、完全な大文節ではなく、大文節の部分を
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	951 返させることが可能です。それによって、前端と終端に接続条件の制約を
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	952 与えて変換を行なうことができます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	953
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	954 具体的には、前端の設定については、ある小文節の自立語の品詞と付属語列を第
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	955 3、第4引数で指定することにより、先頭の大文節として、その小文節とつながっ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	956 て大文節を構成する小文節列を得ることができます。前端の設定を行わない時
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	957 には、WNN_BUN_SENTOU を第３引数として指定すれば、前端が大文節の前端と
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	958 なるように変換を行います。WNN_ALL_HINSI を第３引数として指定すれば、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	959 前端が小文節の前端となるように変換を行います。この場合には、先頭の大文
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	960 節は擬似的なものとなります。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	961
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	962 終端の設定については、ベクトル(品詞の集合)の番号を第５，第６引数に指定
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	963 することにより、最後の大文節として、そのベクトルを終端ベクトルとして解
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	964 析した結果を返します。第５引数で指定されたベクトルが優先されて探索され、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	965 第6引数で指定されたものは、それより低い評価値として計算されます。この
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	966 ように、二つベクトルを指定するのは、全候補を得る時などに、「ある品詞で
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	967 終る文節を得たいが、それが存在しない時には、他の品詞のものでもよい」と
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	968 いうことが生じるからです。ベクトルとしては、jslib.h で define されてい
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	969 る３つのベクトル、WNN_VECT_KANREN、WNN_VECT_KANTAN、WNN_VECT_KANZEN、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	970 および、解析結果としてかえされる、各小文節の前端ベクトル(前につながる
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	971 ことのできる小文節の最後の品詞) を用います。これらのベクトルの内容は、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	972 付属語ファイルで指定されます。また、WNN_VECT_NO を第６引数に指定すると、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	973 そのベクトルは無視されます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	974
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	975 具体的に、この機構がどのように使われるかを説明します。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	976 各[i]を小文節とし、∥ を大文節の区切りとします。最初の変換で、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	977
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	978 ∥[1][2][3]∥[4]∥[5]∥[6][7]∥[8][9]∥
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	979
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	980 という結果が得られたとします。ここで、[1],[2],および、[7]以降は正しく
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	981 変換されていて、[3] から [6] は読みを入れ間違えたために誤変換が起こっ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	982 ているとします。これに対して、[3] から [6] までの文節を解除して読みを
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	983 直して変換し直したいとします。その時、[2] の文節の情報を第3、4引数とし
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	984 て与え、[7]の小文節の前端ベクトルを第5引数として与え、[3] から [6] ま
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	985 での読みを与えることによって、例えば
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	986
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	987 [3']∥[4'][5']∥[6']
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	988
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	989 といった文節列で、[3'] は [1],[2] とつながって大文節を構成し、[6'] は
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	990 [7]とつながって大文節を構成するような変換結果が得られます。高レベル・
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	991 ライブラリは、前後の指定を自分で行なわなくても、このような変換が行え
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	992 るように作られています。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	993
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	994 最後の大文節以外の大文節の終端ベクトルは、WNN_VECT_KANREN が用いられま
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	995 す。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	996
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	997 前端の接続条件を指定して変換を行った時に、その接続条件を満たすものが無
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	998 い場合には、そこが大文節の先頭となるような結果を返します。それも存在し
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	999 ない場合には、そこが小文節の先頭となるものを返します。この場合には、返
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1000 してくるものは、擬似的な大文節です。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1001
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1002 それぞれの小文節は、その status として、前への接続状況を持っています。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1003 status がWNN_CONNECT ならば、前の小文節に接続している、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1004 WNN_SENTOU なら、大文節の先頭である。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1005 WNN_NOT_CONNECT なら、大文節の先頭でもないし、前に接続もしない。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1006 WNN_GIJI なら、擬似小文節です。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1007
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1008 この、接続状況の設定は、大文節というものを考える限り必要ではありますが、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1009 中々難しい所です。特に、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1010
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1011 ＃現在のところ、前端の文節が前に接続する時、および、後端の文節が後ろに接
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1012 ＃続する時の、文節の評価値の決め方が結構いい加減です。また、疑似文節に対
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1013 ＃する評価値の決め方も、かなりいい加減なところがあります。それで、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1014 ＃これらの文節の評価値の決め方を変更しようという計画があって、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1015 ＃リリース時には、すでに、変更されているかもしれません。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1016
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1017 ＃現在の所、前者の問題に付いては、前に接続する文節列は、評価値を２倍とし
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1018 ＃て評価を進めることにより、優先して出されるようにし、大文節の先頭となら
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1019 ＃ない小文節を先頭として解析が終了した時には、その文節列の評価値を１／２
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1020 ＃にして、大文節の先頭となるものが優先されるようにしています。ただし、前
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1021 ＃端条件として WNN_BUN_SENTOU を指定して変換した時には、前者の処理は行わ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1022 ＃ず、WNN_ALL_HINSI を指定して変換した時には、両方の処理を行いません。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1023
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1024 ＃将来的には、変換の時に、変換文字列の前の小文節列の評価値も送ってやって、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1025 ＃それを元に、前に接続する文節列の評価値を決めるようにする方向に議論が進
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1026 ＃んでいます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1027 ＃また、終端に付いても、同様です。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1028
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1029 変換に付いては、js_kanren の他に、kantan, kanzen がありますが、これら
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1030 も前端、終端の接続条件を指定して変換を行います。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1031
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1032 kantan, kanzen については、kantan_dai, kantan_syo 、kanzen_dai,
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1033 kanzen_syo という区別があります。kantan_sho, kanzen_sho は、与えられた
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1034 文字列が一つの小文節を成すものとして変換を行います。kantan_dai,
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1035 kanzen_dai は、一つの大文節の部分を成す小文節の列を
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1036 返すように変換を行います。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1037
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1038 頻度の更新に付いては、js_hindo_set(env,dic_No,entry,ima,hindo) (ある辞
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1039 書のあるエントリの頻度、今使ったよビットの値をある値にセットする。) を
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1040 用います。ここで、与える頻度地は、実頻度値(jserver の中で圧縮して持っ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1041 ている値ではなく、実際に使われた回数) です。今使ったよビット、頻度の値
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1042 は、別々に指定し、どちらか一方の値しか変化させない時には、もう一方の値
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1043 をWNN_HINDO_NOP としていします。頻度に付いては、値を指定してセットする
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1044 だけではなく、WNN_HINDO_INC (頻度を１上げる) WNN_HINDO_DEL (頻度を１
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1045 下げる)があります。WNN_HINDO_INC をしても、内部的には頻度は圧縮して持っ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1046 ているので、必ずしも上がるとは限りません。この他に、WNN_ENTRY_NO_USE
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1047 を指定すると、そのエントリは、それ以降の変換で用いられなくなります。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1048 (マイナス無限大にセットするという感じでしょうか。)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1049
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1050 js_close(js);
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1051
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1052 最後に、js_close を呼んで、コネクションを切断しています。コネクション
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1053 を切断することにより、そのコネクションから起こした全ての環境は、他のク
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1054 ライアントと共有していない限りなくなり、それらの環境で読み込んだファイ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1055 ルで、他の環境から読み込まれていないものは全てメモリー上から開放されま
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1056 す。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1057
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1058 その他の低レベル・ライブラリとして、品詞関係のものがあげられます。品詞
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1059 は、品詞ファイルの中で、階層的に分類されています。階層の途中に位置する
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1060 ものは、品詞の集合を表すノードで、リーフに当たるものが、本当の品詞です。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1061 この情報は、単語登録時に、品詞を選択するのに用いられます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1062
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1063 現在作られている
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1064 品詞ファイルの設定では、次のようになっています。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1065
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1066 ------------------------------------------------------------
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1067
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1068 /\|普通名詞/:固有名詞/:動詞/:特殊な動詞/:動詞以外の用言/\
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1069 :その他の独立語/:接頭語,接尾語/:単漢字:疑似品詞/
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1070
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1071 普通名詞/\|名詞:サ行(する)&名詞:一段&名詞:形容動詞&名詞:数詞
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1072 固有名詞/\|人名:地名:人名&地名:固有名詞
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1073
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1074 動詞/\|一段:一段&名詞\
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1075 :カ行五段:ガ行五段:サ行五段:タ行五段:ナ行五段\
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1076 :バ行五段:マ行五段:ラ行五段:ワ行五段\
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1077 :サ行(する):サ行(する)&名詞:ザ行(ずる)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1078 特殊な動詞/\|カ行(行く):ラ行(下さい)\
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1079 :来(こ):来(き):来(く):為(し):為(す):為(せ)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1080 動詞以外の用言/\|形容詞:形容動詞:形容動詞&名詞:形容動詞(たる)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1081
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1082 その他の独立語/\|副詞:連体詞:接続詞,感動詞
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1083
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1084 接頭語,接尾語/\|接頭語:接尾語:接尾人名:接頭地名:接尾地名\
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1085 :接頭数詞:助数詞:接頭助数詞:接尾助数詞\
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1086 :形容動詞化接尾語:サ行(する)&名詞化接尾語:接尾動詞:形容詞化接尾動詞\
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1087 :接頭語(お)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1088
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1089 疑似品詞/\|数字:カナ:英数:記号:閉括弧:開括弧:付属語
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1090 ------------------------------------------------------------
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1091
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1092 品詞に関するライブラリは、以下の３つがあります。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1093
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1094 js_hinsi_list ノード名を引数にとり、そのノードに属する品詞名の一覧を得る。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1095
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1096 js_hinsi_name 品詞番号から名前を取る。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1097
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1098 js_hinsi_number 品詞名を品詞番号に変換する。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1099
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1100
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1101 この他のライブラリについては、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1102
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1103 js_dic_info(env,dic_No,ret)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1104 dic_No の辞書に付いての情報を得る。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1105
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1106 js_word_add(env,dic_No,読み,漢字,品詞)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1107 dic_No の辞書No. に、単語を登録する。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1108
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1109 js_word_delete(env,dic_No,Yomi,jisho_entry)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1110 dic_No の辞書から単語を削除する。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1111
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1112 js_word_search(env,dic_No,読み,ret_buf)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1113 dic_No の辞書に単語検索を行う。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1114
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1115 js_word_search_by_env(env,読み,ret_buf)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1116 環境中の全ての辞書Ｎｏ．に対して単語検索を行う。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1117
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1118 js_word_info(env, dic_No, entry, ret_buf)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1119 dic_No の辞書の entry 番目の entry について、細かい情報を得る。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1120
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1121 js_who
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1122 jserver の使用者の一覧を得る。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1123
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1124 js_kill
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1125 jserver の使用者がない時に、jserver を終了させる。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1126
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1127 などがあります。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1128
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1129 ＃ライブラリの引数は、このドキュメントを書いた時点から変更されているか
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1130 ＃もしれないので、マニュアルの方を見て下さい。また、最近つけ加わったライ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1131 ＃ブラリについては、ここでは述べていません。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1132
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1133
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1134
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1135 ３．２　高レベル・ライブラリ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1136
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1137 高レベル・ライブラリでは、ユーザの変換の履歴を「バッファ」に残すことにより、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1138 ●それぞれの変換を行う時の前端、後端の接続条件などの設定を行う。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1139 ●頻度更新する時に、選択されなかった語に対し今使ったよビットを落とす。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1140 といった処理をします。また、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1141 ●次候補列をつくり、その中からの設定の便宜を計ります。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1142 次候補列を作る時には、最初の変換で返ってきた候補を次候補列の先頭に持っていく、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1143 同じ候補が重複しないようにするなどの処理をおこないます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1144
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1145 「バッファ」は複数持つことが出来ます。その時、不必要になった環境、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1146 jserver との通信路の破壊などの面倒も見ます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1147
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1148 Ver.4 では、「環境」、「ファイル」、「大文節」といった複雑な概念が存在
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1149 しましたが、高レベルライブラリではこれらの概念について知らなくてもライ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1150 ブラリを用いたプログラムが組めるようになっています。もちろん、大文節、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1151 環境などを直接扱いたい場合には、扱うことが出来ます。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1152
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1153 また、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1154 ●環境に関する初期設定を行う。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1155 ●辞書追加の時、存在しない辞書、頻度ファイルの作成
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1156 といった処理も行います。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1157
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1158
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1159 ４．アプリケーション
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1160
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1161 ４．１ uum
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1162 uum は、バージョン３で wnn と呼ばれていたものと、ほとんど同じです。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1163 小さなところは色々手が加えられていますが、大きな違いは、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1164 ●小文節を反転、大文節を下線によって表す。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1165 ●大文節に対する操作を可能にする。(デフォルトとする)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1166 ●inspect, 単語検索、辞書検索の画面から、単語や辞書の
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1167 削除や使用の変更の指定が行なえるようになっている。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1168 ●大文節に対応した、今までより統一的なキーバインドをデフォルトとする。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1169 といったところでしょうか。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1170
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1171 uum では、文節に対する基本的操作は、主に大文節に対して行なわれます。基
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1172 本的な操作とは、次候補、伸ばしなどです。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1173 しかし、小文節についての編集を行ないたいこともあると考えられるので、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1174 そのためのバインドも行なっています。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1175 (文節の移動については、小文節単位のものがデフォルトになる予定です。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1176 というか、大文節のものは、作るのを忘れていた。)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1177
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1178 (デフォルトのキーバインドは、いままでよりかなり統一的なものとなっています。)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1179
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1180 uum のもう一つの特徴として、inspect の画面(デフォルトでは、Ctrl_Vにバ
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1181 インドされると思います。)の中から、単語の削除や単語使用の中断が出来る
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1182 ことがあります。単語の削除は Ctrl_D、使用の中断は Ctrl_U にデフォルト
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1183 でバインドされると思います。これにより、「こんな単語が辞書にあるから変
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1184 換がおかしくなるんや」と思った時に、その単語を含む小文節のところにカー
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1185 ソルを持っていって、Ctrl_Z + Ctrl_Uをすることにより、それ以降その単語
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1186 が変換に用いられなくなります。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1187
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1188 また、単語検索の画面でも、 Ctrl_D、Ctrl_U で単語の辞書からの削除、単語
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1189 の使用状態の変更(すなわち、変換に使われていたものの使用を中断したり、
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1190 使用を中断されているものの使用を再開したり)が可能になっています。(使用
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1191 を中断されている単語は、単語検索時に、頻度が "---" で表されています。)
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1192
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1193 さらに、辞書検索の画面からも、辞書の削除、使用状態の変更が Ctrl_D,
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1194 Ctrl_U で出来るようになっています。
bbc77ca4def5 initial import Yoshiki Yazawa <yaz@cc.rim.or.jp> parents: diff changeset	1195

Mercurial > freewnn

annotate Wnn/manual/intro @ 2:b605a0e60f5b