0
|
1 .\" -*-Mode: nroff-*-
|
|
2 .\" $Id: pod.jmn,v 1.5 1994/05/31 11:29:44 kon Exp $
|
|
3 .nr X 0
|
|
4 .if \nX=0 .ds X} pod 1 "日本語機能ユーティリティ" "\&"
|
|
5 .TH \*(X}
|
|
6 .SH "名前"
|
|
7 pod \- ポータブル辞書形式辞書の種々の操作を行うコマンド
|
|
8 .SH "形式"
|
|
9 .B "pod [\fIoptions\fP] \fIdic1\fP [\fIdic2\fP]"
|
|
10 .SH "説明"
|
|
11 .PP
|
|
12 .IB pod
|
|
13 はポータブル辞書形式の辞書の種々の操作を行うツールであり、辞書のソート、
|
|
14 ユニーク化、比較などを行います。
|
|
15 .PP
|
|
16 どのような処理が行われるかは指定する辞書の数と\fIoptions\fPに依存しま
|
|
17 す。
|
|
18 .PP
|
|
19 単一の辞書を指定すると指定された辞書\fIdic1\fPがソートされ、標準出力に
|
|
20 表示されます。表示される内容で、同一の行が複数現れることはありません。
|
|
21 読み、候補、品詞が同一であればたとえ頻度が異なっていても同一の行とみな
|
|
22 されます。
|
|
23 .PP
|
|
24 2つの辞書を指定するとその2つの辞書の間で項目の比較を行います。比較の
|
|
25 結果、\fIdic1\fP にのみ含まれる項目、\fIdic2\fP にのみ含まれる項目、
|
|
26 \fIdic1\fP および \fIdic2\fP に共通に含まれる項目に分類されます。分類
|
|
27 された項目は\fIoptions\fPの指定により、定められた場所に出力されます。
|
|
28 .PP
|
|
29 \fIdic1\fP あるいは \fIdic2\fP として \- を指定することができ、その場
|
|
30 合にはファイルの代わりに標準入力が参照されます。\fIdic1\fP および
|
|
31 \fIdic2\fP の両方同時に \- を指定することはできません。
|
|
32 .PP
|
|
33 コマンドアーギュメントは \fIdic1\fP と \fIdic2\fP の出現順以外
|
|
34 は順番を問いません。\fIoptions\fP は辞書の指定の後に現れてもかまいませ
|
|
35 ん。
|
|
36 .SH "オプション"
|
|
37
|
|
38 .IP "\-1" 12
|
|
39 ソースとなる辞書の品詞フィールドがスラッシュ(/)で区切られているとき、
|
|
40 pod の出力としては一番左のフィールドに記述された品詞のみを選択して出力
|
|
41 するようにします。
|
|
42
|
|
43 .IP "\-2" 12
|
|
44 ソースとなる辞書の品詞フィールドがスラッシュ(/)で区切られているとき、
|
|
45 pod の出力としては真ん中のフィールドに記述された品詞のみを選択して出力
|
|
46 するようにします。
|
|
47
|
|
48 .IP "\-3" 12
|
|
49 ソースとなる辞書の品詞フィールドがスラッシュ(/)で区切られているとき、
|
|
50 pod の出力としては一番右のフィールドに記述された品詞のみを選択して出力
|
|
51 するようにします。
|
|
52
|
|
53 .IP "\-b \fIkind\fP" 12
|
|
54 出力するエントリのすべての行に \fIkind\fP で示した種類フィールドを付加
|
|
55 します。
|
|
56
|
|
57 .IP "\-c \fIfile\fP" 12
|
|
58 \fIdic1\fP および \fIdic2\fP に共通に含まれる項目がファイル \fIfile\fP
|
|
59 に出力されます。ファイル名として \- を指定すると標準出力に出力されます。
|
|
60
|
|
61 .IP "\-d \fIfile\fP" 12
|
|
62 \fIfile\fP に使われているルールを使って、各エントリを終止形に直します。
|
|
63
|
|
64 .IP "\-f" 12
|
|
65 頻度値をコピーします(どこからどこへ?)。
|
|
66
|
|
67 .IP "\-h" 12
|
|
68 上記の比較の際、品詞の違いを違いとみなしません。\fIdic1\fP と
|
|
69 \fIdic2\fP において読みと候補が同一の項目は項目全体が同一であるとみな
|
|
70 されます。
|
|
71
|
|
72 .IP "\-i" 12
|
|
73 出力形式として『かんな』のテキスト辞書形式で出力を行います。
|
|
74
|
|
75 .IP "\-j" 12
|
|
76 カタカナだけからなるエントリを抽出し出力します。
|
|
77
|
|
78 .IP "\-k \fIkind\fP"
|
|
79 出力するエントリとしては、\fIkind\fP で示された種類フィールドを持った
|
|
80 ものだけを出力します。
|
|
81
|
|
82 .IP "\-l"
|
|
83 種類フィールドとしてどのようなものが存在するかのリストを出力します。辞
|
|
84 書の出力は行われません。
|
|
85
|
|
86 .IP "\-m"
|
|
87 2つの辞書の比較を行う際に、種類フィールドのみが違うエントリに関しては
|
|
88 同一のエントリとして \-c で示された出力先に対して出力します。その際に
|
|
89 2つの辞書におけるそれぞれの種類フィールドをマージして出力します。
|
|
90
|
|
91 .IP "\-n \fIfile\fP" 12
|
|
92 \fIdic2\fP にのみ含まれる項目がファイル \fIfile\fP に出力されます。ファ
|
|
93 イル名として \- を指定すると標準出力に出力されます。
|
|
94
|
|
95 .IP "\-o \fIfile\fP" 12
|
|
96 \fIdic1\fP にのみ含まれる項目がファイル \fIfile\fP に出力されます。ファ
|
|
97 イル名として \- を指定すると標準出力に出力されます。
|
|
98
|
|
99 .IP "\-p" 12
|
|
100 ソートは通常、ポータブル辞書形式をテキストファイルとみなして、sort(1)
|
|
101 コマンドに与えたときと同じ順序となるように行われますが、\-p オプション
|
|
102 を与えた場合は、同一の読みに対しては頻度の大きいものほど先に現れるよう
|
|
103 にソートします。頻度が同じ値である場合にはその他の部分の sort(1) 順に
|
|
104 したがいます。
|
|
105
|
|
106 .IP "\-r \fItranslation_table\fP" 12
|
|
107 \-s と同様に品詞名の付け替えを行いますが、\fItranslation_table\fP に記
|
|
108 述されている規則を逆に適用します。すなわち、\-s の場合と逆の変換を行い
|
|
109 ます。
|
|
110
|
|
111 .IP "\-s \fItranslation_table\fP" 12
|
|
112 品詞名付け替えファイル \fItranslation_table\fP に記述されている規則に
|
|
113 したがって品詞名の付け替えを行います。品詞名付け替えファイルは、各行が、
|
|
114 元の品詞、付け代わる品詞、の組みから構成されているファイルです。
|
|
115 \fIdic1\fP および \fIdic2\fP にて使われている品詞名の付け替え規則が
|
|
116 \fItranslation_table\fP に見つからない場合にはエラーを発生し処理が中断
|
|
117 します。
|
|
118
|
|
119 .IP "\-v" 12
|
|
120 出力形式として SJ3 のビジュアル形式辞書で出力を行います。
|
|
121
|
|
122 .IP "\-w" 12
|
|
123 出力形式として Wnn のテキスト形式辞書で出力を行います。
|
|
124
|
|
125 .IP "\-x" 12
|
|
126 SJ3 とマージします(本当か?)。
|
|
127
|
|
128 .SH "使用例"
|
|
129 .IP (1) 4
|
|
130 辞書 foo.p の内容をソートし表示します。
|
|
131 .sp
|
|
132 .ft CW
|
|
133 .nf
|
|
134 % pod foo.p
|
|
135 .fi
|
|
136 .ft
|
|
137 .sp
|
|
138 .IP (2) 4
|
|
139 辞書 foo.p および bar.p をマージし、ソートし出力します。
|
|
140 .sp
|
|
141 .ft CW
|
|
142 .nf
|
|
143 % cat foo.p bar.p | pod -
|
|
144 .fi
|
|
145 .ft
|
|
146 .sp
|
|
147 .IP (3) 4
|
|
148 辞書 foo.p について、同一の読みについては頻度の大きい順にソートして出
|
|
149 力します。
|
|
150 .sp
|
|
151 .ft CW
|
|
152 .nf
|
|
153 % pod foo.p -p
|
|
154 .fi
|
|
155 .ft
|
|
156 .sp
|
|
157 .IP (4) 4
|
|
158 辞書 foo.p から foo.p.new への変更を、削除された分についてはファイル名
|
|
159 del のファイルに、追加された分についてはファイル名 add のファイルに出
|
|
160 力することにより差分を求めます。
|
|
161 .sp
|
|
162 .ft CW
|
|
163 .nf
|
|
164 % pod foo.p foo.p.new -o del -n add
|
|
165 .fi
|
|
166 .ft
|
|
167 .sp
|
|
168 .IP (5) 4
|
|
169 辞書 foo.p からファイル del に含まれる項目を削除し、ファイル add に含
|
|
170 まれる項目を追加し、foo.p.new に出力します。
|
|
171 .sp
|
|
172 .ft CW
|
|
173 .nf
|
|
174 % (cat add ; pod foo.p del -o -) | pod - > foo.p.new
|
|
175 .fi
|
|
176 .ft
|
|
177 .sp
|
|
178 .IP (6) 4
|
|
179 辞書 bar.p に含まれている各項目に一致する項目を、たと
|
|
180 え品詞が異なっていてもよいから辞書 foo.p から抽出し標準出力に出力します。
|
|
181 .sp
|
|
182 .ft CW
|
|
183 .nf
|
|
184 % pod -h foo.p bar.p -c -
|
|
185 .fi
|
|
186 .ft
|
|
187 .sp
|
|
188 .IP (7) 4
|
|
189 辞書 foo.p の品詞名を品詞変更テーブルファイル wc.tab をベースに変更しま
|
|
190 す。
|
|
191 .sp
|
|
192 .ft CW
|
|
193 .nf
|
|
194 % pod -s wc.tab foo.p
|
|
195 .fi
|
|
196 .ft
|
|
197 .sp
|
|
198 .IP (8) 4
|
|
199 辞書 pubdic.p から、種別フィールドとして bio が記述されているエントリ
|
|
200 のみを bio.p と言うファイルに取り出します。
|
|
201 .sp
|
|
202 .ft CW
|
|
203 .nf
|
|
204 % pod -k bio pubdic.p > bio.p
|
|
205 .fi
|
|
206 .ft
|
|
207 .sp
|
|
208 .IP (9) 4
|
|
209 辞書 pubdic.p から、種別フィールドとして bio が記述されているエントリ
|
|
210 のみを取り出し、さらに品詞も Wnn のものを選択し Wnn のテキスト辞書形式
|
|
211 で取り出します。変換結果を bio.uに出力します。
|
|
212 .sp
|
|
213 .ft CW
|
|
214 .nf
|
|
215 % pod -k bio pubdic.p -w -1 > bio.u
|
|
216 .fi
|
|
217 .ft
|
|
218 .sp
|
|
219 .IP (10) 4
|
|
220 Wnn の辞書 bio.u の各エントリに種別を表す bio と言う種別フィールドを付
|
|
221 加し、出力します。
|
|
222 .sp
|
|
223 .ft CW
|
|
224 .nf
|
|
225 % pod -b bio bio.u
|
|
226 .fi
|
|
227 .ft
|
|
228 .sp
|
|
229 .IP (11) 4
|
|
230 辞書 pubdic.p と special.p をマージし、頻度でソートし、『かんな』の品
|
|
231 詞を選択し、『かんな』のテ
|
|
232 キスト辞書形式で iroha.t と言うファイルに出力します。
|
|
233 .sp
|
|
234 .ft CW
|
|
235 .nf
|
|
236 % cat pubdic.p special.p | pod - -p -i -2 > iroha.t
|
|
237 .fi
|
|
238 .ft
|
|
239 .sp
|
|
240 .IP (12) 4
|
|
241 辞書 pubdic.p と special.p をマージし、頻度でソートし、SJ3 の品詞を選
|
|
242 択し、SJ3 のビジュアル辞書形式で visual.dic と言うファイルに出力します。
|
|
243 .sp
|
|
244 .ft CW
|
|
245 .nf
|
|
246 % cat pubdic.p special.p | pod - -p -v -3 > visual.dic
|
|
247 .fi
|
|
248 .ft
|
|
249 .sp
|
|
250 .SH "バグ"
|
|
251 エラーチェックをあまりしていません。辞書をいったんメモリ上に読み込むの
|
|
252 でメモリをかなり消費します。\-s オプション、\-r オプションに関しては仕
|
|
253 様の変更を行う予定です。
|
|
254 .PP
|
|
255 頻度だけが異なる項目の削除のしかたに法則性がありません。これは法則性を
|
|
256 持たせるように仕様を変更する予定です。
|
|
257 .SH "関連情報"
|
|
258 ctop(1), ptoc(1)
|