Mercurial > freewnn
view Wnn/include/jslib.h @ 17:a3fdd8ad75dc
2ch dictionary has been added
author | Yoshiki Yazawa <yaz@cc.rim.or.jp> |
---|---|
date | Mon, 14 Apr 2008 17:01:14 +0900 |
parents | 1f16ab4b33e5 |
children |
line wrap: on
line source
/* * $Id: jslib.h,v 1.5 2005/04/10 15:26:37 aonoto Exp $ */ /* * FreeWnn is a network-extensible Kana-to-Kanji conversion system. * This file is part of FreeWnn. * * Copyright Kyoto University Research Institute for Mathematical Sciences * 1987, 1988, 1989, 1990, 1991, 1992 * Copyright OMRON Corporation. 1987, 1988, 1989, 1990, 1991, 1992, 1999 * Copyright ASTEC, Inc. 1987, 1988, 1989, 1990, 1991, 1992 * Copyright FreeWnn Project 1999, 2000 * * Maintainer: FreeWnn Project <freewnn@tomo.gr.jp> * * This library is free software; you can redistribute it and/or * modify it under the terms of the GNU Lesser General Public * License as published by the Free Software Foundation; either * version 2 of the License, or (at your option) any later version. * * This library is distributed in the hope that it will be useful, * but WITHOUT ANY WARRANTY; without even the implied warranty of * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU * Lesser General Public License for more details. * * You should have received a copy of the GNU Lesser General Public * License along with this library; if not, write to the * Free Software Foundation, Inc., 59 Temple Place - Suite 330, * Boston, MA 02111-1307, USA. */ /* * Nihongo Henkan Library Header File */ #ifndef WNN_JSLIB_H #define WNN_JSLIB_H #ifndef _WNN_SETJMP #define _WNN_SETJMP #include <setjmp.h> #endif #define JLIB_VERSION 0x4003 #ifndef w_char #define w_char unsigned short #endif /* w_char */ /* 前端ベクタ(品詞番号)の定義 */ #define WNN_BUN_SENTOU -1 /* 大文節の先頭になれる奴 */ #define WNN_ALL_HINSI -2 /* なんでもええよ */ /* 終端ベクタの定義 */ #define WNN_VECT_KANREN 0 /* 連文節変換の終端ベクター */ #define WNN_VECT_KANTAN 1 /* 単文節変換の終端ベクター */ #define WNN_VECT_KANZEN 1 /* 全候補取出しの終端ベクター 単文節変換時のものと等しい。 */ #define WNN_VECT_BUNSETSU 2 /* 連文節変換時の、各文節の終端ベクター */ #define WNN_VECT_NO -1 /* 終端ベクタ1 無し */ /* 文節の終端の接続情報 */ #define WNN_CONNECT_BK 1 /* 指定された終端ベクターに接続できた。 */ #define WNN_NOT_CONNECT_BK 0 /* */ /* 文節の前端の接続情報 */ #define WNN_CONNECT 1 /* 指定された(品詞、付属語)に接続できた。 */ #define WNN_SENTOU 2 /* 大文節の先頭 */ #define WNN_NOT_CONNECT 3 /* 先頭になれないし、前に接続できない */ #define WNN_GIJI 4 /* 疑似文節を作った。 */ /* 疑似文節の直前に選択した候補 */ #define WNN_HIRAGANA -1 /* ひらがな */ /* 読みのまま */ #define WNN_KATAKANA -11 /* カタカナ */ /* 数字 */ #define WNN_NUM_HAN -2 /* 半角数字 */ /* 読みのまま */ #define WNN_NUM_ZEN -12 /* 全角数字 */ /* 123 */ #define WNN_NUM_KAN -13 /* 漢数字 */ /* 一二三 */ #define WNN_NUM_KANSUUJI -15 /* 漢数字 */ /* 百二十三 */ #define WNN_NUM_KANOLD -16 /* 漢数字 */ /* 壱百弐拾参 */ #define WNN_NUM_HANCAN -17 /* 半角数字 */ /* 1,234 */ #define WNN_NUM_ZENCAN -18 /* 全角数字 */ /* 1,234 */ /* 英数 */ #define WNN_ALP_HAN -4 /* 半角 */ /* 読みのまま */ #define WNN_ALP_ZEN -30 /* 全角 */ /* 記号 */ #define WNN_KIG_HAN -5 /* 半角 */ /* 読みのまま */ #define WNN_KIG_JIS -40 /* 全角(JIS) */ #define WNN_KIG_ASC -41 /* 全角(ASC) */ #define WNN_FT_DICT_FILE 1 #define WNN_FT_HINDO_FILE 2 #define WNN_FT_FUZOKUGO_FILE 3 #define WNN_STATIC_DICT 1 /* static dict */ #define WNN_UD_DICT 2 /* updatable dict */ #define WNN_REV_DICT 3 /* Updatable Dictonary with Reverse Index */ #define WNN_REG_DICT 4 /* Regular Expressino Dictonary */ /* for CHINESE PIN-IN : with Si Sheng (四声) */ #define CWNN_REV_DICT 0x103 /* Updatable with Reverse Index */ /* for CHINESE: Bi Xing (筆形) */ #define BWNN_REV_DICT 0x203 /* Updatable with Reverse Index */ #define WNN_DIC_RDONLY 1 #define WNN_DIC_RW 0 #define WNN_DIC_ADD_REV 1 /* 逆変換 */ #define WNN_DIC_ADD_NOR 0 /* 通常の変換 */ /* header file for dic_syurui */ #define WNN_FILE_NOT_EXIST -1 #define WNN_NOT_A_JISHO 0 /* KURI #define WNN_USER_DIC 1 #define WNN_SYSTEM_DIC 3 */ #define WNN_HINDO_FILE 4 #define WNN_FUZOKUGO_FILE 5 /* set_hindo operation */ #define WNN_HINDO_NOP -2 #define WNN_IMA_ON -3 #define WNN_IMA_OFF -4 #define WNN_HINDO_INC -3 #define WNN_HINDO_DECL -4 #define WNN_ENTRY_NO_USE -1 /* Wnn constant */ #define WNN_HOSTLEN 16 #define WNN_ENVNAME_LEN 32 /* js_who */ #define WNN_MAX_ENV_OF_A_CLIENT 32 struct wnn_jwho { int sd; /* jserver 内のソケットディスクリプタ */ char user_name[64]; /* ユーザ名 */ char host_name[64]; /* ホスト名 */ int env[WNN_MAX_ENV_OF_A_CLIENT]; /* このクライアントが使用している 環境番号の列。空いているところには、-1 が入る */ }; typedef struct wnn_jwho WNN_JWHO; /* js_env_list */ #define WNN_MAX_JISHO_OF_AN_ENV 30 #define WNN_MAX_FILE_OF_AN_ENV 60 struct wnn_env_info { int env_id; /* 環境番号 */ char env_name[WNN_ENVNAME_LEN]; /* 環境名 */ int ref_count; /* 参照数 */ /* struct wnn_param; */ int fzk_fid; /* 付属語のファイル番号 */ int jishomax; /* 使用している辞書の個数 */ int jisho[WNN_MAX_JISHO_OF_AN_ENV]; /* 使用している辞書の辞書番号。 最初のjishomax個だけ意味がある */ int file[WNN_MAX_FILE_OF_AN_ENV]; /* この環境につながっている ファイル番号(空いているところには、-1 が入る) */ }; typedef struct wnn_env_info WNN_ENV_INFO; #define WNN_COMMENT_LEN 512 /* jisho no comment no nagasa */ #define WNN_F_NAMELEN 100 #define WNN_PASSWD_LEN 16 /* File Passwd Length */ struct wnn_dic_info { int dic_no; /* 辞書番号 */ int body; /* 辞書本体のファイル番号 */ int hindo; /* 頻度のファイル番号 */ int rw; /* 辞書が登録可能かどうか (WNN_DIC_RW, WNN_DIC_RDONLY) */ int hindo_rw; /* 頻度が更新可能かどうか (WNN_DIC_RW, WNN_DIC_RDONLY) */ int enablef; /* 辞書が使用中かどうか (1 = 使用中, 0 = 使用中断) */ int nice; /* 辞書の変換時の優先度 */ int rev; /* 逆変換か、どうか(1 = 逆変換, 0 = 正変換) */ /* added H.T */ w_char comment[WNN_COMMENT_LEN]; /* 辞書のコメント */ char fname[WNN_F_NAMELEN]; /* 辞書のファイル名 */ char hfname[WNN_F_NAMELEN]; /* 頻度のファイル名 */ char passwd[WNN_PASSWD_LEN]; /* 辞書のパスワード */ char hpasswd[WNN_PASSWD_LEN]; /* 頻度のパスワード */ int type; /* 辞書の種類(WNN_UD_DICT,WNN_STATIC_DICT) */ int gosuu; /* 辞書の語数 */ int localf; int hlocalf; }; typedef struct wnn_dic_info WNN_DIC_INFO; struct wnn_file_stat { int type; /* ファイルの種類 WNN_STATIC_DICT 固定形式辞書 WNN_UD_DICT 登録可能形式辞書 WNN_HINDO_FILE 頻度ファイル WNN_FUZOKUGO_FILE 付属語ファイル WNN_NOT_A_JISHO その他 */ }; typedef struct wnn_file_stat WNN_FILE_STAT; /* */ extern int wnn_errorno; /* Wnnのエラーはこの変数に報告される */ extern char *wnn_dic_types[]; /* "固定","登録","逆変換","正規" */ extern char *cwnn_dic_types[]; /* "固定","登録","逆変換","正規" */ extern char *bwnn_dic_types[]; /* "固定","登録","逆変換","正規" */ #define FILE_ALREADY_READ -2 /* この構造体は、ライブラリ内部で用いられる */ struct wnn_jserver_id { int sd; char js_name[40]; int js_dead; jmp_buf js_dead_env; /* サーバが死んだ時に飛んでいくenv */ int js_dead_env_flg; /* jd_server_dead_envが有効か否か */ }; typedef struct wnn_jserver_id WNN_JSERVER_ID; /* この構造体は、ライブラリ内部で用いられる */ struct wnn_env { int env_id; WNN_JSERVER_ID *js_id; char lang[16]; /* for exsample "ja_JP" */ }; typedef struct wnn_env WNN_ENV; struct wnn_param { int n; /* N(大)文節解析のN */ int nsho; /* 大文節中の小文節の最大数 */ int p1; /* 自立語の頻度のパラメータ */ int p2; /* 小文節長のパラメータ */ int p3; /* 自立語長のパラメータ */ int p4; /* 今使ったよビットのパラメータ */ int p5; /* 辞書のパラメータ */ int p6; /* 小文節の評価値のパラメータ */ int p7; /* 大文節長のパラメータ */ int p8; /* 小文節数のパラメータ */ int p9; /* 疑似品詞 数字の頻度 */ int p10; /* 疑似品詞 カナの頻度 *//* CWNN:英数の頻度 */ int p11; /* 疑似品詞 英数の頻度 *//* CWNN:記号の頻度 */ int p12; /* 疑似品詞 記号の頻度 *//* CWNN:開括弧の頻度 */ int p13; /* 疑似品詞 閉括弧の頻度 *//* CWNN:閉括弧の頻度 */ int p14; /* 疑似品詞 付属語の頻度 *//* BWNN:No of koho */ int p15; /* 疑似品詞 開括弧の頻度 *//* CWNN:Not used */ }; #ifdef nodef struct wnn_dic_info_struct { int body_fid; int hindo_fid; int enablef; int rw; int hindo_rw; int nice; }; typedef struct wnn_dic_info_struct WNN_DIC_INFO_STRUCT; #endif struct wnn_file_info_struct { int fid; /* ファイル番号 */ char name[WNN_F_NAMELEN]; /* ファイル名 */ int localf; /* サーバ・サイトのファイルかどうか 1: サーバ・サイト 0: クライアント・サイト */ int type; /* ファイルの種類 */ int ref_count; /* (環境からの)参照数 */ }; typedef struct wnn_file_info_struct WNN_FILE_INFO_STRUCT; #define WNN_VECT_L ((256+8*4-1)/(8*4) + 5) /***** !!!!! ****/ struct wnn_sho_bunsetsu { int end; /* 候補文節の end char index */ int start; /* 候補文節の top char index */ int jiriend; /* 候補文節の自立語 end char index */ int dic_no; /* 自立語の辞書内のエントリ番号 */ int entry; /* 候補文節の自立語辞書 entry */ int hinsi; /* 自立語品詞 */ int status; /* 大文節の先頭か */ int status_bkwd; /* usiro の文節に接続できるか */ int hindo; /* 候補自立語の頻度 */ int ima; /* 候補自立語の今使ったよビット */ int kangovect; /* 接続ベクトルテーブルへのポインタ */ int hyoka; /* 小文節評価値 */ w_char *kanji; /* 自立語文字列 */ w_char *yomi; /* 自立語の読み文字列 */ w_char *fuzoku; /* 付属語文字列 */ /* *頻度については、頻度ファイルが指定されている時は、 *hindo = 頻度ファイルの(実)頻度値 + 辞書内の(実)頻度値 *ima = 頻度ファイルの今使ったよビット * *頻度ファイルが指定されていない時には、 *hindo = 辞書内の(実)頻度値、ima = 辞書内の今使ったよビット *である。ここで、実頻度値とは、計算機内で7ビットに圧縮された値である。 *仮想頻度値ではなく実頻度値を返すのは、変換結果のデバッグのためである。 */ }; struct wnn_dai_bunsetsu { int end; /* 候補文節の end char index */ int start; /* 候補文節の top char index */ struct wnn_sho_bunsetsu *sbn; /* 小文節解析結果へのポインタ */ int hyoka; /* 大文節評価値 */ int sbncnt; /* 小文節数 (次候補の場合は、次候補数) DSD_SBNは、*sbn から sbncnt だけある */ }; struct wnn_jdata { int dic_no; /* 辞書番号 */ int serial; /* 辞書内のエントリ番号 */ int hinshi; /* 品詞番号(品詞番号と品詞名の対応は、manual/etc の下を参照) */ int hindo; /* 頻度 */ int ima; /* 今使ったよビット */ int int_hindo; /* 辞書内頻度 */ int int_ima; /* 辞書内、今使ったよビット */ w_char *yomi; /* 読みの文字列 */ w_char *kanji; /* 漢字文字列 */ w_char *com; /* エントリのコメント文字列 */ /* *頻度については、頻度ファイルが指定されている時は、 *hindo = 頻度ファイルの(仮想)頻度値、ima = 頻度ファイルの今使ったよビット *int_hindo = 辞書内の(仮想)頻度値、int_ima = 辞書内の今使ったよビット * *頻度ファイルが指定されていない時には、 *hindo = 辞書内の(仮想)頻度値、ima = 辞書内の今使ったよビット *int_hindo = -1、int_ima = -1 * *ただし、どちらの場合でも、エントリが使用中止の状態の時には、 *hindo = -1, ima = 0 あるいは、 *int_hindo = -1, int_ima = 0 となる。 *ここで、(仮想)頻度値とは、計算機内で7ビットに圧縮された頻度値から、 *実際の値を想定した値である。 */ }; struct wnn_ret_buf { int size; /* buf から alloc されている大きさ */ char *buf; /* malloc などでとられた領域 */ }; #define WNN_F_UNIQ_LEN (sizeof(struct wnn_file_uniq)) /* この構造体は、ライブラリ内部で用いられる */ struct wnn_file_head { struct wnn_file_uniq { int time; int dev; int inode; char createhost[WNN_HOSTLEN]; } file_uniq; struct wnn_file_uniq file_uniq_org; int file_type; char file_passwd[WNN_PASSWD_LEN]; }; #define WNN_HINSI_NAME_LEN 64 #define WNN_FILE_HEADER_LEN (WNN_PASSWD_LEN + 8 + WNN_FILE_STRING_LEN + \ sizeof(struct wnn_file_uniq) * 2 + 4) /* 8 is for future use 4 is for file_type. */ #ifndef JSERVER /* JSLIB function declaration */ #define js_open(server, timeout) js_open_lang(server, "ja_JP", timeout) #define js_connect(server,env_name) js_connect_lang(server, env_name, "ja_JP") /* prototypes */ WNN_JSERVER_ID *js_open_lang (register char *server, register char *lang, register int timeout); int js_close (WNN_JSERVER_ID *server); struct wnn_env *js_connect_lang (WNN_JSERVER_ID *server, register char *env_name, char *lang); int js_disconnect (register struct wnn_env *env); int js_env_list (WNN_JSERVER_ID *server, struct wnn_ret_buf *ret); int js_param_set(struct wnn_env *env, register struct wnn_param *para); int js_param_get(struct wnn_env *env, register struct wnn_param *para); char *js_get_lang(struct wnn_env *env); /**************************************/ int js_access(struct wnn_env *env, char *path, int amode); int js_dic_add(struct wnn_env *env, int fid, int hfid, int rev, int jnice, int rw, int hrw, char *pw1, char *pw2); int js_dic_delete(struct wnn_env *env, int dicno); int js_dic_file_create (struct wnn_env *env, char *fn, int type, w_char *comment, char *passwd, char *hpasswd); int js_dic_file_create_client (struct wnn_env *env, char *fn, int type, w_char *com, char *passwd, char *hpasswd); int js_dic_info (struct wnn_env *env, int dic_no, register WNN_DIC_INFO *ret); int js_dic_list(struct wnn_env *env, struct wnn_ret_buf *ret); int js_dic_list_all (WNN_JSERVER_ID *server, struct wnn_ret_buf *ret); int js_dic_use(struct wnn_env *env, int dic_no, int flag); int js_env_exist (register WNN_JSERVER_ID *server, register char *env_name); int js_env_sticky(register struct wnn_env *env); int js_env_un_sticky(register struct wnn_env *env); int js_file_comment_set (struct wnn_env *env, int fid, w_char *comment); int js_file_discard(struct wnn_env *env, int fid); int js_file_info (struct wnn_env *env, int fid, register WNN_FILE_INFO_STRUCT *file); int js_file_list(struct wnn_env *env, struct wnn_ret_buf *ret); int js_file_list_all (WNN_JSERVER_ID *server, struct wnn_ret_buf *ret); int js_file_loaded (WNN_JSERVER_ID *server, char *path); int js_file_loaded_local (WNN_JSERVER_ID *server, char *path); int js_file_password_set(struct wnn_env *env, int fid, int which, char *old, char *new); int js_file_read(struct wnn_env *env, char *fn); int js_file_receive(struct wnn_env *env, int fid, char *fn); int js_file_remove (WNN_JSERVER_ID *server, char *n, char *pwd); int js_file_remove_client (WNN_JSERVER_ID *server, char *n, char *pwd); int js_file_send(struct wnn_env *env, char *fn); int js_file_stat (struct wnn_env *env, char *path, WNN_FILE_STAT *s); int js_file_write(struct wnn_env *env, int fid, char *fn); int js_fuzokugo_get(struct wnn_env *env); int js_fuzokugo_set(struct wnn_env *env, int fid); void js_flush (struct wnn_env *env); int js_hindo_file_create (struct wnn_env *env, int fid, char *fn, w_char *comment, char *hpasswd); int js_hindo_file_create_client (struct wnn_env *env, int fid, char *fn, w_char *com, char *hpasswd); int js_hindo_set(struct wnn_env *env, int dic, int entry, int ima, int hindo); int js_hinsi_dicts(struct wnn_env *env, int no, struct wnn_ret_buf *rb); int js_hinsi_list (struct wnn_env *env, int dic_no, w_char *name, struct wnn_ret_buf *rb); int js_hinsi_name (WNN_JSERVER_ID *server, int no, struct wnn_ret_buf *rb); int js_hinsi_number (WNN_JSERVER_ID *server, w_char *name); int js_hinsi_table_set (struct wnn_env *env, int dic_no, w_char *hinsi_table); int js_isconnect (register struct wnn_env *env); int js_kanren (struct wnn_env *env, w_char *yomi, int hinsi, w_char *fzk, int vec, int vec1, int vec2, struct wnn_ret_buf *rb); int js_kantan_dai (struct wnn_env *env, w_char *yomi, int hinsi, w_char *fzk, int vec, int vec1, struct wnn_ret_buf *rb); int js_kantan_sho (struct wnn_env *env, w_char *yomi, int hinsi, w_char *fzk, int vec, int vec1, struct wnn_ret_buf *rb); int js_kanzen_dai (struct wnn_env *env, w_char *yomi, int hinsi, w_char *fzk, int vec, int vec1, struct wnn_ret_buf *rb); int js_kanzen_sho (struct wnn_env *env, w_char *yomi, int hinsi, w_char *fzk, int vec, int vec1, struct wnn_ret_buf *rb); int js_kill (WNN_JSERVER_ID *server); int js_mkdir(struct wnn_env *env, char *path); int js_version (WNN_JSERVER_ID *server, int *serv, int *libv); int js_who (WNN_JSERVER_ID *server, struct wnn_ret_buf *ret); int js_word_add (struct wnn_env *env, int dic_no, w_char *yomi, w_char *kanji, w_char *comment, int hinshi, int init_hindo); int js_word_comment_set (struct wnn_env *env, int dic_no, int entry, w_char *comment); int js_word_delete(struct wnn_env *env, int dic_no, int entry); int js_word_info(struct wnn_env *env, int dic_no, int entry, struct wnn_ret_buf *ret); int js_word_search (struct wnn_env *env, int dic_no, w_char *yomi, struct wnn_ret_buf *ret); int js_word_search_by_env (struct wnn_env *env, w_char *yomi, struct wnn_ret_buf *ret); /* haven't discovered yet --yaz */ extern WNN_JSERVER_ID *js_change_current_jserver (); #endif #endif /* WNN_JSLIB_H */