emacs: src/coding.c annotate

author	Karl Heuer <kwzh@gnu.org>
date	Thu, 20 Feb 1997 07:02:49 +0000
parents
children	70194012fb3a

rev	line source
17052 d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1 /* Coding system handler (conversion, detection, and etc).
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2 Ver.1.0.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	4 Copyright (C) 1995 Free Software Foundation, Inc.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	5 Copyright (C) 1995 Electrotechnical Laboratory, JAPAN.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	6
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	7 This program is free software; you can redistribute it and/or modify
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	8 it under the terms of the GNU General Public License as published by
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	9 the Free Software Foundation; either version 2, or (at your option)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	10 any later version.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	11
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	12 This program is distributed in the hope that it will be useful,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	13 but WITHOUT ANY WARRANTY; without even the implied warranty of
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	14 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	15 GNU General Public License for more details.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	16
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	17 You should have received a copy of the GNU General Public License
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	18 along with this program; if not, write to the Free Software
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	19 Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	20
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	21 /* TABLE OF CONTENTS *
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	22
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	23 1. Preamble
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	24 2. Emacs' internal format handlers
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	25 3. ISO2022 handlers
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	26 4. Shift-JIS and BIG5 handlers
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	27 5. End-of-line handlers
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	28 6. C library functions
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	29 7. Emacs Lisp library functions
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	30 8. Post-amble
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	31
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	32 */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	33
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	34 /* GENERAL NOTE on CODING SYSTEM *
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	35
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	36 Coding system is an encoding mechanism of one or more character
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	37 sets. Here's a list of coding systems which Emacs can handle. When
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	38 we say "decode", it means converting some other coding system to
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	39 Emacs' internal format, and when we say "encode", it means
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	40 converting Emacs' internal format to some other coding system.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	41
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	42 0. Emacs' internal format
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	43
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	44 Emacs itself holds a multi-lingual character in a buffer and a string
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	45 in a special format. Details are described in the section 2.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	46
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	47 1. ISO2022
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	48
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	49 The most famous coding system for multiple character sets. X's
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	50 Compound Text, various EUCs (Extended Unix Code), and such coding
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	51 systems used in Internet communication as ISO-2022-JP are all
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	52 variants of ISO2022. Details are described in the section 3.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	53
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	54 2. SJIS (or Shift-JIS or MS-Kanji-Code)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	55
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	56 A coding system to encode character sets: ASCII, JISX0201, and
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	57 JISX0208. Widely used for PC's in Japan. Details are described in
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	58 the section 4.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	59
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	60 3. BIG5
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	61
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	62 A coding system to encode character sets: ASCII and Big5. Widely
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	63 used by Chinese (mainly in Taiwan and Hong Kong). Details are
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	64 described in the section 4. In this file, when written as "BIG5"
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	65 (all uppercase), it means the coding system, and when written as
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	66 "Big5" (capitalized), it means the character set.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	67
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	68 4. Else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	69
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	70 If a user want to read/write a text encoded in a coding system not
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	71 listed above, he can supply a decoder and an encoder for it in CCL
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	72 (Code Conversion Language) programs. Emacs executes the CCL program
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	73 while reading/writing.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	74
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	75 Emacs represent a coding-system by a Lisp symbol that has a property
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	76 `coding-system'. But, before actually using the coding-system, the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	77 information about it is set in a structure of type `struct
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	78 coding_system' for rapid processing. See the section 6 for more
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	79 detail.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	80
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	81 */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	82
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	83 /* GENERAL NOTES on END-OF-LINE FORMAT *
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	84
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	85 How end-of-line of a text is encoded depends on a system. For
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	86 instance, Unix's format is just one byte of `line-feed' code,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	87 whereas DOS's format is two bytes sequence of `carriage-return' and
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	88 `line-feed' codes. MacOS's format is one byte of `carriage-return'.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	89
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	90 Since how characters in a text is encoded and how end-of-line is
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	91 encoded is independent, any coding system described above can take
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	92 any format of end-of-line. So, Emacs has information of format of
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	93 end-of-line in each coding-system. See the section 6 for more
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	94 detail.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	95
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	96 */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	97
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	98 /* GENERAL NOTES on `detect_coding_XXX ()' functions *
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	99
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	100 These functions check if a text between SRC and SRC_END is encoded
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	101 in the coding system category XXX. Each returns an integer value in
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	102 which appropriate flag bits for the category XXX is set. The flag
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	103 bits are defined in macros CODING_CATEGORY_MASK_XXX. Below is the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	104 template of these functions. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	105 #if 0
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	106 int
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	107 detect_coding_internal (src, src_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	108 unsigned char src, src_end;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	109 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	110 ...
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	111 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	112 #endif
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	113
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	114 /* GENERAL NOTES on `decode_coding_XXX ()' functions *
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	115
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	116 These functions decode SRC_BYTES length text at SOURCE encoded in
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	117 CODING to Emacs' internal format. The resulting text goes to a
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	118 place pointed by DESTINATION, the length of which should not exceed
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	119 DST_BYTES. The bytes actually processed is returned as *CONSUMED.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	120 The return value is the length of the decoded text. Below is a
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	121 template of these functions. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	122 #if 0
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	123 decode_coding_XXX (coding, source, destination, src_bytes, dst_bytes, consumed)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	124 struct coding_system *coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	125 unsigned char source, destination;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	126 int src_bytes, dst_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	127 int *consumed;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	128 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	129 ...
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	130 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	131 #endif
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	132
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	133 /* GENERAL NOTES on `encode_coding_XXX ()' functions *
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	134
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	135 These functions encode SRC_BYTES length text at SOURCE of Emacs
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	136 internal format to CODING. The resulting text goes to a place
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	137 pointed by DESTINATION, the length of which should not exceed
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	138 DST_BYTES. The bytes actually processed is returned as *CONSUMED.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	139 The return value is the length of the encoded text. Below is a
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	140 template of these functions. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	141 #if 0
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	142 encode_coding_XXX (coding, source, destination, src_bytes, dst_bytes, consumed)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	143 struct coding_system *coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	144 unsigned char source, destination;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	145 int src_bytes, dst_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	146 int *consumed;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	147 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	148 ...
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	149 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	150 #endif
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	151
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	152 /* COMMONLY USED MACROS */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	153
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	154 /* The following three macros ONE_MORE_BYTE, TWO_MORE_BYTES, and
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	155 THREE_MORE_BYTES safely get one, two, and three bytes from the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	156 source text respectively. If there are not enough bytes in the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	157 source, they jump to `label_end_of_loop'. The caller should set
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	158 variables `src' and `src_end' to appropriate areas in advance. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	159
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	160 #define ONE_MORE_BYTE(c1) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	161 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	162 if (src < src_end) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	163 c1 = *src++; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	164 else \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	165 goto label_end_of_loop; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	166 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	167
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	168 #define TWO_MORE_BYTES(c1, c2) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	169 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	170 if (src + 1 < src_end) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	171 c1 = src++, c2 = src++; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	172 else \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	173 goto label_end_of_loop; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	174 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	175
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	176 #define THREE_MORE_BYTES(c1, c2, c3) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	177 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	178 if (src + 2 < src_end) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	179 c1 = src++, c2 = src++, c3 = *src++; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	180 else \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	181 goto label_end_of_loop; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	182 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	183
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	184 /* The following three macros DECODE_CHARACTER_ASCII,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	185 DECODE_CHARACTER_DIMENSION1, and DECODE_CHARACTER_DIMENSION2 put
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	186 the multi-byte form of a character of each class at the place
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	187 pointed by `dst'. The caller should set the variable `dst' to
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	188 point to an appropriate area and the variable `coding' to point to
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	189 the coding-system of the currently decoding text in advance. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	190
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	191 /* Decode one ASCII character C. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	192
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	193 #define DECODE_CHARACTER_ASCII(c) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	194 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	195 if (COMPOSING_P (coding->composing)) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	196 dst++ = 0xA0, dst++ = (c) \| 0x80; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	197 else \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	198 *dst++ = (c); \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	199 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	200
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	201 /* Decode one DIMENSION1 character of which charset is CHARSET and
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	202 position-code is C. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	203
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	204 #define DECODE_CHARACTER_DIMENSION1(charset, c) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	205 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	206 unsigned char leading_code = CHARSET_LEADING_CODE_BASE (charset); \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	207 if (COMPOSING_P (coding->composing)) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	208 *dst++ = leading_code + 0x20; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	209 else \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	210 *dst++ = leading_code; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	211 if (leading_code = CHARSET_LEADING_CODE_EXT (charset)) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	212 *dst++ = leading_code; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	213 *dst++ = (c) \| 0x80; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	214 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	215
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	216 /* Decode one DIMENSION2 character of which charset is CHARSET and
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	217 position-codes are C1 and C2. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	218
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	219 #define DECODE_CHARACTER_DIMENSION2(charset, c1, c2) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	220 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	221 DECODE_CHARACTER_DIMENSION1 (charset, c1); \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	222 *dst++ = (c2) \| 0x80; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	223 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	224
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	225
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	226 /* 1. Preamble */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	227
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	228 #include <stdio.h>
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	229
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	230 #ifdef emacs
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	231
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	232 #include <config.h>
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	233 #include "lisp.h"
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	234 #include "buffer.h"
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	235 #include "charset.h"
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	236 #include "ccl.h"
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	237 #include "coding.h"
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	238 #include "window.h"
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	239
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	240 #else /* not emacs */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	241
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	242 #include "mulelib.h"
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	243
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	244 #endif /* not emacs */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	245
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	246 Lisp_Object Qcoding_system, Qeol_type;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	247 Lisp_Object Qbuffer_file_coding_system;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	248 Lisp_Object Qpost_read_conversion, Qpre_write_conversion;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	249
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	250 extern Lisp_Object Qinsert_file_contents, Qwrite_region;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	251 Lisp_Object Qcall_process, Qcall_process_region, Qprocess_argument;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	252 Lisp_Object Qstart_process, Qopen_network_stream;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	253 Lisp_Object Qtarget_idx;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	254
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	255 /* Mnemonic character of each format of end-of-line. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	256 int eol_mnemonic_unix, eol_mnemonic_dos, eol_mnemonic_mac;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	257 /* Mnemonic character to indicate format of end-of-line is not yet
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	258 decided. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	259 int eol_mnemonic_undecided;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	260
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	261 #ifdef emacs
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	262
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	263 Lisp_Object Qcoding_system_vector, Qcoding_system_p, Qcoding_system_error;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	264
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	265 /* Coding-systems are handed between Emacs Lisp programs and C internal
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	266 routines by the following three variables. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	267 /* Coding-system for reading files and receiving data from process. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	268 Lisp_Object Vcoding_system_for_read;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	269 /* Coding-system for writing files and sending data to process. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	270 Lisp_Object Vcoding_system_for_write;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	271 /* Coding-system actually used in the latest I/O. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	272 Lisp_Object Vlast_coding_system_used;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	273
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	274 /* Coding-system of what terminal accept for displaying. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	275 struct coding_system terminal_coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	276
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	277 /* Coding-system of what is sent from terminal keyboard. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	278 struct coding_system keyboard_coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	279
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	280 Lisp_Object Vcoding_system_alist;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	281
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	282 #endif /* emacs */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	283
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	284 Lisp_Object Qcoding_category_index;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	285
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	286 /* List of symbols `coding-category-xxx' ordered by priority. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	287 Lisp_Object Vcoding_category_list;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	288
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	289 /* Table of coding-systems currently assigned to each coding-category. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	290 Lisp_Object coding_category_table[CODING_CATEGORY_IDX_MAX];
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	291
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	292 /* Table of names of symbol for each coding-category. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	293 char *coding_category_name[CODING_CATEGORY_IDX_MAX] = {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	294 "coding-category-internal",
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	295 "coding-category-sjis",
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	296 "coding-category-iso-7",
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	297 "coding-category-iso-8-1",
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	298 "coding-category-iso-8-2",
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	299 "coding-category-iso-else",
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	300 "coding-category-big5",
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	301 "coding-category-binary"
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	302 };
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	303
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	304 /* Alist of charsets vs the alternate charsets. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	305 Lisp_Object Valternate_charset_table;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	306
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	307 /* Alist of charsets vs revision number. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	308 Lisp_Object Vcharset_revision_alist;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	309
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	310
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	311 /* 2. Emacs internal format handlers */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	312
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	313 /* Emacs' internal format for encoding multiple character sets is a
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	314 kind of multi-byte encoding, i.e. encoding a character by a sequence
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	315 of one-byte codes of variable length. ASCII characters and control
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	316 characters (e.g. `tab', `newline') are represented by one-byte as
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	317 is. It takes the range 0x00 through 0x7F. The other characters
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	318 are represented by a sequence of `base leading-code', optional
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	319 `extended leading-code', and one or two `position-code's. Length
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	320 of the sequence is decided by the base leading-code. Leading-code
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	321 takes the range 0x80 through 0x9F, whereas extended leading-code
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	322 and position-code take the range 0xA0 through 0xFF. See the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	323 document of `charset.h' for more detail about leading-code and
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	324 position-code.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	325
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	326 There's one exception in this rule. Special leading-code
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	327 `leading-code-composition' denotes that the following several
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	328 characters should be composed into one character. Leading-codes of
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	329 components (except for ASCII) are added 0x20. An ASCII character
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	330 component is represented by a 2-byte sequence of `0xA0' and
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	331 `ASCII-code + 0x80'. See also the document in `charset.h' for the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	332 detail of composite character. Hence, we can summarize the code
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	333 range as follows:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	334
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	335 --- CODE RANGE of Emacs' internal format ---
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	336 (character set) (range)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	337 ASCII 0x00 .. 0x7F
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	338 ELSE (1st byte) 0x80 .. 0x9F
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	339 (rest bytes) 0xA0 .. 0xFF
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	340 ---------------------------------------------
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	341
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	342 */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	343
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	344 enum emacs_code_class_type emacs_code_class[256];
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	345
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	346 /* Go to the next statement only if *SRC is accessible and the code is
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	347 greater than 0xA0. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	348 #define CHECK_CODE_RANGE_A0_FF \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	349 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	350 if (src >= src_end) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	351 goto label_end_of_switch; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	352 else if (*src++ < 0xA0) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	353 return 0; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	354 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	355
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	356 /* See the above "GENERAL NOTES on `detect_coding_XXX ()' functions".
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	357 Check if a text is encoded in Emacs' internal format. If it is,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	358 return CODING_CATEGORY_MASK_INTERNAL, else return 0. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	359
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	360 int
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	361 detect_coding_internal (src, src_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	362 unsigned char src, src_end;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	363 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	364 unsigned char c;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	365 int composing = 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	366
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	367 while (src < src_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	368 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	369 c = *src++;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	370
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	371 if (composing)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	372 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	373 if (c < 0xA0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	374 composing = 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	375 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	376 c -= 0x20;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	377 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	378
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	379 switch (emacs_code_class[c])
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	380 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	381 case EMACS_ascii_code:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	382 case EMACS_linefeed_code:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	383 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	384
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	385 case EMACS_control_code:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	386 if (c == ISO_CODE_ESC \|\| c == ISO_CODE_SI \|\| c == ISO_CODE_SO)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	387 return 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	388 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	389
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	390 case EMACS_invalid_code:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	391 return 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	392
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	393 case EMACS_leading_code_composition: /* c == 0x80 */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	394 if (composing)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	395 CHECK_CODE_RANGE_A0_FF;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	396 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	397 composing = 1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	398 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	399
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	400 case EMACS_leading_code_4:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	401 CHECK_CODE_RANGE_A0_FF;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	402 /* fall down to check it two more times ... */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	403
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	404 case EMACS_leading_code_3:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	405 CHECK_CODE_RANGE_A0_FF;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	406 /* fall down to check it one more time ... */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	407
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	408 case EMACS_leading_code_2:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	409 CHECK_CODE_RANGE_A0_FF;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	410 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	411
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	412 default:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	413 label_end_of_switch:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	414 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	415 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	416 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	417 return CODING_CATEGORY_MASK_INTERNAL;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	418 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	419
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	420
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	421 /* 3. ISO2022 handlers */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	422
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	423 /* The following note describes the coding system ISO2022 briefly.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	424 Since the intension of this note is to help understanding of the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	425 programs in this file, some parts are NOT ACCURATE or OVERLY
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	426 SIMPLIFIED. For the thorough understanding, please refer to the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	427 original document of ISO2022.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	428
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	429 ISO2022 provides many mechanisms to encode several character sets
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	430 in 7-bit and 8-bit environment. If one choose 7-bite environment,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	431 all text is encoded by codes of less than 128. This may make the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	432 encoded text a little bit longer, but the text get more stability
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	433 to pass through several gateways (some of them split MSB off).
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	434
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	435 There are two kind of character set: control character set and
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	436 graphic character set. The former contains control characters such
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	437 as `newline' and `escape' to provide control functions (control
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	438 functions are provided also by escape sequence). The latter
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	439 contains graphic characters such as ' A' and '-'. Emacs recognizes
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	440 two control character sets and many graphic character sets.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	441
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	442 Graphic character sets are classified into one of the following
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	443 four classes, DIMENSION1_CHARS94, DIMENSION1_CHARS96,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	444 DIMENSION2_CHARS94, DIMENSION2_CHARS96 according to the number of
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	445 bytes (DIMENSION) and the number of characters in one dimension
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	446 (CHARS) of the set. In addition, each character set is assigned an
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	447 identification tag (called "final character" and denoted as <F>
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	448 here after) which is unique in each class. <F> of each character
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	449 set is decided by ECMA(*) when it is registered in ISO. Code range
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	450 of <F> is 0x30..0x7F (0x30..0x3F are for private use only).
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	451
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	452 Note (*): ECMA = European Computer Manufacturers Association
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	453
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	454 Here are examples of graphic character set [NAME(<F>)]:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	455 o DIMENSION1_CHARS94 -- ASCII('B'), right-half-of-JISX0201('I'), ...
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	456 o DIMENSION1_CHARS96 -- right-half-of-ISO8859-1('A'), ...
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	457 o DIMENSION2_CHARS94 -- GB2312('A'), JISX0208('B'), ...
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	458 o DIMENSION2_CHARS96 -- none for the moment
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	459
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	460 A code area (1byte=8bits) is divided into 4 areas, C0, GL, C1, and GR.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	461 C0 [0x00..0x1F] -- control character plane 0
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	462 GL [0x20..0x7F] -- graphic character plane 0
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	463 C1 [0x80..0x9F] -- control character plane 1
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	464 GR [0xA0..0xFF] -- graphic character plane 1
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	465
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	466 A control character set is directly designated and invoked to C0 or
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	467 C1 by an escape sequence. The most common case is that ISO646's
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	468 control character set is designated/invoked to C0 and ISO6429's
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	469 control character set is designated/invoked to C1, and usually
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	470 these designations/invocations are omitted in a coded text. With
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	471 7-bit environment, only C0 can be used, and a control character for
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	472 C1 is encoded by an appropriate escape sequence to fit in the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	473 environment. All control characters for C1 are defined the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	474 corresponding escape sequences.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	475
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	476 A graphic character set is at first designated to one of four
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	477 graphic registers (G0 through G3), then these graphic registers are
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	478 invoked to GL or GR. These designations and invocations can be
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	479 done independently. The most common case is that G0 is invoked to
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	480 GL, G1 is invoked to GR, and ASCII is designated to G0, and usually
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	481 these invocations and designations are omitted in a coded text.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	482 With 7-bit environment, only GL can be used.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	483
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	484 When a graphic character set of CHARS94 is invoked to GL, code 0x20
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	485 and 0x7F of GL area work as control characters SPACE and DEL
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	486 respectively, and code 0xA0 and 0xFF of GR area should not be used.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	487
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	488 There are two ways of invocation: locking-shift and single-shift.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	489 With locking-shift, the invocation lasts until the next different
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	490 invocation, whereas with single-shift, the invocation works only
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	491 for the following character and doesn't affect locking-shift.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	492 Invocations are done by the following control characters or escape
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	493 sequences.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	494
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	495 ----------------------------------------------------------------------
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	496 function control char escape sequence description
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	497 ----------------------------------------------------------------------
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	498 SI (shift-in) 0x0F none invoke G0 to GL
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	499 SI (shift-out) 0x0E none invoke G1 to GL
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	500 LS2 (locking-shift-2) none ESC 'n' invoke G2 into GL

17052

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1 /* Coding system handler (conversion, detection, and etc).

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2 Ver.1.0.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

6

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

7 This program is free software; you can redistribute it and/or modify

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

8 it under the terms of the GNU General Public License as published by

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

9 the Free Software Foundation; either version 2, or (at your option)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

10 any later version.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

11

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

12 This program is distributed in the hope that it will be useful,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

13 but WITHOUT ANY WARRANTY; without even the implied warranty of

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

14 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

15 GNU General Public License for more details.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

16

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

17 You should have received a copy of the GNU General Public License

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

18 along with this program; if not, write to the Free Software

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

19 Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

20

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

21 /*** TABLE OF CONTENTS ***

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

22

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

23 1. Preamble

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

24 2. Emacs' internal format handlers

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

25 3. ISO2022 handlers

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

26 4. Shift-JIS and BIG5 handlers

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

27 5. End-of-line handlers

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

28 6. C library functions

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

29 7. Emacs Lisp library functions

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

30 8. Post-amble

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

31

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

32 */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

33

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

34 /*** GENERAL NOTE on CODING SYSTEM ***

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

35

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

36 Coding system is an encoding mechanism of one or more character

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

37 sets. Here's a list of coding systems which Emacs can handle. When

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

38 we say "decode", it means converting some other coding system to

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

39 Emacs' internal format, and when we say "encode", it means

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

40 converting Emacs' internal format to some other coding system.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

41

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

42 0. Emacs' internal format

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

43

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

44 Emacs itself holds a multi-lingual character in a buffer and a string

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

45 in a special format. Details are described in the section 2.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

46

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

47 1. ISO2022

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

48

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

49 The most famous coding system for multiple character sets. X's

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

50 Compound Text, various EUCs (Extended Unix Code), and such coding

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

51 systems used in Internet communication as ISO-2022-JP are all

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

52 variants of ISO2022. Details are described in the section 3.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

53

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

54 2. SJIS (or Shift-JIS or MS-Kanji-Code)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

55

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

56 A coding system to encode character sets: ASCII, JISX0201, and

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

57 JISX0208. Widely used for PC's in Japan. Details are described in

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

58 the section 4.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

59

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

60 3. BIG5

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

61

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

62 A coding system to encode character sets: ASCII and Big5. Widely

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

63 used by Chinese (mainly in Taiwan and Hong Kong). Details are

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

64 described in the section 4. In this file, when written as "BIG5"

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

65 (all uppercase), it means the coding system, and when written as

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

66 "Big5" (capitalized), it means the character set.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

67

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

68 4. Else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

69

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

70 If a user want to read/write a text encoded in a coding system not

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

71 listed above, he can supply a decoder and an encoder for it in CCL

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

72 (Code Conversion Language) programs. Emacs executes the CCL program

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

73 while reading/writing.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

74

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

75 Emacs represent a coding-system by a Lisp symbol that has a property

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

76 `coding-system'. But, before actually using the coding-system, the

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

77 information about it is set in a structure of type `struct

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

78 coding_system' for rapid processing. See the section 6 for more

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

79 detail.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

80

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

81 */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

82

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

83 /*** GENERAL NOTES on END-OF-LINE FORMAT ***

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

84

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

85 How end-of-line of a text is encoded depends on a system. For

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

86 instance, Unix's format is just one byte of `line-feed' code,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

87 whereas DOS's format is two bytes sequence of `carriage-return' and

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

88 `line-feed' codes. MacOS's format is one byte of `carriage-return'.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

89

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

90 Since how characters in a text is encoded and how end-of-line is

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

91 encoded is independent, any coding system described above can take

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

92 any format of end-of-line. So, Emacs has information of format of

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

93 end-of-line in each coding-system. See the section 6 for more

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

94 detail.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

95

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

96 */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

97

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

98 /*** GENERAL NOTES on `detect_coding_XXX ()' functions ***

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

99

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

100 These functions check if a text between SRC and SRC_END is encoded

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

101 in the coding system category XXX. Each returns an integer value in

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

102 which appropriate flag bits for the category XXX is set. The flag

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

103 bits are defined in macros CODING_CATEGORY_MASK_XXX. Below is the

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

104 template of these functions. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

105 #if 0

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

106 int

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

107 detect_coding_internal (src, src_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

108 unsigned char *src, *src_end;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

109 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

110 ...

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

111 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

112 #endif

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

113

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

114 /*** GENERAL NOTES on `decode_coding_XXX ()' functions ***

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

115

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

116 These functions decode SRC_BYTES length text at SOURCE encoded in

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

117 CODING to Emacs' internal format. The resulting text goes to a

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

118 place pointed by DESTINATION, the length of which should not exceed

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

119 DST_BYTES. The bytes actually processed is returned as *CONSUMED.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

120 The return value is the length of the decoded text. Below is a

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

121 template of these functions. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

122 #if 0

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

123 decode_coding_XXX (coding, source, destination, src_bytes, dst_bytes, consumed)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

124 struct coding_system *coding;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

125 unsigned char *source, *destination;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

126 int src_bytes, dst_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

127 int *consumed;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

128 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

129 ...

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

130 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

131 #endif

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

132

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

133 /*** GENERAL NOTES on `encode_coding_XXX ()' functions ***

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

134

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

135 These functions encode SRC_BYTES length text at SOURCE of Emacs

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

136 internal format to CODING. The resulting text goes to a place

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

137 pointed by DESTINATION, the length of which should not exceed

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

138 DST_BYTES. The bytes actually processed is returned as *CONSUMED.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

139 The return value is the length of the encoded text. Below is a

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

140 template of these functions. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

141 #if 0

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

142 encode_coding_XXX (coding, source, destination, src_bytes, dst_bytes, consumed)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

143 struct coding_system *coding;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

144 unsigned char *source, *destination;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

145 int src_bytes, dst_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

146 int *consumed;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

147 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

148 ...

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

149 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

150 #endif

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

151

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

152 /*** COMMONLY USED MACROS ***/

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

153

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

154 /* The following three macros ONE_MORE_BYTE, TWO_MORE_BYTES, and

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

155 THREE_MORE_BYTES safely get one, two, and three bytes from the

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

156 source text respectively. If there are not enough bytes in the

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

157 source, they jump to `label_end_of_loop'. The caller should set

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

158 variables `src' and `src_end' to appropriate areas in advance. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

159

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

160 #define ONE_MORE_BYTE(c1) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

161 do { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

162 if (src < src_end) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

163 c1 = *src++; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

164 else \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

165 goto label_end_of_loop; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

166 } while (0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

167

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

168 #define TWO_MORE_BYTES(c1, c2) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

169 do { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

170 if (src + 1 < src_end) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

171 c1 = *src++, c2 = *src++; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

172 else \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

173 goto label_end_of_loop; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

174 } while (0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

175

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

176 #define THREE_MORE_BYTES(c1, c2, c3) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

177 do { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

178 if (src + 2 < src_end) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

179 c1 = *src++, c2 = *src++, c3 = *src++; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

180 else \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

181 goto label_end_of_loop; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

182 } while (0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

183

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

184 /* The following three macros DECODE_CHARACTER_ASCII,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

185 DECODE_CHARACTER_DIMENSION1, and DECODE_CHARACTER_DIMENSION2 put

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

186 the multi-byte form of a character of each class at the place

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

187 pointed by `dst'. The caller should set the variable `dst' to

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

188 point to an appropriate area and the variable `coding' to point to

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

189 the coding-system of the currently decoding text in advance. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

190

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

191 /* Decode one ASCII character C. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

192

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

193 #define DECODE_CHARACTER_ASCII(c) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

194 do { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

195 if (COMPOSING_P (coding->composing)) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

196 *dst++ = 0xA0, *dst++ = (c) | 0x80; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

197 else \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

198 *dst++ = (c); \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

199 } while (0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

200

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

201 /* Decode one DIMENSION1 character of which charset is CHARSET and

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

202 position-code is C. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

203

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

204 #define DECODE_CHARACTER_DIMENSION1(charset, c) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

205 do { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

206 unsigned char leading_code = CHARSET_LEADING_CODE_BASE (charset); \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

207 if (COMPOSING_P (coding->composing)) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

208 *dst++ = leading_code + 0x20; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

209 else \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

210 *dst++ = leading_code; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

211 if (leading_code = CHARSET_LEADING_CODE_EXT (charset)) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

212 *dst++ = leading_code; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

213 *dst++ = (c) | 0x80; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

214 } while (0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

215

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

216 /* Decode one DIMENSION2 character of which charset is CHARSET and

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

217 position-codes are C1 and C2. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

218

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

219 #define DECODE_CHARACTER_DIMENSION2(charset, c1, c2) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

220 do { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

221 DECODE_CHARACTER_DIMENSION1 (charset, c1); \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

222 *dst++ = (c2) | 0x80; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

223 } while (0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

224

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

225

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

226 /*** 1. Preamble ***/

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

227

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

228 #include <stdio.h>

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

229

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

230 #ifdef emacs

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

231

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

232 #include <config.h>

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

233 #include "lisp.h"

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

234 #include "buffer.h"

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

235 #include "charset.h"

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

236 #include "ccl.h"

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

237 #include "coding.h"

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

238 #include "window.h"

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

239

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

240 #else /* not emacs */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

241

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

242 #include "mulelib.h"

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

243

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

244 #endif /* not emacs */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

245

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

246 Lisp_Object Qcoding_system, Qeol_type;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

247 Lisp_Object Qbuffer_file_coding_system;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

248 Lisp_Object Qpost_read_conversion, Qpre_write_conversion;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

249

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

250 extern Lisp_Object Qinsert_file_contents, Qwrite_region;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

251 Lisp_Object Qcall_process, Qcall_process_region, Qprocess_argument;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

252 Lisp_Object Qstart_process, Qopen_network_stream;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

253 Lisp_Object Qtarget_idx;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

254

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

255 /* Mnemonic character of each format of end-of-line. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

256 int eol_mnemonic_unix, eol_mnemonic_dos, eol_mnemonic_mac;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

257 /* Mnemonic character to indicate format of end-of-line is not yet

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

258 decided. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

259 int eol_mnemonic_undecided;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

260

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

261 #ifdef emacs

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

262

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

263 Lisp_Object Qcoding_system_vector, Qcoding_system_p, Qcoding_system_error;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

264

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

265 /* Coding-systems are handed between Emacs Lisp programs and C internal

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

266 routines by the following three variables. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

267 /* Coding-system for reading files and receiving data from process. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

268 Lisp_Object Vcoding_system_for_read;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

269 /* Coding-system for writing files and sending data to process. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

270 Lisp_Object Vcoding_system_for_write;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

271 /* Coding-system actually used in the latest I/O. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

272 Lisp_Object Vlast_coding_system_used;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

273

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

274 /* Coding-system of what terminal accept for displaying. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

275 struct coding_system terminal_coding;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

276

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

277 /* Coding-system of what is sent from terminal keyboard. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

278 struct coding_system keyboard_coding;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

279

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

280 Lisp_Object Vcoding_system_alist;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

281

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

282 #endif /* emacs */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

283

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

284 Lisp_Object Qcoding_category_index;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

285

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

286 /* List of symbols `coding-category-xxx' ordered by priority. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

287 Lisp_Object Vcoding_category_list;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

288

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

289 /* Table of coding-systems currently assigned to each coding-category. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

290 Lisp_Object coding_category_table[CODING_CATEGORY_IDX_MAX];

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

291

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

292 /* Table of names of symbol for each coding-category. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

293 char *coding_category_name[CODING_CATEGORY_IDX_MAX] = {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

294 "coding-category-internal",

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

295 "coding-category-sjis",

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

296 "coding-category-iso-7",

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

297 "coding-category-iso-8-1",

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

298 "coding-category-iso-8-2",

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

299 "coding-category-iso-else",

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

300 "coding-category-big5",

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

301 "coding-category-binary"

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

302 };

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

303

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

304 /* Alist of charsets vs the alternate charsets. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

305 Lisp_Object Valternate_charset_table;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

306

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

307 /* Alist of charsets vs revision number. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

308 Lisp_Object Vcharset_revision_alist;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

309

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

310

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

311 /*** 2. Emacs internal format handlers ***/

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

312

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

313 /* Emacs' internal format for encoding multiple character sets is a

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

314 kind of multi-byte encoding, i.e. encoding a character by a sequence

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

315 of one-byte codes of variable length. ASCII characters and control

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

316 characters (e.g. `tab', `newline') are represented by one-byte as

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

317 is. It takes the range 0x00 through 0x7F. The other characters

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

318 are represented by a sequence of `base leading-code', optional

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

319 `extended leading-code', and one or two `position-code's. Length

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

320 of the sequence is decided by the base leading-code. Leading-code

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

321 takes the range 0x80 through 0x9F, whereas extended leading-code

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

322 and position-code take the range 0xA0 through 0xFF. See the

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

323 document of `charset.h' for more detail about leading-code and

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

324 position-code.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

325

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

326 There's one exception in this rule. Special leading-code

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

327 `leading-code-composition' denotes that the following several

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

328 characters should be composed into one character. Leading-codes of

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

329 components (except for ASCII) are added 0x20. An ASCII character

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

330 component is represented by a 2-byte sequence of `0xA0' and

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

331 `ASCII-code + 0x80'. See also the document in `charset.h' for the

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

332 detail of composite character. Hence, we can summarize the code

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

333 range as follows:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

334

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

335 --- CODE RANGE of Emacs' internal format ---

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

336 (character set) (range)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

337 ASCII 0x00 .. 0x7F

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

338 ELSE (1st byte) 0x80 .. 0x9F

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

339 (rest bytes) 0xA0 .. 0xFF

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

340 ---------------------------------------------

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

341

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

342 */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

343

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

344 enum emacs_code_class_type emacs_code_class[256];

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

345

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

346 /* Go to the next statement only if *SRC is accessible and the code is

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

347 greater than 0xA0. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

348 #define CHECK_CODE_RANGE_A0_FF \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

349 do { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

350 if (src >= src_end) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

351 goto label_end_of_switch; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

352 else if (*src++ < 0xA0) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

353 return 0; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

354 } while (0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

355

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

356 /* See the above "GENERAL NOTES on `detect_coding_XXX ()' functions".

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

357 Check if a text is encoded in Emacs' internal format. If it is,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

358 return CODING_CATEGORY_MASK_INTERNAL, else return 0. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

359

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

360 int

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

361 detect_coding_internal (src, src_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

362 unsigned char *src, *src_end;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

363 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

364 unsigned char c;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

365 int composing = 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

366

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

367 while (src < src_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

368 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

369 c = *src++;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

370

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

371 if (composing)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

372 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

373 if (c < 0xA0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

374 composing = 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

375 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

376 c -= 0x20;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

377 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

378

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

379 switch (emacs_code_class[c])

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

380 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

381 case EMACS_ascii_code:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

382 case EMACS_linefeed_code:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

383 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

384

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

385 case EMACS_control_code:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

386 if (c == ISO_CODE_ESC || c == ISO_CODE_SI || c == ISO_CODE_SO)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

387 return 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

388 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

389

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

390 case EMACS_invalid_code:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

391 return 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

392

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

393 case EMACS_leading_code_composition: /* c == 0x80 */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

394 if (composing)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

395 CHECK_CODE_RANGE_A0_FF;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

396 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

397 composing = 1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

398 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

399

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

400 case EMACS_leading_code_4:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

401 CHECK_CODE_RANGE_A0_FF;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

402 /* fall down to check it two more times ... */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

403

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

404 case EMACS_leading_code_3:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

405 CHECK_CODE_RANGE_A0_FF;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

406 /* fall down to check it one more time ... */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

407

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

408 case EMACS_leading_code_2:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

409 CHECK_CODE_RANGE_A0_FF;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

410 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

411

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

412 default:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

413 label_end_of_switch:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

414 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

415 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

416 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

417 return CODING_CATEGORY_MASK_INTERNAL;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

418 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

419

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

420

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

421 /*** 3. ISO2022 handlers ***/

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

422

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

423 /* The following note describes the coding system ISO2022 briefly.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

424 Since the intension of this note is to help understanding of the

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

425 programs in this file, some parts are NOT ACCURATE or OVERLY

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

426 SIMPLIFIED. For the thorough understanding, please refer to the

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

427 original document of ISO2022.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

428

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

429 ISO2022 provides many mechanisms to encode several character sets

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

430 in 7-bit and 8-bit environment. If one choose 7-bite environment,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

431 all text is encoded by codes of less than 128. This may make the

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

432 encoded text a little bit longer, but the text get more stability

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

433 to pass through several gateways (some of them split MSB off).

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

434

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

435 There are two kind of character set: control character set and

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

436 graphic character set. The former contains control characters such

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

437 as `newline' and `escape' to provide control functions (control

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

438 functions are provided also by escape sequence). The latter

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

439 contains graphic characters such as ' A' and '-'. Emacs recognizes

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

440 two control character sets and many graphic character sets.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

441

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

442 Graphic character sets are classified into one of the following

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

443 four classes, DIMENSION1_CHARS94, DIMENSION1_CHARS96,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

444 DIMENSION2_CHARS94, DIMENSION2_CHARS96 according to the number of

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

445 bytes (DIMENSION) and the number of characters in one dimension

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

446 (CHARS) of the set. In addition, each character set is assigned an

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

447 identification tag (called "final character" and denoted as <F>

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

448 here after) which is unique in each class. <F> of each character

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

449 set is decided by ECMA(*) when it is registered in ISO. Code range

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

450 of <F> is 0x30..0x7F (0x30..0x3F are for private use only).

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

451

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

452 Note (*): ECMA = European Computer Manufacturers Association

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

453

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

454 Here are examples of graphic character set [NAME(<F>)]:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

455 o DIMENSION1_CHARS94 -- ASCII('B'), right-half-of-JISX0201('I'), ...

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

456 o DIMENSION1_CHARS96 -- right-half-of-ISO8859-1('A'), ...

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

457 o DIMENSION2_CHARS94 -- GB2312('A'), JISX0208('B'), ...

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

458 o DIMENSION2_CHARS96 -- none for the moment

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

459

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

460 A code area (1byte=8bits) is divided into 4 areas, C0, GL, C1, and GR.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

461 C0 [0x00..0x1F] -- control character plane 0

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

462 GL [0x20..0x7F] -- graphic character plane 0

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

463 C1 [0x80..0x9F] -- control character plane 1

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

464 GR [0xA0..0xFF] -- graphic character plane 1

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

465

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

466 A control character set is directly designated and invoked to C0 or

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

467 C1 by an escape sequence. The most common case is that ISO646's

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

468 control character set is designated/invoked to C0 and ISO6429's

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

469 control character set is designated/invoked to C1, and usually

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

470 these designations/invocations are omitted in a coded text. With

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

471 7-bit environment, only C0 can be used, and a control character for

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

472 C1 is encoded by an appropriate escape sequence to fit in the

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

473 environment. All control characters for C1 are defined the

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

474 corresponding escape sequences.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

475

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

476 A graphic character set is at first designated to one of four

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

477 graphic registers (G0 through G3), then these graphic registers are

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

478 invoked to GL or GR. These designations and invocations can be

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

479 done independently. The most common case is that G0 is invoked to

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

480 GL, G1 is invoked to GR, and ASCII is designated to G0, and usually

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

481 these invocations and designations are omitted in a coded text.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

482 With 7-bit environment, only GL can be used.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

483

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

484 When a graphic character set of CHARS94 is invoked to GL, code 0x20

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

485 and 0x7F of GL area work as control characters SPACE and DEL

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

486 respectively, and code 0xA0 and 0xFF of GR area should not be used.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

487

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

488 There are two ways of invocation: locking-shift and single-shift.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

489 With locking-shift, the invocation lasts until the next different

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

490 invocation, whereas with single-shift, the invocation works only

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

491 for the following character and doesn't affect locking-shift.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

492 Invocations are done by the following control characters or escape

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

493 sequences.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

494

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

495 ----------------------------------------------------------------------

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

496 function control char escape sequence description

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

497 ----------------------------------------------------------------------

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

498 SI (shift-in) 0x0F none invoke G0 to GL

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

499 SI (shift-out) 0x0E none invoke G1 to GL

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

500 LS2 (locking-shift-2) none ESC 'n' invoke G2 into GL

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

501 LS3 (locking-shift-3) none ESC 'o' invoke G3 into GL

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

502 SS2 (single-shift-2) 0x8E ESC 'N' invoke G2 into GL

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

503 SS3 (single-shift-3) 0x8F ESC 'O' invoke G3 into GL

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

504 ----------------------------------------------------------------------

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

505 The first four are for locking-shift. Control characters for these

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

506 functions are defined by macros ISO_CODE_XXX in `coding.h'.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

507

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

508 Designations are done by the following escape sequences.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

509 ----------------------------------------------------------------------

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

510 escape sequence description

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

511 ----------------------------------------------------------------------

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

512 ESC '(' <F> designate DIMENSION1_CHARS94<F> to G0

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

513 ESC ')' <F> designate DIMENSION1_CHARS94<F> to G1

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

514 ESC '*' <F> designate DIMENSION1_CHARS94<F> to G2

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

515 ESC '+' <F> designate DIMENSION1_CHARS94<F> to G3

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

516 ESC ',' <F> designate DIMENSION1_CHARS96<F> to G0 (*)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

517 ESC '-' <F> designate DIMENSION1_CHARS96<F> to G1

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

518 ESC '.' <F> designate DIMENSION1_CHARS96<F> to G2

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

519 ESC '/' <F> designate DIMENSION1_CHARS96<F> to G3

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

520 ESC '$' '(' <F> designate DIMENSION2_CHARS94<F> to G0 (**)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

521 ESC '$' ')' <F> designate DIMENSION2_CHARS94<F> to G1

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

522 ESC '$' '*' <F> designate DIMENSION2_CHARS94<F> to G2

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

523 ESC '$' '+' <F> designate DIMENSION2_CHARS94<F> to G3

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

524 ESC '$' ',' <F> designate DIMENSION2_CHARS96<F> to G0 (*)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

525 ESC '$' '-' <F> designate DIMENSION2_CHARS96<F> to G1

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

526 ESC '$' '.' <F> designate DIMENSION2_CHARS96<F> to G2

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

527 ESC '$' '/' <F> designate DIMENSION2_CHARS96<F> to G3

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

528 ----------------------------------------------------------------------

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

529

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

530 In this list, "DIMENSION1_CHARS94<F>" means a graphic character set

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

531 of dimension 1, chars 94, and final character <F>, and etc.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

532

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

533 Note (*): Although these designations are not allowed in ISO2022,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

534 Emacs accepts them on decoding, and produces them on encoding

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

535 CHARS96 character set in a coding system which is characterized as

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

536 7-bit environment, non-locking-shift, and non-single-shift.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

537

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

538 Note (**): If <F> is '@', 'A', or 'B', the intermediate character

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

539 '(' can be omitted. We call this as "short-form" here after.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

540

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

541 Now you may notice that there are a lot of ways for encoding the

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

542 same multilingual text in ISO2022. Actually, there exist many

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

543 coding systems such as Compound Text (used in X's inter client

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

544 communication, ISO-2022-JP (used in Japanese Internet), ISO-2022-KR

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

545 (used in Korean Internet), EUC (Extended UNIX Code, used in Asian

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

546 localized platforms), and all of these are variants of ISO2022.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

547

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

548 In addition to the above, Emacs handles two more kinds of escape

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

549 sequences: ISO6429's direction specification and Emacs' private

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

550 sequence for specifying character composition.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

551

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

552 ISO6429's direction specification takes the following format:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

553 o CSI ']' -- end of the current direction

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

554 o CSI '0' ']' -- end of the current direction

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

555 o CSI '1' ']' -- start of left-to-right text

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

556 o CSI '2' ']' -- start of right-to-left text

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

557 The control character CSI (0x9B: control sequence introducer) is

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

558 abbreviated to the escape sequence ESC '[' in 7-bit environment.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

559

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

560 Character composition specification takes the following format:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

561 o ESC '0' -- start character composition

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

562 o ESC '1' -- end character composition

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

563 Since these are not standard escape sequences of any ISO, the use

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

564 of them for these meaning is restricted to Emacs only. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

565

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

566 enum iso_code_class_type iso_code_class[256];

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

567

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

568 /* See the above "GENERAL NOTES on `detect_coding_XXX ()' functions".

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

569 Check if a text is encoded in ISO2022. If it is, returns an

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

570 integer in which appropriate flag bits any of:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

571 CODING_CATEGORY_MASK_ISO_7

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

572 CODING_CATEGORY_MASK_ISO_8_1

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

573 CODING_CATEGORY_MASK_ISO_8_2

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

574 CODING_CATEGORY_MASK_ISO_ELSE

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

575 are set. If a code which should never appear in ISO2022 is found,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

576 returns 0. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

577

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

578 int

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

579 detect_coding_iso2022 (src, src_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

580 unsigned char *src, *src_end;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

581 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

582 unsigned char graphic_register[4];

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

583 unsigned char c, esc_cntl;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

584 int mask = (CODING_CATEGORY_MASK_ISO_7

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

585 | CODING_CATEGORY_MASK_ISO_8_1

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

586 | CODING_CATEGORY_MASK_ISO_8_2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

587 /* We may look ahead maximum 3 bytes. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

588 unsigned char *adjusted_src_end = src_end - 3;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

589 int i;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

590

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

591 for (i = 0; i < 4; i++)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

592 graphic_register[i] = CHARSET_ASCII;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

593

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

594 while (src < adjusted_src_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

595 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

596 c = *src++;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

597 switch (c)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

598 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

599 case ISO_CODE_ESC:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

600 if (src >= adjusted_src_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

601 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

602 c = *src++;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

603 if (c == '$')

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

604 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

605 /* Designation of 2-byte character set. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

606 if (src >= adjusted_src_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

607 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

608 c = *src++;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

609 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

610 if ((c >= ')' && c <= '+') || (c >= '-' && c <= '/'))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

611 /* Designation to graphic register 1, 2, or 3. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

612 mask &= ~CODING_CATEGORY_MASK_ISO_7;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

613 else if (c == 'N' || c == 'O' || c == 'n' || c == 'o')

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

614 return CODING_CATEGORY_MASK_ISO_ELSE;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

615 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

616

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

617 case ISO_CODE_SI:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

618 case ISO_CODE_SO:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

619 return CODING_CATEGORY_MASK_ISO_ELSE;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

620

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

621 case ISO_CODE_CSI:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

622 case ISO_CODE_SS2:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

623 case ISO_CODE_SS3:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

624 mask &= ~CODING_CATEGORY_MASK_ISO_7;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

625 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

626

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

627 default:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

628 if (c < 0x80)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

629 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

630 else if (c < 0xA0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

631 return 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

632 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

633 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

634 int count = 1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

635

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

636 mask &= ~CODING_CATEGORY_MASK_ISO_7;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

637 while (src < adjusted_src_end && *src >= 0xA0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

638 count++, src++;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

639 if (count & 1 && src < adjusted_src_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

640 mask &= ~CODING_CATEGORY_MASK_ISO_8_2;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

641 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

642 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

643 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

644 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

645

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

646 return mask;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

647 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

648

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

649 /* Decode a character of which charset is CHARSET and the 1st position

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

650 code is C1. If dimension of CHARSET 2, the 2nd position code is

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

651 fetched from SRC and set to C2. If CHARSET is negative, it means

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

652 that we are decoding ill formed text, and what we can do is just to

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

653 read C1 as is. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

654

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

655 #define DECODE_ISO_CHARACTER(charset, c1) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

656 do { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

657 if ((charset) >= 0 && CHARSET_DIMENSION (charset) == 2) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

658 ONE_MORE_BYTE (c2); \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

659 if (COMPOSING_HEAD_P (coding->composing)) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

660 { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

661 *dst++ = LEADING_CODE_COMPOSITION; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

662 if (COMPOSING_WITH_RULE_P (coding->composing)) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

663 /* To tell composition rules are embeded. */ \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

664 *dst++ = 0xFF; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

665 coding->composing += 2; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

666 } \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

667 if ((charset) < 0) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

668 *dst++ = c1; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

669 else if ((charset) == CHARSET_ASCII) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

670 DECODE_CHARACTER_ASCII (c1); \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

671 else if (CHARSET_DIMENSION (charset) == 1) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

672 DECODE_CHARACTER_DIMENSION1 (charset, c1); \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

673 else \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

674 DECODE_CHARACTER_DIMENSION2 (charset, c1, c2); \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

675 if (COMPOSING_WITH_RULE_P (coding->composing)) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

676 /* To tell a composition rule follows. */ \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

677 coding->composing = COMPOSING_WITH_RULE_RULE; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

678 } while (0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

679

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

680 /* Set designation state into CODING. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

681 #define DECODE_DESIGNATION(reg, dimension, chars, final_char) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

682 do { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

683 int charset = ISO_CHARSET_TABLE (dimension, chars, final_char); \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

684 Lisp_Object temp \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

685 = Fassq (CHARSET_SYMBOL (charset), Valternate_charset_table); \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

686 if (! NILP (temp)) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

687 charset = get_charset_id (XCONS (temp)->cdr); \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

688 if (charset >= 0) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

689 { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

690 if (coding->direction == 1 \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

691 && CHARSET_REVERSE_CHARSET (charset) >= 0) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

692 charset = CHARSET_REVERSE_CHARSET (charset); \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

693 CODING_SPEC_ISO_DESIGNATION (coding, reg) = charset; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

694 } \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

695 } while (0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

696

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

697 /* See the above "GENERAL NOTES on `decode_coding_XXX ()' functions". */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

698

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

699 int

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

700 decode_coding_iso2022 (coding, source, destination,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

701 src_bytes, dst_bytes, consumed)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

702 struct coding_system *coding;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

703 unsigned char *source, *destination;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

704 int src_bytes, dst_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

705 int *consumed;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

706 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

707 unsigned char *src = source;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

708 unsigned char *src_end = source + src_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

709 unsigned char *dst = destination;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

710 unsigned char *dst_end = destination + dst_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

711 /* Since the maximum bytes produced by each loop is 7, we subtract 6

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

712 from DST_END to assure that overflow checking is necessary only

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

713 at the head of loop. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

714 unsigned char *adjusted_dst_end = dst_end - 6;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

715 int charset;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

716 /* Charsets invoked to graphic plane 0 and 1 respectively. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

717 int charset0 = CODING_SPEC_ISO_PLANE_CHARSET (coding, 0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

718 int charset1 = CODING_SPEC_ISO_PLANE_CHARSET (coding, 1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

719

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

720 while (src < src_end && dst < adjusted_dst_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

721 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

722 /* SRC_BASE remembers the start position in source in each loop.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

723 The loop will be exited when there's not enough source text

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

724 to analyze long escape sequence or 2-byte code (within macros

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

725 ONE_MORE_BYTE or TWO_MORE_BYTES). In that case, SRC is reset

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

726 to SRC_BASE before exiting. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

727 unsigned char *src_base = src;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

728 unsigned char c1 = *src++, c2, cmprule;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

729

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

730 switch (iso_code_class [c1])

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

731 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

732 case ISO_0x20_or_0x7F:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

733 if (!coding->composing

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

734 && (charset0 < 0 || CHARSET_CHARS (charset0) == 94))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

735 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

736 /* This is SPACE or DEL. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

737 *dst++ = c1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

738 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

739 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

740 /* This is a graphic character, we fall down ... */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

741

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

742 case ISO_graphic_plane_0:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

743 if (coding->composing == COMPOSING_WITH_RULE_RULE)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

744 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

745 /* This is a composition rule. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

746 *dst++ = c1 | 0x80;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

747 coding->composing = COMPOSING_WITH_RULE_TAIL;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

748 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

749 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

750 DECODE_ISO_CHARACTER (charset0, c1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

751 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

752

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

753 case ISO_0xA0_or_0xFF:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

754 if (charset1 < 0 || CHARSET_CHARS (charset1) == 94)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

755 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

756 /* Invalid code. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

757 *dst++ = c1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

758 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

759 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

760 /* This is a graphic character, we fall down ... */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

761

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

762 case ISO_graphic_plane_1:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

763 DECODE_ISO_CHARACTER (charset1, c1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

764 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

765

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

766 case ISO_control_code:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

767 /* All ISO2022 control characters in this class have the

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

768 same representation in Emacs internal format. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

769 *dst++ = c1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

770 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

771

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

772 case ISO_carriage_return:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

773 if (coding->eol_type == CODING_EOL_CR)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

774 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

775 *dst++ = '\n';

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

776 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

777 else if (coding->eol_type == CODING_EOL_CRLF)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

778 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

779 ONE_MORE_BYTE (c1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

780 if (c1 == ISO_CODE_LF)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

781 *dst++ = '\n';

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

782 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

783 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

784 src--;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

785 *dst++ = c1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

786 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

787 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

788 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

789 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

790 *dst++ = c1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

791 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

792 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

793

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

794 case ISO_shift_out:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

795 CODING_SPEC_ISO_INVOCATION (coding, 0) = 1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

796 charset0 = CODING_SPEC_ISO_PLANE_CHARSET (coding, 0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

797 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

798

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

799 case ISO_shift_in:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

800 CODING_SPEC_ISO_INVOCATION (coding, 0) = 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

801 charset0 = CODING_SPEC_ISO_PLANE_CHARSET (coding, 0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

802 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

803

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

804 case ISO_single_shift_2_7:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

805 case ISO_single_shift_2:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

806 /* SS2 is handled as an escape sequence of ESC 'N' */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

807 c1 = 'N';

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

808 goto label_escape_sequence;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

809

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

810 case ISO_single_shift_3:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

811 /* SS2 is handled as an escape sequence of ESC 'O' */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

812 c1 = 'O';

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

813 goto label_escape_sequence;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

814

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

815 case ISO_control_sequence_introducer:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

816 /* CSI is handled as an escape sequence of ESC '[' ... */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

817 c1 = '[';

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

818 goto label_escape_sequence;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

819

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

820 case ISO_escape:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

821 ONE_MORE_BYTE (c1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

822 label_escape_sequence:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

823 /* Escape sequences handled by Emacs are invocation,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

824 designation, direction specification, and character

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

825 composition specification. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

826 switch (c1)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

827 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

828 case '&': /* revision of following character set */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

829 ONE_MORE_BYTE (c1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

830 if (!(c1 >= '@' && c1 <= '~'))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

831 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

832 goto label_invalid_escape_sequence;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

833 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

834 ONE_MORE_BYTE (c1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

835 if (c1 != ISO_CODE_ESC)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

836 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

837 goto label_invalid_escape_sequence;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

838 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

839 ONE_MORE_BYTE (c1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

840 goto label_escape_sequence;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

841

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

842 case '$': /* designation of 2-byte character set */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

843 ONE_MORE_BYTE (c1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

844 if (c1 >= '@' && c1 <= 'B')

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

845 { /* designation of JISX0208.1978, GB2312.1980,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

846 or JISX0208.1980 */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

847 DECODE_DESIGNATION (0, 2, 94, c1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

848 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

849 else if (c1 >= 0x28 && c1 <= 0x2B)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

850 { /* designation of DIMENSION2_CHARS94 character set */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

851 ONE_MORE_BYTE (c2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

852 DECODE_DESIGNATION (c1 - 0x28, 2, 94, c2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

853 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

854 else if (c1 >= 0x2C && c1 <= 0x2F)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

855 { /* designation of DIMENSION2_CHARS96 character set */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

856 ONE_MORE_BYTE (c2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

857 DECODE_DESIGNATION (c1 - 0x2C, 2, 96, c2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

858 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

859 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

860 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

861 goto label_invalid_escape_sequence;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

862 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

863 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

864

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

865 case 'n': /* invocation of locking-shift-2 */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

866 CODING_SPEC_ISO_INVOCATION (coding, 0) = 2;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

867 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

868

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

869 case 'o': /* invocation of locking-shift-3 */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

870 CODING_SPEC_ISO_INVOCATION (coding, 0) = 3;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

871 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

872

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

873 case 'N': /* invocation of single-shift-2 */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

874 ONE_MORE_BYTE (c1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

875 charset = CODING_SPEC_ISO_DESIGNATION (coding, 2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

876 DECODE_ISO_CHARACTER (charset, c1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

877 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

878

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

879 case 'O': /* invocation of single-shift-3 */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

880 ONE_MORE_BYTE (c1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

881 charset = CODING_SPEC_ISO_DESIGNATION (coding, 3);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

882 DECODE_ISO_CHARACTER (charset, c1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

883 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

884

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

885 case '0': /* start composing without embeded rules */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

886 coding->composing = COMPOSING_NO_RULE_HEAD;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

887 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

888

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

889 case '1': /* end composing */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

890 coding->composing = COMPOSING_NO;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

891 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

892

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

893 case '2': /* start composing with embeded rules */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

894 coding->composing = COMPOSING_WITH_RULE_HEAD;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

895 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

896

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

897 case '[': /* specification of direction */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

898 /* For the moment, nested direction is not supported.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

899 So, the value of `coding->direction' is 0 or 1: 0

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

900 means left-to-right, 1 means right-to-left. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

901 ONE_MORE_BYTE (c1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

902 switch (c1)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

903 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

904 case ']': /* end of the current direction */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

905 coding->direction = 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

906

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

907 case '0': /* end of the current direction */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

908 case '1': /* start of left-to-right direction */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

909 ONE_MORE_BYTE (c1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

910 if (c1 == ']')

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

911 coding->direction = 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

912 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

913 goto label_invalid_escape_sequence;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

914 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

915

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

916 case '2': /* start of right-to-left direction */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

917 ONE_MORE_BYTE (c1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

918 if (c1 == ']')

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

919 coding->direction= 1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

920 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

921 goto label_invalid_escape_sequence;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

922 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

923

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

924 default:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

925 goto label_invalid_escape_sequence;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

926 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

927 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

928

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

929 default:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

930 if (c1 >= 0x28 && c1 <= 0x2B)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

931 { /* designation of DIMENSION1_CHARS94 character set */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

932 ONE_MORE_BYTE (c2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

933 DECODE_DESIGNATION (c1 - 0x28, 1, 94, c2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

934 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

935 else if (c1 >= 0x2C && c1 <= 0x2F)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

936 { /* designation of DIMENSION1_CHARS96 character set */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

937 ONE_MORE_BYTE (c2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

938 DECODE_DESIGNATION (c1 - 0x2C, 1, 96, c2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

939 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

940 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

941 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

942 goto label_invalid_escape_sequence;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

943 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

944 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

945 /* We must update these variables now. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

946 charset0 = CODING_SPEC_ISO_PLANE_CHARSET (coding, 0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

947 charset1 = CODING_SPEC_ISO_PLANE_CHARSET (coding, 1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

948 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

949

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

950 label_invalid_escape_sequence:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

951 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

952 int length = src - src_base;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

953

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

954 bcopy (src_base, dst, length);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

955 dst += length;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

956 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

957 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

958 continue;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

959

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

960 label_end_of_loop:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

961 coding->carryover_size = src - src_base;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

962 bcopy (src_base, coding->carryover, coding->carryover_size);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

963 src = src_base;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

964 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

965 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

966

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

967 /* If this is the last block of the text to be decoded, we had

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

968 better just flush out all remaining codes in the text although

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

969 they are not valid characters. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

970 if (coding->last_block)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

971 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

972 bcopy (src, dst, src_end - src);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

973 dst += (src_end - src);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

974 src = src_end;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

975 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

976 *consumed = src - source;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

977 return dst - destination;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

978 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

979

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

980 /* ISO2022 encoding staffs. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

981

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

982 /*

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

983 It is not enough to say just "ISO2022" on encoding, but we have to

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

984 specify more details. In Emacs, each coding-system of ISO2022

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

985 variant has the following specifications:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

986 1. Initial designation to G0 thru G3.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

987 2. Allows short-form designation?

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

988 3. ASCII should be designated to G0 before control characters?

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

989 4. ASCII should be designated to G0 at end of line?

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

990 5. 7-bit environment or 8-bit environment?

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

991 6. Use locking-shift?

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

992 7. Use Single-shift?

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

993 And the following two are only for Japanese:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

994 8. Use ASCII in place of JIS0201-1976-Roman?

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

995 9. Use JISX0208-1983 in place of JISX0208-1978?

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

996 These specifications are encoded in `coding->flags' as flag bits

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

997 defined by macros CODING_FLAG_ISO_XXX. See `coding.h' for more

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

998 detail.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

999 */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1000

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1001 /* Produce codes (escape sequence) for designating CHARSET to graphic

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1002 register REG. If <final-char> of CHARSET is '@', 'A', or 'B' and

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1003 the coding system CODING allows, produce designation sequence of

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1004 short-form. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1005

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1006 #define ENCODE_DESIGNATION(charset, reg, coding) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1007 do { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1008 unsigned char final_char = CHARSET_ISO_FINAL_CHAR (charset); \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1009 char *intermediate_char_94 = "()*+"; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1010 char *intermediate_char_96 = ",-./"; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1011 Lisp_Object temp \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1012 = Fassq (make_number (charset), Vcharset_revision_alist); \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1013 if (! NILP (temp)) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1014 { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1015 *dst++ = ISO_CODE_ESC; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1016 *dst++ = '&'; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1017 *dst++ = XINT (XCONS (temp)->cdr) + '@'; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1018 } \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1019 *dst++ = ISO_CODE_ESC; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1020 if (CHARSET_DIMENSION (charset) == 1) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1021 { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1022 if (CHARSET_CHARS (charset) == 94) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1023 *dst++ = (unsigned char) (intermediate_char_94[reg]); \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1024 else \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1025 *dst++ = (unsigned char) (intermediate_char_96[reg]); \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1026 } \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1027 else \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1028 { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1029 *dst++ = '$'; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1030 if (CHARSET_CHARS (charset) == 94) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1031 { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1032 if (! (coding->flags & CODING_FLAG_ISO_SHORT_FORM) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1033 || reg != 0 \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1034 || final_char < '@' || final_char > 'B') \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1035 *dst++ = (unsigned char) (intermediate_char_94[reg]); \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1036 } \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1037 else \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1038 *dst++ = (unsigned char) (intermediate_char_96[reg]); \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1039 } \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1040 *dst++ = final_char; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1041 CODING_SPEC_ISO_DESIGNATION (coding, reg) = charset; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1042 } while (0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1043

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1044 /* The following two macros produce codes (control character or escape

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1045 sequence) for ISO2022 single-shift functions (single-shift-2 and

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1046 single-shift-3). */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1047

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1048 #define ENCODE_SINGLE_SHIFT_2 \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1049 do { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1050 if (coding->flags & CODING_FLAG_ISO_SEVEN_BITS) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1051 *dst++ = ISO_CODE_ESC, *dst++ = 'N'; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1052 else \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1053 *dst++ = ISO_CODE_SS2; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1054 CODING_SPEC_ISO_SINGLE_SHIFTING (coding) = 1; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1055 } while (0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1056

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1057 #define ENCODE_SINGLE_SHIFT_3 \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1058 do { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1059 if (coding->flags & CODING_FLAG_ISO_SEVEN_BITS) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1060 *dst++ = ISO_CODE_ESC, *dst++ = 'O'; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1061 else \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1062 *dst++ = ISO_CODE_SS3; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1063 CODING_SPEC_ISO_SINGLE_SHIFTING (coding) = 1; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1064 } while (0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1065

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1066 /* The following four macros produce codes (control character or

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1067 escape sequence) for ISO2022 locking-shift functions (shift-in,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1068 shift-out, locking-shift-2, and locking-shift-3). */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1069

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1070 #define ENCODE_SHIFT_IN \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1071 do { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1072 *dst++ = ISO_CODE_SI; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1073 CODING_SPEC_ISO_INVOCATION (coding, 0) = 0; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1074 } while (0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1075

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1076 #define ENCODE_SHIFT_OUT \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1077 do { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1078 *dst++ = ISO_CODE_SO; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1079 CODING_SPEC_ISO_INVOCATION (coding, 0) = 1; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1080 } while (0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1081

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1082 #define ENCODE_LOCKING_SHIFT_2 \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1083 do { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1084 *dst++ = ISO_CODE_ESC, *dst++ = 'n'; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1085 CODING_SPEC_ISO_INVOCATION (coding, 0) = 2; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1086 } while (0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1087

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1088 #define ENCODE_LOCKING_SHIFT_3 \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1089 do { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1090 *dst++ = ISO_CODE_ESC, *dst++ = 'o'; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1091 CODING_SPEC_ISO_INVOCATION (coding, 0) = 3; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1092 } while (0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1093

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1094 /* Produce codes for a DIMENSION1 character of which character set is

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1095 CHARSET and position-code is C1. Designation and invocation

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1096 sequences are also produced in advance if necessary. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1097

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1098

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1099 #define ENCODE_ISO_CHARACTER_DIMENSION1(charset, c1) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1100 do { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1101 if (CODING_SPEC_ISO_SINGLE_SHIFTING (coding)) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1102 { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1103 if (coding->flags & CODING_FLAG_ISO_SEVEN_BITS) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1104 *dst++ = c1 & 0x7F; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1105 else \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1106 *dst++ = c1 | 0x80; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1107 CODING_SPEC_ISO_SINGLE_SHIFTING (coding) = 0; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1108 break; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1109 } \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1110 else if (charset == CODING_SPEC_ISO_PLANE_CHARSET (coding, 0)) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1111 { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1112 *dst++ = c1 & 0x7F; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1113 break; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1114 } \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1115 else if (charset == CODING_SPEC_ISO_PLANE_CHARSET (coding, 1)) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1116 { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1117 *dst++ = c1 | 0x80; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1118 break; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1119 } \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1120 else \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1121 /* Since CHARSET is not yet invoked to any graphic planes, we \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1122 must invoke it, or, at first, designate it to some graphic \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1123 register. Then repeat the loop to actually produce the \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1124 character. */ \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1125 dst = encode_invocation_designation (charset, coding, dst); \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1126 } while (1)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1127

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1128 /* Produce codes for a DIMENSION2 character of which character set is

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1129 CHARSET and position-codes are C1 and C2. Designation and

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1130 invocation codes are also produced in advance if necessary. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1131

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1132 #define ENCODE_ISO_CHARACTER_DIMENSION2(charset, c1, c2) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1133 do { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1134 if (CODING_SPEC_ISO_SINGLE_SHIFTING (coding)) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1135 { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1136 if (coding->flags & CODING_FLAG_ISO_SEVEN_BITS) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1137 *dst++ = c1 & 0x7F, *dst++ = c2 & 0x7F; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1138 else \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1139 *dst++ = c1 | 0x80, *dst++ = c2 | 0x80; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1140 CODING_SPEC_ISO_SINGLE_SHIFTING (coding) = 0; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1141 break; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1142 } \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1143 else if (charset == CODING_SPEC_ISO_PLANE_CHARSET (coding, 0)) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1144 { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1145 *dst++ = c1 & 0x7F, *dst++= c2 & 0x7F; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1146 break; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1147 } \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1148 else if (charset == CODING_SPEC_ISO_PLANE_CHARSET (coding, 1)) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1149 { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1150 *dst++ = c1 | 0x80, *dst++= c2 | 0x80; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1151 break; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1152 } \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1153 else \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1154 /* Since CHARSET is not yet invoked to any graphic planes, we \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1155 must invoke it, or, at first, designate it to some graphic \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1156 register. Then repeat the loop to actually produce the \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1157 character. */ \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1158 dst = encode_invocation_designation (charset, coding, dst); \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1159 } while (1)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1160

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1161 /* Produce designation and invocation codes at a place pointed by DST

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1162 to use CHARSET. The element `spec.iso2022' of *CODING is updated.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1163 Return new DST. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1164

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1165 unsigned char *

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1166 encode_invocation_designation (charset, coding, dst)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1167 int charset;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1168 struct coding_system *coding;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1169 unsigned char *dst;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1170 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1171 int reg; /* graphic register number */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1172

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1173 /* At first, check designations. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1174 for (reg = 0; reg < 4; reg++)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1175 if (charset == CODING_SPEC_ISO_DESIGNATION (coding, reg))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1176 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1177

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1178 if (reg >= 4)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1179 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1180 /* CHARSET is not yet designated to any graphic registers. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1181 /* At first check the requested designation. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1182 reg = CODING_SPEC_ISO_REQUESTED_DESIGNATION (coding, charset);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1183 if (reg < 0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1184 /* Since CHARSET requests no special designation, designate to

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1185 graphic register 0. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1186 reg = 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1187

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1188 ENCODE_DESIGNATION (charset, reg, coding);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1189 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1190

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1191 if (CODING_SPEC_ISO_INVOCATION (coding, 0) != reg

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1192 && CODING_SPEC_ISO_INVOCATION (coding, 1) != reg)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1193 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1194 /* Since the graphic register REG is not invoked to any graphic

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1195 planes, invoke it to graphic plane 0. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1196 switch (reg)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1197 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1198 case 0: /* graphic register 0 */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1199 ENCODE_SHIFT_IN;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1200 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1201

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1202 case 1: /* graphic register 1 */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1203 ENCODE_SHIFT_OUT;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1204 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1205

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1206 case 2: /* graphic register 2 */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1207 if (coding->flags & CODING_FLAG_ISO_SINGLE_SHIFT)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1208 ENCODE_SINGLE_SHIFT_2;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1209 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1210 ENCODE_LOCKING_SHIFT_2;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1211 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1212

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1213 case 3: /* graphic register 3 */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1214 if (coding->flags & CODING_FLAG_ISO_SINGLE_SHIFT)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1215 ENCODE_SINGLE_SHIFT_3;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1216 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1217 ENCODE_LOCKING_SHIFT_3;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1218 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1219 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1220 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1221 return dst;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1222 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1223

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1224 /* The following two macros produce codes for indicating composition. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1225 #define ENCODE_COMPOSITION_NO_RULE_START *dst++ = ISO_CODE_ESC, *dst++ = '0'

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1226 #define ENCODE_COMPOSITION_WITH_RULE_START *dst++ = ISO_CODE_ESC, *dst++ = '2'

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1227 #define ENCODE_COMPOSITION_END *dst++ = ISO_CODE_ESC, *dst++ = '1'

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1228

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1229 /* The following three macros produce codes for indicating direction

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1230 of text. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1231 #define ENCODE_CONTROL_SEQUENCE_INTRODUCER \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1232 do { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1233 if (coding->flags == CODING_FLAG_ISO_SEVEN_BITS) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1234 *dst++ = ISO_CODE_ESC, *dst++ = '['; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1235 else \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1236 *dst++ = ISO_CODE_CSI; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1237 } while (0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1238

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1239 #define ENCODE_DIRECTION_R2L \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1240 ENCODE_CONTROL_SEQUENCE_INTRODUCER, *dst++ = '2', *dst++ = ']'

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1241

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1242 #define ENCODE_DIRECTION_L2R \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1243 ENCODE_CONTROL_SEQUENCE_INTRODUCER, *dst++ = '0', *dst++ = ']'

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1244

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1245 /* Produce codes for designation and invocation to reset the graphic

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1246 planes and registers to initial state. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1247 #define ENCODE_RESET_PLANE_AND_REGISTER(eol) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1248 do { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1249 int reg; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1250 if (CODING_SPEC_ISO_INVOCATION (coding, 0) != 0) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1251 ENCODE_SHIFT_IN; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1252 for (reg = 0; reg < 4; reg++) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1253 { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1254 if (CODING_SPEC_ISO_INITIAL_DESIGNATION (coding, reg) < 0) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1255 { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1256 if (eol) CODING_SPEC_ISO_DESIGNATION (coding, reg) = -1; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1257 } \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1258 else if (CODING_SPEC_ISO_DESIGNATION (coding, reg) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1259 != CODING_SPEC_ISO_INITIAL_DESIGNATION (coding, reg)) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1260 ENCODE_DESIGNATION \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1261 (CODING_SPEC_ISO_INITIAL_DESIGNATION (coding, reg), reg, coding); \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1262 } \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1263 } while (0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1264

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1265 /* See the above "GENERAL NOTES on `encode_coding_XXX ()' functions". */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1266

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1267 int

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1268 encode_coding_iso2022 (coding, source, destination,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1269 src_bytes, dst_bytes, consumed)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1270 struct coding_system *coding;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1271 unsigned char *source, *destination;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1272 int src_bytes, dst_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1273 int *consumed;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1274 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1275 unsigned char *src = source;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1276 unsigned char *src_end = source + src_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1277 unsigned char *dst = destination;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1278 unsigned char *dst_end = destination + dst_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1279 /* Since the maximum bytes produced by each loop is 6, we subtract 5

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1280 from DST_END to assure overflow checking is necessary only at the

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1281 head of loop. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1282 unsigned char *adjusted_dst_end = dst_end - 5;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1283

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1284 while (src < src_end && dst < adjusted_dst_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1285 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1286 /* SRC_BASE remembers the start position in source in each loop.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1287 The loop will be exited when there's not enough source text

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1288 to analyze multi-byte codes (within macros ONE_MORE_BYTE,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1289 TWO_MORE_BYTES, and THREE_MORE_BYTES). In that case, SRC is

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1290 reset to SRC_BASE before exiting. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1291 unsigned char *src_base = src;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1292 unsigned char c1 = *src++, c2, c3, c4;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1293 int charset;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1294

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1295 /* If we are seeing a component of a composite character, we are

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1296 seeing a leading-code specially encoded for composition, or a

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1297 composition rule if composing with rule. We must set C1

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1298 to a normal leading-code or an ASCII code. If we are not at

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1299 a composed character, we must reset the composition state. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1300 if (COMPOSING_P (coding->composing))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1301 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1302 if (c1 < 0xA0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1303 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1304 /* We are not in a composite character any longer. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1305 coding->composing = COMPOSING_NO;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1306 ENCODE_COMPOSITION_END;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1307 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1308 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1309 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1310 if (coding->composing == COMPOSING_WITH_RULE_RULE)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1311 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1312 *dst++ = c1 & 0x7F;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1313 coding->composing = COMPOSING_WITH_RULE_HEAD;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1314 continue;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1315 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1316 else if (coding->composing == COMPOSING_WITH_RULE_HEAD)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1317 coding->composing = COMPOSING_WITH_RULE_RULE;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1318 if (c1 == 0xA0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1319 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1320 /* This is an ASCII component. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1321 ONE_MORE_BYTE (c1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1322 c1 &= 0x7F;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1323 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1324 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1325 /* This is a leading-code of non ASCII component. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1326 c1 -= 0x20;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1327 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1328 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1329

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1330 /* Now encode one character. C1 is a control character, an

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1331 ASCII character, or a leading-code of multi-byte character. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1332 switch (emacs_code_class[c1])

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1333 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1334 case EMACS_ascii_code:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1335 ENCODE_ISO_CHARACTER_DIMENSION1 (CHARSET_ASCII, c1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1336 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1337

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1338 case EMACS_control_code:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1339 if (coding->flags & CODING_FLAG_ISO_RESET_AT_CNTL)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1340 ENCODE_RESET_PLANE_AND_REGISTER (0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1341 *dst++ = c1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1342 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1343

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1344 case EMACS_carriage_return_code:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1345 if (!coding->selective)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1346 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1347 if (coding->flags & CODING_FLAG_ISO_RESET_AT_CNTL)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1348 ENCODE_RESET_PLANE_AND_REGISTER (0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1349 *dst++ = c1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1350 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1351 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1352 /* fall down to treat '\r' as '\n' ... */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1353

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1354 case EMACS_linefeed_code:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1355 if (coding->flags & CODING_FLAG_ISO_RESET_AT_EOL)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1356 ENCODE_RESET_PLANE_AND_REGISTER (1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1357 if (coding->eol_type == CODING_EOL_LF

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1358 || coding->eol_type == CODING_EOL_AUTOMATIC)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1359 *dst++ = ISO_CODE_LF;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1360 else if (coding->eol_type == CODING_EOL_CRLF)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1361 *dst++ = ISO_CODE_CR, *dst++ = ISO_CODE_LF;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1362 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1363 *dst++ = ISO_CODE_CR;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1364 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1365

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1366 case EMACS_leading_code_2:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1367 ONE_MORE_BYTE (c2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1368 ENCODE_ISO_CHARACTER_DIMENSION1 (c1, c2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1369 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1370

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1371 case EMACS_leading_code_3:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1372 TWO_MORE_BYTES (c2, c3);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1373 if (c1 < LEADING_CODE_PRIVATE_11)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1374 ENCODE_ISO_CHARACTER_DIMENSION2 (c1, c2, c3);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1375 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1376 ENCODE_ISO_CHARACTER_DIMENSION1 (c2, c3);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1377 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1378

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1379 case EMACS_leading_code_4:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1380 THREE_MORE_BYTES (c2, c3, c4);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1381 ENCODE_ISO_CHARACTER_DIMENSION2 (c2, c3, c4);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1382 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1383

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1384 case EMACS_leading_code_composition:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1385 ONE_MORE_BYTE (c1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1386 if (c1 == 0xFF)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1387 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1388 coding->composing = COMPOSING_WITH_RULE_HEAD;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1389 ENCODE_COMPOSITION_WITH_RULE_START;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1390 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1391 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1392 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1393 /* Rewind one byte because it is a character code of

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1394 composition elements. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1395 src--;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1396 coding->composing = COMPOSING_NO_RULE_HEAD;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1397 ENCODE_COMPOSITION_NO_RULE_START;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1398 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1399 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1400

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1401 case EMACS_invalid_code:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1402 *dst++ = c1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1403 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1404 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1405 continue;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1406 label_end_of_loop:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1407 coding->carryover_size = src - src_base;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1408 bcopy (src_base, coding->carryover, coding->carryover_size);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1409 src = src_base;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1410 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1411 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1412

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1413 /* If this is the last block of the text to be encoded, we must

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1414 reset the state of graphic planes and registers to initial one.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1415 In addition, we had better just flush out all remaining codes in

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1416 the text although they are not valid characters. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1417 if (coding->last_block)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1418 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1419 ENCODE_RESET_PLANE_AND_REGISTER (1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1420 bcopy(src, dst, src_end - src);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1421 dst += (src_end - src);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1422 src = src_end;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1423 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1424 *consumed = src - source;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1425 return dst - destination;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1426 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1427

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1428

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1429 /*** 4. SJIS and BIG5 handlers ***/

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1430

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1431 /* Although SJIS and BIG5 are not ISO's coding system, They are used

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1432 quite widely. So, for the moment, Emacs supports them in the bare

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1433 C code. But, in the future, they may be supported only by CCL. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1434

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1435 /* SJIS is a coding system encoding three character sets: ASCII, right

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1436 half of JISX0201-Kana, and JISX0208. An ASCII character is encoded

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1437 as is. A character of charset katakana-jisx0201 is encoded by

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1438 "position-code + 0x80". A character of charset japanese-jisx0208

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1439 is encoded in 2-byte but two position-codes are divided and shifted

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1440 so that it fit in the range below.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1441

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1442 --- CODE RANGE of SJIS ---

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1443 (character set) (range)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1444 ASCII 0x00 .. 0x7F

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1445 KATAKANA-JISX0201 0xA0 .. 0xDF

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1446 JISX0208 (1st byte) 0x80 .. 0x9F and 0xE0 .. 0xFF

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1447 (2nd byte) 0x40 .. 0xFF

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1448 -------------------------------

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1449

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1450 */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1451

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1452 /* BIG5 is a coding system encoding two character sets: ASCII and

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1453 Big5. An ASCII character is encoded as is. Big5 is a two-byte

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1454 character set and is encoded in two-byte.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1455

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1456 --- CODE RANGE of BIG5 ---

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1457 (character set) (range)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1458 ASCII 0x00 .. 0x7F

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1459 Big5 (1st byte) 0xA1 .. 0xFE

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1460 (2nd byte) 0x40 .. 0x7E and 0xA1 .. 0xFE

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1461 --------------------------

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1462

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1463 Since the number of characters in Big5 is larger than maximum

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1464 characters in Emacs' charset (96x96), it can't be handled as one

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1465 charset. So, in Emacs, Big5 is divided into two: `charset-big5-1'

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1466 and `charset-big5-2'. Both are DIMENSION2 and CHARS94. The former

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1467 contains frequently used characters and the latter contains less

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1468 frequently used characters. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1469

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1470 /* Macros to decode or encode a character of Big5 in BIG5. B1 and B2

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1471 are the 1st and 2nd position-codes of Big5 in BIG5 coding system.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1472 C1 and C2 are the 1st and 2nd position-codes of of Emacs' internal

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1473 format. CHARSET is `charset_big5_1' or `charset_big5_2'. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1474

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1475 /* Number of Big5 characters which have the same code in 1st byte. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1476 #define BIG5_SAME_ROW (0xFF - 0xA1 + 0x7F - 0x40)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1477

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1478 #define DECODE_BIG5(b1, b2, charset, c1, c2) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1479 do { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1480 unsigned int temp \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1481 = (b1 - 0xA1) * BIG5_SAME_ROW + b2 - (b2 < 0x7F ? 0x40 : 0x62); \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1482 if (b1 < 0xC9) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1483 charset = charset_big5_1; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1484 else \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1485 { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1486 charset = charset_big5_2; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1487 temp -= (0xC9 - 0xA1) * BIG5_SAME_ROW; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1488 } \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1489 c1 = temp / (0xFF - 0xA1) + 0x21; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1490 c2 = temp % (0xFF - 0xA1) + 0x21; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1491 } while (0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1492

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1493 #define ENCODE_BIG5(charset, c1, c2, b1, b2) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1494 do { \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1495 unsigned int temp = (c1 - 0x21) * (0xFF - 0xA1) + (c2 - 0x21); \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1496 if (charset == charset_big5_2) \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1497 temp += BIG5_SAME_ROW * (0xC9 - 0xA1); \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1498 b1 = temp / BIG5_SAME_ROW + 0xA1; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1499 b2 = temp % BIG5_SAME_ROW; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1500 b2 += b2 < 0x3F ? 0x40 : 0x62; \

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1501 } while (0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1502

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1503 /* See the above "GENERAL NOTES on `detect_coding_XXX ()' functions".

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1504 Check if a text is encoded in SJIS. If it is, return

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1505 CODING_CATEGORY_MASK_SJIS, else return 0. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1506

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1507 int

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1508 detect_coding_sjis (src, src_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1509 unsigned char *src, *src_end;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1510 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1511 unsigned char c;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1512

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1513 while (src < src_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1514 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1515 c = *src++;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1516 if (c == ISO_CODE_ESC || c == ISO_CODE_SI || c == ISO_CODE_SO)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1517 return 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1518 if ((c >= 0x80 && c < 0xA0) || c >= 0xE0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1519 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1520 if (src < src_end && *src++ < 0x40)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1521 return 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1522 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1523 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1524 return CODING_CATEGORY_MASK_SJIS;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1525 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1526

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1527 /* See the above "GENERAL NOTES on `detect_coding_XXX ()' functions".

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1528 Check if a text is encoded in BIG5. If it is, return

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1529 CODING_CATEGORY_MASK_BIG5, else return 0. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1530

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1531 int

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1532 detect_coding_big5 (src, src_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1533 unsigned char *src, *src_end;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1534 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1535 unsigned char c;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1536

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1537 while (src < src_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1538 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1539 c = *src++;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1540 if (c == ISO_CODE_ESC || c == ISO_CODE_SI || c == ISO_CODE_SO)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1541 return 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1542 if (c >= 0xA1)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1543 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1544 if (src >= src_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1545 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1546 c = *src++;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1547 if (c < 0x40 || (c >= 0x7F && c <= 0xA0))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1548 return 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1549 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1550 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1551 return CODING_CATEGORY_MASK_BIG5;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1552 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1553

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1554 /* See the above "GENERAL NOTES on `decode_coding_XXX ()' functions".

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1555 If SJIS_P is 1, decode SJIS text, else decode BIG5 test. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1556

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1557 int

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1558 decode_coding_sjis_big5 (coding, source, destination,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1559 src_bytes, dst_bytes, consumed, sjis_p)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1560 struct coding_system *coding;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1561 unsigned char *source, *destination;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1562 int src_bytes, dst_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1563 int *consumed;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1564 int sjis_p;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1565 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1566 unsigned char *src = source;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1567 unsigned char *src_end = source + src_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1568 unsigned char *dst = destination;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1569 unsigned char *dst_end = destination + dst_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1570 /* Since the maximum bytes produced by each loop is 4, we subtract 3

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1571 from DST_END to assure overflow checking is necessary only at the

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1572 head of loop. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1573 unsigned char *adjusted_dst_end = dst_end - 3;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1574

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1575 while (src < src_end && dst < adjusted_dst_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1576 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1577 /* SRC_BASE remembers the start position in source in each loop.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1578 The loop will be exited when there's not enough source text

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1579 to analyze two-byte character (within macro ONE_MORE_BYTE).

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1580 In that case, SRC is reset to SRC_BASE before exiting. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1581 unsigned char *src_base = src;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1582 unsigned char c1 = *src++, c2, c3, c4;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1583

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1584 if (c1 == '\r')

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1585 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1586 if (coding->eol_type == CODING_EOL_CRLF)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1587 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1588 ONE_MORE_BYTE (c2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1589 if (c2 == '\n')

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1590 *dst++ = c2;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1591 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1592 /* To process C2 again, SRC is subtracted by 1. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1593 *dst++ = c1, src--;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1594 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1595 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1596 *dst++ = c1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1597 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1598 else if (c1 < 0x80)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1599 *dst++ = c1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1600 else if (c1 < 0xA0 || c1 >= 0xE0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1601 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1602 /* SJIS -> JISX0208, BIG5 -> Big5 (only if 0xE0 <= c1 < 0xFF) */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1603 if (sjis_p)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1604 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1605 ONE_MORE_BYTE (c2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1606 DECODE_SJIS (c1, c2, c3, c4);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1607 DECODE_CHARACTER_DIMENSION2 (charset_jisx0208, c3, c4);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1608 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1609 else if (c1 >= 0xE0 && c1 < 0xFF)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1610 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1611 int charset;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1612

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1613 ONE_MORE_BYTE (c2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1614 DECODE_BIG5 (c1, c2, charset, c3, c4);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1615 DECODE_CHARACTER_DIMENSION2 (charset, c3, c4);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1616 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1617 else /* Invalid code */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1618 *dst++ = c1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1619 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1620 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1621 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1622 /* SJIS -> JISX0201-Kana, BIG5 -> Big5 */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1623 if (sjis_p)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1624 DECODE_CHARACTER_DIMENSION1 (charset_katakana_jisx0201, c1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1625 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1626 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1627 int charset;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1628

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1629 ONE_MORE_BYTE (c2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1630 DECODE_BIG5 (c1, c2, charset, c3, c4);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1631 DECODE_CHARACTER_DIMENSION2 (charset, c3, c4);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1632 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1633 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1634 continue;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1635

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1636 label_end_of_loop:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1637 coding->carryover_size = src - src_base;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1638 bcopy (src_base, coding->carryover, coding->carryover_size);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1639 src = src_base;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1640 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1641 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1642

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1643 *consumed = src - source;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1644 return dst - destination;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1645 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1646

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1647 /* See the above "GENERAL NOTES on `encode_coding_XXX ()' functions".

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1648 This function can encode `charset_ascii', `charset_katakana_jisx0201',

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1649 `charset_jisx0208', `charset_big5_1', and `charset_big5-2'. We are

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1650 sure that all these charsets are registered as official charset

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1651 (i.e. do not have extended leading-codes). Characters of other

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1652 charsets are produced without any encoding. If SJIS_P is 1, encode

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1653 SJIS text, else encode BIG5 text. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1654

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1655 int

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1656 encode_coding_sjis_big5 (coding, source, destination,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1657 src_bytes, dst_bytes, consumed, sjis_p)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1658 struct coding_system *coding;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1659 unsigned char *source, *destination;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1660 int src_bytes, dst_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1661 int *consumed;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1662 int sjis_p;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1663 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1664 unsigned char *src = source;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1665 unsigned char *src_end = source + src_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1666 unsigned char *dst = destination;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1667 unsigned char *dst_end = destination + dst_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1668 /* Since the maximum bytes produced by each loop is 2, we subtract 1

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1669 from DST_END to assure overflow checking is necessary only at the

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1670 head of loop. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1671 unsigned char *adjusted_dst_end = dst_end - 1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1672

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1673 while (src < src_end && dst < adjusted_dst_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1674 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1675 /* SRC_BASE remembers the start position in source in each loop.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1676 The loop will be exited when there's not enough source text

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1677 to analyze multi-byte codes (within macros ONE_MORE_BYTE and

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1678 TWO_MORE_BYTES). In that case, SRC is reset to SRC_BASE

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1679 before exiting. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1680 unsigned char *src_base = src;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1681 unsigned char c1 = *src++, c2, c3, c4;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1682

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1683 if (coding->composing)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1684 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1685 if (c1 == 0xA0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1686 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1687 ONE_MORE_BYTE (c1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1688 c1 &= 0x7F;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1689 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1690 else if (c1 >= 0xA0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1691 c1 -= 0x20;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1692 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1693 coding->composing = 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1694 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1695

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1696 switch (emacs_code_class[c1])

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1697 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1698 case EMACS_ascii_code:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1699 case EMACS_control_code:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1700 *dst++ = c1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1701 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1702

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1703 case EMACS_carriage_return_code:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1704 if (!coding->selective)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1705 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1706 *dst++ = c1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1707 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1708 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1709 /* fall down to treat '\r' as '\n' ... */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1710

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1711 case EMACS_linefeed_code:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1712 if (coding->eol_type == CODING_EOL_LF

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1713 || coding->eol_type == CODING_EOL_AUTOMATIC)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1714 *dst++ = '\n';

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1715 else if (coding->eol_type == CODING_EOL_CRLF)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1716 *dst++ = '\r', *dst++ = '\n';

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1717 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1718 *dst++ = '\r';

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1719 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1720

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1721 case EMACS_leading_code_2:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1722 ONE_MORE_BYTE (c2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1723 if (sjis_p && c1 == charset_katakana_jisx0201)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1724 *dst++ = c2;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1725 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1726 *dst++ = c1, *dst++ = c2;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1727 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1728

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1729 case EMACS_leading_code_3:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1730 TWO_MORE_BYTES (c2, c3);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1731 c2 &= 0x7F, c3 &= 0x7F;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1732 if (sjis_p && c1 == charset_jisx0208)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1733 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1734 unsigned char s1, s2;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1735

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1736 ENCODE_SJIS (c2, c3, s1, s2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1737 *dst++ = s1, *dst++ = s2;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1738 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1739 else if (!sjis_p && (c1 == charset_big5_1 || c1 == charset_big5_2))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1740 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1741 unsigned char b1, b2;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1742

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1743 ENCODE_BIG5 (c1, c2, c3, b1, b2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1744 *dst++ = b1, *dst++ = b2;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1745 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1746 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1747 *dst++ = c1, *dst++ = c2, *dst++ = c3;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1748 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1749

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1750 case EMACS_leading_code_4:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1751 THREE_MORE_BYTES (c2, c3, c4);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1752 *dst++ = c1, *dst++ = c2, *dst++ = c3, *dst++ = c4;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1753 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1754

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1755 case EMACS_leading_code_composition:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1756 coding->composing = 1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1757 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1758

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1759 default: /* i.e. case EMACS_invalid_code: */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1760 *dst++ = c1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1761 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1762 continue;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1763

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1764 label_end_of_loop:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1765 coding->carryover_size = src - src_base;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1766 bcopy (src_base, coding->carryover, coding->carryover_size);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1767 src = src_base;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1768 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1769 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1770

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1771 *consumed = src - source;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1772 return dst - destination;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1773 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1774

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1775

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1776 /*** 5. End-of-line handlers ***/

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1777

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1778 /* See the above "GENERAL NOTES on `decode_coding_XXX ()' functions".

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1779 This function is called only when `coding->eol_type' is

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1780 CODING_EOL_CRLF or CODING_EOL_CR. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1781

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1782 decode_eol (coding, source, destination, src_bytes, dst_bytes, consumed)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1783 struct coding_system *coding;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1784 unsigned char *source, *destination;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1785 int src_bytes, dst_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1786 int *consumed;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1787 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1788 unsigned char *src = source;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1789 unsigned char *src_end = source + src_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1790 unsigned char *dst = destination;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1791 unsigned char *dst_end = destination + dst_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1792 int produced;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1793

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1794 switch (coding->eol_type)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1795 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1796 case CODING_EOL_CRLF:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1797 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1798 /* Since the maximum bytes produced by each loop is 2, we

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1799 subtract 1 from DST_END to assure overflow checking is

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1800 necessary only at the head of loop. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1801 unsigned char *adjusted_dst_end = dst_end - 1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1802

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1803 while (src < src_end && dst < adjusted_dst_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1804 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1805 unsigned char *src_base = src;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1806 unsigned char c = *src++;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1807 if (c == '\r')

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1808 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1809 ONE_MORE_BYTE (c);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1810 if (c != '\n')

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1811 *dst++ = '\r';

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1812

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1813 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1814 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1815 *dst++ = c;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1816 continue;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1817

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1818 label_end_of_loop:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1819 coding->carryover_size = src - src_base;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1820 bcopy (src_base, coding->carryover, coding->carryover_size);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1821 src = src_base;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1822 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1823 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1824 *consumed = src - source;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1825 produced = dst - destination;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1826 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1827 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1828

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1829 case CODING_EOL_CR:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1830 produced = (src_bytes > dst_bytes) ? dst_bytes : src_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1831 bcopy (source, destination, produced);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1832 dst_end = destination + produced;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1833 while (dst < dst_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1834 if (*dst++ == '\r') dst[-1] = '\n';

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1835 *consumed = produced;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1836 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1837

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1838 default: /* i.e. case: CODING_EOL_LF */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1839 produced = (src_bytes > dst_bytes) ? dst_bytes : src_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1840 bcopy (source, destination, produced);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1841 *consumed = produced;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1842 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1843 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1844

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1845 return produced;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1846 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1847

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1848 /* See "GENERAL NOTES about `encode_coding_XXX ()' functions". Encode

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1849 format of end-of-line according to `coding->eol_type'. If

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1850 `coding->selective' is 1, code '\r' in source text also means

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1851 end-of-line. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1852

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1853 encode_eol (coding, source, destination, src_bytes, dst_bytes, consumed)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1854 struct coding_system *coding;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1855 unsigned char *source, *destination;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1856 int src_bytes, dst_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1857 int *consumed;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1858 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1859 unsigned char *src = source;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1860 unsigned char *dst = destination;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1861 int produced;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1862

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1863 if (src_bytes <= 0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1864 return 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1865

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1866 switch (coding->eol_type)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1867 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1868 case CODING_EOL_LF:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1869 case CODING_EOL_AUTOMATIC:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1870 produced = (src_bytes > dst_bytes) ? dst_bytes : src_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1871 bcopy (source, destination, produced);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1872 if (coding->selective)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1873 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1874 int i = produced;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1875 while (i--)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1876 if (*dst++ == '\r') dst[-1] = '\n';

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1877 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1878 *consumed = produced;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1879

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1880 case CODING_EOL_CRLF:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1881 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1882 unsigned char c;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1883 unsigned char *src_end = source + src_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1884 unsigned char *dst_end = destination + dst_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1885 /* Since the maximum bytes produced by each loop is 2, we

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1886 subtract 1 from DST_END to assure overflow checking is

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1887 necessary only at the head of loop. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1888 unsigned char *adjusted_dst_end = dst_end - 1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1889

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1890 while (src < src_end && dst < adjusted_dst_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1891 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1892 c = *src++;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1893 if (c == '\n' || (c == '\r' && coding->selective))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1894 *dst++ = '\r', *dst++ = '\n';

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1895 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1896 *dst++ = c;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1897 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1898 produced = dst - destination;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1899 *consumed = src - source;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1900 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1901 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1902

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1903 default: /* i.e. case CODING_EOL_CR: */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1904 produced = (src_bytes > dst_bytes) ? dst_bytes : src_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1905 bcopy (source, destination, produced);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1906 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1907 int i = produced;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1908 while (i--)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1909 if (*dst++ == '\n') dst[-1] = '\r';

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1910 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1911 *consumed = produced;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1912 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1913

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1914 return produced;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1915 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1916

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1917

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1918 /*** 6. C library functions ***/

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1919

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1920 /* In Emacs Lisp, coding system is represented by a Lisp symbol which

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1921 has a property `coding-system'. The value of this property is a

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1922 vector of length 5 (called as coding-vector). Among elements of

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1923 this vector, the first (element[0]) and the fifth (element[4])

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1924 carry important information for decoding/encoding. Before

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1925 decoding/encoding, this information should be set in fields of a

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1926 structure of type `coding_system'.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1927

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1928 A value of property `coding-system' can be a symbol of another

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1929 subsidiary coding-system. In that case, Emacs gets coding-vector

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1930 from that symbol.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1931

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1932 `element[0]' contains information to be set in `coding->type'. The

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1933 value and its meaning is as follows:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1934

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1935 0 -- coding_system_internal

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1936 1 -- coding_system_sjis

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1937 2 -- coding_system_iso2022

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1938 3 -- coding_system_big5

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1939 4 -- coding_system_ccl

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1940 nil -- coding_system_no_conversion

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1941 t -- coding_system_automatic

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1942

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1943 `element[4]' contains information to be set in `coding->flags' and

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1944 `coding->spec'. The meaning varies by `coding->type'.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1945

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1946 If `coding->type' is `coding_type_iso2022', element[4] is a vector

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1947 of length 32 (of which the first 13 sub-elements are used now).

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1948 Meanings of these sub-elements are:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1949

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1950 sub-element[N] where N is 0 through 3: to be set in `coding->spec.iso2022'

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1951 If the value is an integer of valid charset, the charset is

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1952 assumed to be designated to graphic register N initially.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1953

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1954 If the value is minus, it is a minus value of charset which

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1955 reserves graphic register N, which means that the charset is

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1956 not designated initially but should be designated to graphic

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1957 register N just before encoding a character in that charset.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1958

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1959 If the value is nil, graphic register N is never used on

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1960 encoding.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1961

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1962 sub-element[N] where N is 4 through 11: to be set in `coding->flags'

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1963 Each value takes t or nil. See the section ISO2022 of

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1964 `coding.h' for more information.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1965

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1966 If `coding->type' is `coding_type_big5', element[4] is t to denote

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1967 BIG5-ETen or nil to denote BIG5-HKU.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1968

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1969 If `coding->type' takes the other value, element[4] is ignored.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1970

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1971 Emacs Lisp's coding system also carries information about format of

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1972 end-of-line in a value of property `eol-type'. If the value is

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1973 integer, 0 means CODING_EOL_LF, 1 means CODING_EOL_CRLF, and 2

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1974 means CODING_EOL_CR. If it is not integer, it should be a vector

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1975 of subsidiary coding systems of which property `eol-type' has one

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1976 of above values.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1977

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1978 */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1979

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1980 /* Extract information for decoding/encoding from CODING_SYSTEM_SYMBOL

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1981 and set it in CODING. If CODING_SYSTEM_SYMBOL is invalid, CODING

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1982 is setup so that no conversion is necessary and return -1, else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1983 return 0. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1984

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1985 int

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1986 setup_coding_system (coding_system_symbol, coding)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1987 Lisp_Object coding_system_symbol;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1988 struct coding_system *coding;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1989 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1990 Lisp_Object coding_system_vector = Qnil;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1991 Lisp_Object type, eol_type;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1992

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1993 /* At first, set several fields default values. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1994 coding->require_flushing = 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1995 coding->last_block = 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1996 coding->selective = 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1997 coding->composing = 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1998 coding->direction = 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

1999 coding->carryover_size = 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2000 coding->symbol = Qnil;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2001 coding->post_read_conversion = coding->pre_write_conversion = Qnil;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2002

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2003 /* Get value of property `coding-system'. If it is a Lisp symbol

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2004 pointing another coding system, fetch its property until we get a

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2005 vector. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2006 while (!NILP (coding_system_symbol))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2007 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2008 coding->symbol = coding_system_symbol;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2009 if (NILP (coding->post_read_conversion))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2010 coding->post_read_conversion = Fget (coding_system_symbol,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2011 Qpost_read_conversion);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2012 if (NILP (coding->pre_write_conversion))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2013 coding->pre_write_conversion = Fget (coding_system_symbol,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2014 Qpre_write_conversion);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2015

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2016 coding_system_vector = Fget (coding_system_symbol, Qcoding_system);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2017 if (VECTORP (coding_system_vector))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2018 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2019 coding_system_symbol = coding_system_vector;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2020 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2021 Vlast_coding_system_used = coding->symbol;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2022

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2023 if (!VECTORP (coding_system_vector)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2024 || XVECTOR (coding_system_vector)->size != 5)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2025 goto label_invalid_coding_system;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2026

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2027 /* Get value of property `eol-type' by searching from the root

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2028 coding-system. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2029 coding_system_symbol = coding->symbol;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2030 eol_type = Qnil;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2031 while (SYMBOLP (coding_system_symbol) && !NILP (coding_system_symbol))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2032 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2033 eol_type = Fget (coding_system_symbol, Qeol_type);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2034 if (!NILP (eol_type))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2035 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2036 coding_system_symbol = Fget (coding_system_symbol, Qcoding_system);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2037 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2038

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2039 if (VECTORP (eol_type))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2040 coding->eol_type = CODING_EOL_AUTOMATIC;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2041 else if (XFASTINT (eol_type) == 1)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2042 coding->eol_type = CODING_EOL_CRLF;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2043 else if (XFASTINT (eol_type) == 2)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2044 coding->eol_type = CODING_EOL_CR;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2045 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2046 coding->eol_type = CODING_EOL_LF;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2047

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2048 type = XVECTOR (coding_system_vector)->contents[0];

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2049 switch (XFASTINT (type))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2050 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2051 case 0:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2052 coding->type = coding_type_internal;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2053 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2054

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2055 case 1:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2056 coding->type = coding_type_sjis;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2057 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2058

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2059 case 2:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2060 coding->type = coding_type_iso2022;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2061 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2062 Lisp_Object val = XVECTOR (coding_system_vector)->contents[4];

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2063 Lisp_Object *flags;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2064 int i, charset, default_reg_bits = 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2065

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2066 if (!VECTORP (val) || XVECTOR (val)->size != 32)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2067 goto label_invalid_coding_system;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2068

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2069 flags = XVECTOR (val)->contents;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2070 coding->flags

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2071 = ((NILP (flags[4]) ? 0 : CODING_FLAG_ISO_SHORT_FORM)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2072 | (NILP (flags[5]) ? 0 : CODING_FLAG_ISO_RESET_AT_EOL)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2073 | (NILP (flags[6]) ? 0 : CODING_FLAG_ISO_RESET_AT_CNTL)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2074 | (NILP (flags[7]) ? 0 : CODING_FLAG_ISO_SEVEN_BITS)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2075 | (NILP (flags[8]) ? 0 : CODING_FLAG_ISO_LOCKING_SHIFT)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2076 | (NILP (flags[9]) ? 0 : CODING_FLAG_ISO_SINGLE_SHIFT)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2077 | (NILP (flags[10]) ? 0 : CODING_FLAG_ISO_USE_ROMAN)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2078 | (NILP (flags[11]) ? 0 : CODING_FLAG_ISO_USE_OLDJIS)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2079 | (NILP (flags[12]) ? 0 : CODING_FLAG_ISO_NO_DIRECTION));

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2080

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2081 /* Invoke graphic register 0 to plane 0. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2082 CODING_SPEC_ISO_INVOCATION (coding, 0) = 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2083 /* Invoke graphic register 1 to plane 1 if we can use full 8-bit. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2084 CODING_SPEC_ISO_INVOCATION (coding, 1)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2085 = (coding->flags & CODING_FLAG_ISO_SEVEN_BITS ? -1 : 1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2086 /* Not single shifting at first. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2087 CODING_SPEC_ISO_SINGLE_SHIFTING(coding) = 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2088

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2089 /* Checks FLAGS[REG] (REG = 0, 1, 2 3) and decide designations.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2090 FLAGS[REG] can be one of below:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2091 integer CHARSET: CHARSET occupies register I,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2092 t: designate nothing to REG initially, but can be used

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2093 by any charsets,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2094 list of integer, nil, or t: designate the first

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2095 element (if integer) to REG initially, the remaining

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2096 elements (if integer) is designated to REG on request,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2097 if an element is t, REG can be used by any charset,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2098 nil: REG is never used. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2099 for (charset = 0; charset < MAX_CHARSET; charset++)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2100 CODING_SPEC_ISO_REQUESTED_DESIGNATION (coding, charset) = -1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2101 for (i = 0; i < 4; i++)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2102 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2103 if (INTEGERP (flags[i])

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2104 && (charset = XINT (flags[i]), CHARSET_VALID_P (charset)))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2105 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2106 CODING_SPEC_ISO_INITIAL_DESIGNATION (coding, i) = charset;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2107 CODING_SPEC_ISO_REQUESTED_DESIGNATION (coding, charset) = i;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2108 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2109 else if (EQ (flags[i], Qt))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2110 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2111 CODING_SPEC_ISO_INITIAL_DESIGNATION (coding, i) = -1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2112 default_reg_bits |= 1 << i;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2113 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2114 else if (CONSP (flags[i]))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2115 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2116 Lisp_Object tail = flags[i];

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2117

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2118 if (INTEGERP (XCONS (tail)->car)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2119 && (charset = XINT (XCONS (tail)->car),

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2120 CHARSET_VALID_P (charset)))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2121 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2122 CODING_SPEC_ISO_INITIAL_DESIGNATION (coding, i) = charset;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2123 CODING_SPEC_ISO_REQUESTED_DESIGNATION (coding, charset) =i;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2124 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2125 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2126 CODING_SPEC_ISO_INITIAL_DESIGNATION (coding, i) = -1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2127 tail = XCONS (tail)->cdr;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2128 while (CONSP (tail))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2129 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2130 if (INTEGERP (XCONS (tail)->car)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2131 && (charset = XINT (XCONS (tail)->car),

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2132 CHARSET_VALID_P (charset)))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2133 CODING_SPEC_ISO_REQUESTED_DESIGNATION (coding, charset)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2134 = i;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2135 else if (EQ (XCONS (tail)->car, Qt))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2136 default_reg_bits |= 1 << i;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2137 tail = XCONS (tail)->cdr;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2138 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2139 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2140 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2141 CODING_SPEC_ISO_INITIAL_DESIGNATION (coding, i) = -1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2142

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2143 CODING_SPEC_ISO_DESIGNATION (coding, i)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2144 = CODING_SPEC_ISO_INITIAL_DESIGNATION (coding, i);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2145 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2146

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2147 if (! (coding->flags & CODING_FLAG_ISO_LOCKING_SHIFT))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2148 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2149 /* REG 1 can be used only by locking shift in 7-bit env. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2150 if (coding->flags & CODING_FLAG_ISO_SEVEN_BITS)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2151 default_reg_bits &= ~2;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2152 if (! (coding->flags & CODING_FLAG_ISO_SINGLE_SHIFT))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2153 /* Without any shifting, only REG 0 and 1 can be used. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2154 default_reg_bits &= 3;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2155 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2156

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2157 for (charset = 0; charset < MAX_CHARSET; charset++)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2158 if (CHARSET_VALID_P (charset)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2159 && CODING_SPEC_ISO_REQUESTED_DESIGNATION (coding, charset) < 0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2160 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2161 /* We have not yet decided where to designate CHARSET. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2162 int reg_bits = default_reg_bits;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2163

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2164 if (CHARSET_CHARS (charset) == 96)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2165 /* A charset of CHARS96 can't be designated to REG 0. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2166 reg_bits &= ~1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2167

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2168 if (reg_bits)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2169 /* There exist some default graphic register. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2170 CODING_SPEC_ISO_REQUESTED_DESIGNATION (coding, charset)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2171 = (reg_bits & 1

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2172 ? 0 : (reg_bits & 2 ? 1 : (reg_bits & 4 ? 2 : 3)));

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2173 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2174 /* We anyway have to designate CHARSET to somewhere. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2175 CODING_SPEC_ISO_REQUESTED_DESIGNATION (coding, charset)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2176 = (CHARSET_CHARS (charset) == 94

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2177 ? 0

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2178 : ((coding->flags & CODING_FLAG_ISO_LOCKING_SHIFT

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2179 || ! coding->flags & CODING_FLAG_ISO_SEVEN_BITS)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2180 ? 1

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2181 : (coding->flags & CODING_FLAG_ISO_SINGLE_SHIFT

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2182 ? 2 : 0)));

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2183 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2184 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2185 coding->require_flushing = 1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2186 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2187

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2188 case 3:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2189 coding->type = coding_type_big5;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2190 coding->flags

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2191 = (NILP (XVECTOR (coding_system_vector)->contents[4])

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2192 ? CODING_FLAG_BIG5_HKU

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2193 : CODING_FLAG_BIG5_ETEN);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2194 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2195

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2196 case 4:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2197 coding->type = coding_type_ccl;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2198 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2199 Lisp_Object val = XVECTOR (coding_system_vector)->contents[4];

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2200 if (CONSP (val)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2201 && VECTORP (XCONS (val)->car)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2202 && VECTORP (XCONS (val)->cdr))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2203 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2204 setup_ccl_program (&(coding->spec.ccl.decoder), XCONS (val)->car);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2205 setup_ccl_program (&(coding->spec.ccl.encoder), XCONS (val)->cdr);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2206 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2207 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2208 goto label_invalid_coding_system;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2209 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2210 coding->require_flushing = 1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2211 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2212

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2213 default:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2214 if (EQ (type, Qt))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2215 coding->type = coding_type_automatic;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2216 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2217 coding->type = coding_type_no_conversion;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2218 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2219 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2220 return 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2221

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2222 label_invalid_coding_system:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2223 coding->type = coding_type_no_conversion;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2224 return -1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2225 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2226

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2227 /* Emacs has a mechanism to automatically detect a coding system if it

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2228 is one of Emacs' internal format, ISO2022, SJIS, and BIG5. But,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2229 it's impossible to distinguish some coding systems accurately

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2230 because they use the same range of codes. So, at first, coding

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2231 systems are categorized into 7, those are:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2232

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2233 o coding-category-internal

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2234

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2235 The category for a coding system which has the same code range

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2236 as Emacs' internal format. Assigned the coding-system (Lisp

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2237 symbol) `coding-system-internal' by default.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2238

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2239 o coding-category-sjis

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2240

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2241 The category for a coding system which has the same code range

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2242 as SJIS. Assigned the coding-system (Lisp

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2243 symbol) `coding-system-sjis' by default.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2244

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2245 o coding-category-iso-7

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2246

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2247 The category for a coding system which has the same code range

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2248 as ISO2022 of 7-bit environment. Assigned the coding-system

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2249 (Lisp symbol) `coding-system-junet' by default.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2250

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2251 o coding-category-iso-8-1

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2252

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2253 The category for a coding system which has the same code range

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2254 as ISO2022 of 8-bit environment and graphic plane 1 used only

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2255 for DIMENSION1 charset. Assigned the coding-system (Lisp

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2256 symbol) `coding-system-ctext' by default.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2257

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2258 o coding-category-iso-8-2

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2259

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2260 The category for a coding system which has the same code range

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2261 as ISO2022 of 8-bit environment and graphic plane 1 used only

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2262 for DIMENSION2 charset. Assigned the coding-system (Lisp

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2263 symbol) `coding-system-euc-japan' by default.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2264

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2265 o coding-category-iso-else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2266

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2267 The category for a coding system which has the same code range

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2268 as ISO2022 but not belongs to any of the above three

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2269 categories. Assigned the coding-system (Lisp symbol)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2270 `coding-system-iso-2022-ss2-7' by default.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2271

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2272 o coding-category-big5

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2273

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2274 The category for a coding system which has the same code range

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2275 as BIG5. Assigned the coding-system (Lisp symbol)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2276 `coding-system-big5' by default.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2277

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2278 o coding-category-binary

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2279

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2280 The category for a coding system not categorized in any of the

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2281 above. Assigned the coding-system (Lisp symbol)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2282 `coding-system-noconv' by default.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2283

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2284 Each of them is a Lisp symbol and the value is an actual

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2285 `coding-system's (this is also a Lisp symbol) assigned by a user.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2286 What Emacs does actually is to detect a category of coding system.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2287 Then, it uses a `coding-system' assigned to it. If Emacs can't

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2288 decide only one possible category, it selects a category of the

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2289 highest priority. Priorities of categories are also specified by a

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2290 user in a Lisp variable `coding-category-list'.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2291

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2292 */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2293

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2294 /* Detect how a text of length SRC_BYTES pointed by SRC is encoded.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2295 If it detects possible coding systems, return an integer in which

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2296 appropriate flag bits are set. Flag bits are defined by macros

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2297 CODING_CATEGORY_MASK_XXX in `coding.h'. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2298

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2299 int

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2300 detect_coding_mask (src, src_bytes)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2301 unsigned char *src;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2302 int src_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2303 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2304 register unsigned char c;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2305 unsigned char *src_end = src + src_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2306 int mask;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2307

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2308 /* At first, skip all ASCII characters and control characters except

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2309 for three ISO2022 specific control characters. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2310 while (src < src_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2311 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2312 c = *src;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2313 if (c >= 0x80

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2314 || (c == ISO_CODE_ESC || c == ISO_CODE_SI || c == ISO_CODE_SO))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2315 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2316 src++;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2317 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2318

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2319 if (src >= src_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2320 /* We found nothing other than ASCII. There's nothing to do. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2321 return CODING_CATEGORY_MASK_ANY;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2322

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2323 /* The text seems to be encoded in some multilingual coding system.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2324 Now, try to find in which coding system the text is encoded. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2325 if (c < 0x80)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2326 /* i.e. (c == ISO_CODE_ESC || c == ISO_CODE_SI || c == ISO_CODE_SO) */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2327 /* C is an ISO2022 specific control code of C0. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2328 mask = detect_coding_iso2022 (src, src_end);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2329

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2330 else if (c == ISO_CODE_SS2 || c == ISO_CODE_SS3 || c == ISO_CODE_CSI)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2331 /* C is an ISO2022 specific control code of C1,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2332 or the first byte of SJIS's 2-byte character code,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2333 or a leading code of Emacs. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2334 mask = (detect_coding_iso2022 (src, src_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2335 | detect_coding_sjis (src, src_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2336 | detect_coding_internal (src, src_end));

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2337

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2338 else if (c < 0xA0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2339 /* C is the first byte of SJIS character code,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2340 or a leading-code of Emacs. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2341 mask = (detect_coding_sjis (src, src_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2342 | detect_coding_internal (src, src_end));

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2343

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2344 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2345 /* C is a character of ISO2022 in graphic plane right,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2346 or a SJIS's 1-byte character code (i.e. JISX0201),

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2347 or the first byte of BIG5's 2-byte code. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2348 mask = (detect_coding_iso2022 (src, src_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2349 | detect_coding_sjis (src, src_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2350 | detect_coding_big5 (src, src_end));

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2351

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2352 return mask;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2353 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2354

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2355 /* Detect how a text of length SRC_BYTES pointed by SRC is encoded.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2356 The information of the detected coding system is set in CODING. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2357

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2358 void

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2359 detect_coding (coding, src, src_bytes)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2360 struct coding_system *coding;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2361 unsigned char *src;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2362 int src_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2363 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2364 int mask = detect_coding_mask (src, src_bytes);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2365 int idx;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2366

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2367 if (mask == CODING_CATEGORY_MASK_ANY)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2368 /* We found nothing other than ASCII. There's nothing to do. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2369 return;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2370

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2371 if (!mask)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2372 /* The source text seems to be encoded in unknown coding system.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2373 Emacs regards the category of such a kind of coding system as

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2374 `coding-category-binary'. We assume that a user has assigned

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2375 an appropriate coding system for a `coding-category-binary'. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2376 idx = CODING_CATEGORY_IDX_BINARY;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2377 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2378 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2379 /* We found some plausible coding systems. Let's use a coding

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2380 system of the highest priority. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2381 Lisp_Object val = Vcoding_category_list;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2382

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2383 if (CONSP (val))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2384 while (!NILP (val))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2385 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2386 idx = XFASTINT (Fget (XCONS (val)->car, Qcoding_category_index));

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2387 if ((idx < CODING_CATEGORY_IDX_MAX) && (mask & (1 << idx)))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2388 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2389 val = XCONS (val)->cdr;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2390 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2391 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2392 val = Qnil;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2393

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2394 if (NILP (val))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2395 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2396 /* For unknown reason, `Vcoding_category_list' contains none

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2397 of found categories. Let's use any of them. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2398 for (idx = 0; idx < CODING_CATEGORY_IDX_MAX; idx++)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2399 if (mask & (1 << idx))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2400 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2401 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2402 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2403 setup_coding_system (XSYMBOL (coding_category_table[idx])->value, coding);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2404 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2405

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2406 /* Detect how end-of-line of a text of length SRC_BYTES pointed by SRC

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2407 is encoded. Return one of CODING_EOL_LF, CODING_EOL_CRLF,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2408 CODING_EOL_CR, and CODING_EOL_AUTOMATIC. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2409

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2410 int

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2411 detect_eol_type (src, src_bytes)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2412 unsigned char *src;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2413 int src_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2414 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2415 unsigned char *src_end = src + src_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2416 unsigned char c;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2417

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2418 while (src < src_end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2419 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2420 c = *src++;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2421 if (c == '\n')

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2422 return CODING_EOL_LF;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2423 else if (c == '\r')

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2424 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2425 if (src < src_end && *src == '\n')

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2426 return CODING_EOL_CRLF;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2427 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2428 return CODING_EOL_CR;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2429 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2430 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2431 return CODING_EOL_AUTOMATIC;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2432 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2433

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2434 /* Detect how end-of-line of a text of length SRC_BYTES pointed by SRC

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2435 is encoded. If it detects an appropriate format of end-of-line, it

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2436 sets the information in *CODING. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2437

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2438 void

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2439 detect_eol (coding, src, src_bytes)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2440 struct coding_system *coding;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2441 unsigned char *src;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2442 int src_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2443 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2444 Lisp_Object val;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2445 int eol_type = detect_eol_type (src, src_bytes);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2446

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2447 if (eol_type == CODING_EOL_AUTOMATIC)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2448 /* We found no end-of-line in the source text. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2449 return;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2450

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2451 val = Fget (coding->symbol, Qeol_type);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2452 if (VECTORP (val) && XVECTOR (val)->size == 3)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2453 setup_coding_system (XVECTOR (val)->contents[eol_type], coding);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2454 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2455

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2456 /* See "GENERAL NOTES about `decode_coding_XXX ()' functions". Before

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2457 decoding, it may detect coding system and format of end-of-line if

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2458 those are not yet decided. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2459

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2460 int

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2461 decode_coding (coding, source, destination, src_bytes, dst_bytes, consumed)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2462 struct coding_system *coding;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2463 unsigned char *source, *destination;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2464 int src_bytes, dst_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2465 int *consumed;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2466 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2467 int produced;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2468

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2469 if (src_bytes <= 0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2470 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2471 *consumed = 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2472 return 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2473 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2474

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2475 if (coding->type == coding_type_automatic)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2476 detect_coding (coding, source, src_bytes);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2477

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2478 if (coding->eol_type == CODING_EOL_AUTOMATIC)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2479 detect_eol (coding, source, src_bytes);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2480

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2481 coding->carryover_size = 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2482 switch (coding->type)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2483 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2484 case coding_type_no_conversion:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2485 label_no_conversion:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2486 produced = (src_bytes > dst_bytes) ? dst_bytes : src_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2487 bcopy (source, destination, produced);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2488 *consumed = produced;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2489 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2490

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2491 case coding_type_internal:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2492 case coding_type_automatic:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2493 if (coding->eol_type == CODING_EOL_LF

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2494 || coding->eol_type == CODING_EOL_AUTOMATIC)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2495 goto label_no_conversion;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2496 produced = decode_eol (coding, source, destination,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2497 src_bytes, dst_bytes, consumed);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2498 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2499

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2500 case coding_type_sjis:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2501 produced = decode_coding_sjis_big5 (coding, source, destination,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2502 src_bytes, dst_bytes, consumed,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2503 1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2504 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2505

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2506 case coding_type_iso2022:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2507 produced = decode_coding_iso2022 (coding, source, destination,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2508 src_bytes, dst_bytes, consumed);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2509 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2510

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2511 case coding_type_big5:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2512 produced = decode_coding_sjis_big5 (coding, source, destination,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2513 src_bytes, dst_bytes, consumed,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2514 0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2515 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2516

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2517 case coding_type_ccl:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2518 produced = ccl_driver (&coding->spec.ccl.decoder, source, destination,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2519 src_bytes, dst_bytes, consumed);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2520 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2521 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2522

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2523 return produced;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2524 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2525

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2526 /* See "GENERAL NOTES about `encode_coding_XXX ()' functions". */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2527

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2528 int

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2529 encode_coding (coding, source, destination, src_bytes, dst_bytes, consumed)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2530 struct coding_system *coding;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2531 unsigned char *source, *destination;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2532 int src_bytes, dst_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2533 int *consumed;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2534 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2535 int produced;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2536

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2537 coding->carryover_size = 0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2538 switch (coding->type)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2539 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2540 case coding_type_no_conversion:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2541 label_no_conversion:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2542 produced = (src_bytes > dst_bytes) ? dst_bytes : src_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2543 if (produced > 0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2544 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2545 bcopy (source, destination, produced);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2546 if (coding->selective)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2547 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2548 unsigned char *p = destination, *pend = destination + produced;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2549 while (p < pend)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2550 if (*p++ = '\015') p[-1] = '\n';

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2551 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2552 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2553 *consumed = produced;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2554 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2555

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2556 case coding_type_internal:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2557 case coding_type_automatic:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2558 if (coding->eol_type == CODING_EOL_LF

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2559 || coding->eol_type == CODING_EOL_AUTOMATIC)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2560 goto label_no_conversion;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2561 produced = encode_eol (coding, source, destination,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2562 src_bytes, dst_bytes, consumed);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2563 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2564

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2565 case coding_type_sjis:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2566 produced = encode_coding_sjis_big5 (coding, source, destination,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2567 src_bytes, dst_bytes, consumed,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2568 1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2569 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2570

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2571 case coding_type_iso2022:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2572 produced = encode_coding_iso2022 (coding, source, destination,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2573 src_bytes, dst_bytes, consumed);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2574 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2575

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2576 case coding_type_big5:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2577 produced = encode_coding_sjis_big5 (coding, source, destination,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2578 src_bytes, dst_bytes, consumed,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2579 0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2580 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2581

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2582 case coding_type_ccl:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2583 produced = ccl_driver (&coding->spec.ccl.encoder, source, destination,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2584 src_bytes, dst_bytes, consumed);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2585 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2586 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2587

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2588 return produced;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2589 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2590

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2591 #define CONVERSION_BUFFER_EXTRA_ROOM 256

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2592

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2593 /* Return maximum size (bytes) of a buffer enough for decoding

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2594 SRC_BYTES of text encoded in CODING. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2595

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2596 int

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2597 decoding_buffer_size (coding, src_bytes)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2598 struct coding_system *coding;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2599 int src_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2600 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2601 int magnification;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2602

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2603 if (coding->type == coding_type_iso2022)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2604 magnification = 3;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2605 else if (coding->type == coding_type_ccl)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2606 magnification = coding->spec.ccl.decoder.buf_magnification;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2607 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2608 magnification = 2;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2609

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2610 return (src_bytes * magnification + CONVERSION_BUFFER_EXTRA_ROOM);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2611 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2612

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2613 /* Return maximum size (bytes) of a buffer enough for encoding

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2614 SRC_BYTES of text to CODING. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2615

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2616 int

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2617 encoding_buffer_size (coding, src_bytes)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2618 struct coding_system *coding;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2619 int src_bytes;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2620 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2621 int magnification;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2622

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2623 if (coding->type == coding_type_ccl)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2624 magnification = coding->spec.ccl.encoder.buf_magnification;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2625 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2626 magnification = 3;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2627

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2628 return (src_bytes * magnification + CONVERSION_BUFFER_EXTRA_ROOM);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2629 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2630

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2631 #ifndef MINIMUM_CONVERSION_BUFFER_SIZE

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2632 #define MINIMUM_CONVERSION_BUFFER_SIZE 1024

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2633 #endif

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2634

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2635 char *conversion_buffer;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2636 int conversion_buffer_size;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2637

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2638 /* Return a pointer to a SIZE bytes of buffer to be used for encoding

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2639 or decoding. Sufficient memory is allocated automatically. If we

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2640 run out of memory, return NULL. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2641

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2642 char *

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2643 get_conversion_buffer (size)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2644 int size;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2645 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2646 if (size > conversion_buffer_size)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2647 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2648 char *buf;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2649 int real_size = conversion_buffer_size * 2;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2650

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2651 while (real_size < size) real_size *= 2;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2652 buf = (char *) xmalloc (real_size);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2653 xfree (conversion_buffer);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2654 conversion_buffer = buf;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2655 conversion_buffer_size = real_size;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2656 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2657 return conversion_buffer;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2658 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2659

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2660

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2661 #ifdef emacs

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2662 /*** 7. Emacs Lisp library functions ***/

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2663

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2664 DEFUN ("coding-system-vector", Fcoding_system_vector, Scoding_system_vector,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2665 1, 1, 0,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2666 "Return coding-vector of CODING-SYSTEM.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2667 If CODING-SYSTEM is not a valid coding-system, return nil.")

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2668 (obj)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2669 Lisp_Object obj;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2670 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2671 while (SYMBOLP (obj) && !NILP (obj))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2672 obj = Fget (obj, Qcoding_system);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2673 return ((NILP (obj) || !VECTORP (obj) || XVECTOR (obj)->size != 5)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2674 ? Qnil : obj);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2675 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2676

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2677 DEFUN ("coding-system-p", Fcoding_system_p, Scoding_system_p, 1, 1, 0,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2678 "Return t if OBJECT is nil or a coding-system.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2679 See document of make-coding-system for coding-system object.")

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2680 (obj)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2681 Lisp_Object obj;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2682 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2683 return ((NILP (obj) || !NILP (Fcoding_system_vector (obj))) ? Qt : Qnil);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2684 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2685

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2686 DEFUN ("read-non-nil-coding-system",

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2687 Fread_non_nil_coding_system, Sread_non_nil_coding_system, 1, 1, 0,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2688 "Read a coding-system from the minibuffer, prompting with string PROMPT.")

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2689 (prompt)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2690 Lisp_Object prompt;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2691 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2692 return Fintern (Fcompleting_read (prompt, Vobarray, Qcoding_system_vector,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2693 Qt, Qnil, Qnil),

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2694 Qnil);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2695 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2696

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2697 DEFUN ("read-coding-system", Fread_coding_system, Sread_coding_system, 1, 1, 0,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2698 "Read a coding-system or nil from the minibuffer, prompting with string PROMPT.")

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2699 (prompt)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2700 Lisp_Object prompt;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2701 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2702 return Fintern (Fcompleting_read (prompt, Vobarray, Qcoding_system_p,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2703 Qt, Qnil, Qnil),

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2704 Qnil);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2705 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2706

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2707 DEFUN ("check-coding-system", Fcheck_coding_system, Scheck_coding_system,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2708 1, 1, 0,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2709 "Check validity of CODING-SYSTEM.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2710 If valid, return CODING-SYSTEM, else `coding-system-error' is signaled.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2711 CODING-SYSTEM is valid if it is a symbol and has \"coding-system\" property.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2712 The value of property should be a vector of length 5.")

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2713 (coding_system)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2714 Lisp_Object coding_system;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2715 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2716 CHECK_SYMBOL (coding_system, 0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2717 if (!NILP (Fcoding_system_p (coding_system)))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2718 return coding_system;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2719 while (1)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2720 Fsignal (Qcoding_system_error, coding_system);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2721 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2722

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2723 DEFUN ("detect-coding-region", Fdetect_coding_region, Sdetect_coding_region,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2724 2, 2, 0,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2725 "Detect coding-system of the text in the region between START and END.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2726 Return a list of possible coding-systems ordered by priority.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2727 If only ASCII characters are found, it returns `coding-system-automatic'\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2728 or its subsidiary coding-system according to a detected end-of-line format.")

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2729 (b, e)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2730 Lisp_Object b, e;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2731 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2732 int coding_mask, eol_type;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2733 Lisp_Object val;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2734 int beg, end;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2735

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2736 validate_region (&b, &e);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2737 beg = XINT (b), end = XINT (e);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2738 if (beg < GPT && end >= GPT) move_gap (end);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2739

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2740 coding_mask = detect_coding_mask (POS_ADDR (beg), end - beg);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2741 eol_type = detect_eol_type (POS_ADDR (beg), end - beg);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2742

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2743 if (coding_mask == CODING_CATEGORY_MASK_ANY)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2744 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2745 val = intern ("coding-system-automatic");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2746 if (eol_type != CODING_EOL_AUTOMATIC)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2747 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2748 Lisp_Object val2 = Fget (val, Qeol_type);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2749 if (VECTORP (val2))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2750 val = XVECTOR (val2)->contents[eol_type];

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2751 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2752 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2753 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2754 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2755 Lisp_Object val2;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2756

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2757 /* At first, gather possible coding-systems in VAL in a reverse

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2758 order. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2759 val = Qnil;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2760 for (val2 = Vcoding_category_list;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2761 !NILP (val2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2762 val2 = XCONS (val2)->cdr)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2763 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2764 int idx

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2765 = XFASTINT (Fget (XCONS (val2)->car, Qcoding_category_index));

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2766 if (coding_mask & (1 << idx))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2767 val = Fcons (Fsymbol_value (XCONS (val2)->car), val);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2768 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2769

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2770 /* Then, change the order of the list, while getting subsidiary

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2771 coding-systems. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2772 val2 = val;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2773 val = Qnil;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2774 for (; !NILP (val2); val2 = XCONS (val2)->cdr)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2775 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2776 if (eol_type == CODING_EOL_AUTOMATIC)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2777 val = Fcons (XCONS (val2)->car, val);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2778 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2779 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2780 Lisp_Object val3 = Fget (XCONS (val2)->car, Qeol_type);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2781 if (VECTORP (val3))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2782 val = Fcons (XVECTOR (val3)->contents[eol_type], val);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2783 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2784 val = Fcons (XCONS (val2)->car, val);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2785 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2786 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2787 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2788

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2789 return val;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2790 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2791

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2792 /* Scan text in the region between *BEGP and *ENDP, skip characters

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2793 which we never have to encode to (iff ENCODEP is 1) or decode from

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2794 coding system CODING at the head and tail, then set BEGP and ENDP

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2795 to the addresses of start and end of the text we actually convert. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2796

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2797 void

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2798 shrink_conversion_area (begp, endp, coding, encodep)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2799 unsigned char **begp, **endp;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2800 struct coding_system *coding;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2801 int encodep;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2802 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2803 register unsigned char *beg_addr = *begp, *end_addr = *endp;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2804

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2805 if (coding->eol_type != CODING_EOL_LF

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2806 && coding->eol_type != CODING_EOL_AUTOMATIC)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2807 /* Since we anyway have to convert end-of-line format, it is not

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2808 worth skipping at most 100 bytes or so. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2809 return;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2810

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2811 if (encodep) /* for encoding */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2812 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2813 switch (coding->type)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2814 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2815 case coding_type_no_conversion:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2816 case coding_type_internal:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2817 case coding_type_automatic:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2818 /* We need no conversion. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2819 *begp = *endp;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2820 return;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2821 case coding_type_ccl:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2822 /* We can't skip any data. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2823 return;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2824 default:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2825 /* We can skip all ASCII characters at the head and tail. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2826 while (beg_addr < end_addr && *beg_addr < 0x80) beg_addr++;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2827 while (beg_addr < end_addr && *(end_addr - 1) < 0x80) end_addr--;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2828 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2829 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2830 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2831 else /* for decoding */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2832 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2833 switch (coding->type)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2834 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2835 case coding_type_no_conversion:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2836 /* We need no conversion. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2837 *begp = *endp;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2838 return;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2839 case coding_type_internal:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2840 if (coding->eol_type == CODING_EOL_LF)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2841 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2842 /* We need no conversion. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2843 *begp = *endp;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2844 return;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2845 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2846 /* We can skip all but carriage-return. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2847 while (beg_addr < end_addr && *beg_addr != '\r') beg_addr++;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2848 while (beg_addr < end_addr && *(end_addr - 1) != '\r') end_addr--;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2849 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2850 case coding_type_sjis:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2851 case coding_type_big5:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2852 /* We can skip all ASCII characters at the head. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2853 while (beg_addr < end_addr && *beg_addr < 0x80) beg_addr++;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2854 /* We can skip all ASCII characters at the tail except for

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2855 the second byte of SJIS or BIG5 code. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2856 while (beg_addr < end_addr && *(end_addr - 1) < 0x80) end_addr--;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2857 if (end_addr != *endp)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2858 end_addr++;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2859 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2860 case coding_type_ccl:

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2861 /* We can't skip any data. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2862 return;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2863 default: /* i.e. case coding_type_iso2022: */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2864 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2865 unsigned char c;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2866

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2867 /* We can skip all ASCII characters except for a few

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2868 control codes at the head. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2869 while (beg_addr < end_addr && (c = *beg_addr) < 0x80

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2870 && c != ISO_CODE_CR && c != ISO_CODE_SO

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2871 && c != ISO_CODE_SI && c != ISO_CODE_ESC)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2872 beg_addr++;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2873 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2874 break;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2875 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2876 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2877 *begp = beg_addr;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2878 *endp = end_addr;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2879 return;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2880 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2881

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2882 /* Encode to (iff ENCODEP is 1) or decode form coding system CODING a

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2883 text between B and E. B and E are buffer position. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2884

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2885 Lisp_Object

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2886 code_convert_region (b, e, coding, encodep)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2887 Lisp_Object b, e;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2888 struct coding_system *coding;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2889 int encodep;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2890 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2891 int beg, end, len, consumed, produced;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2892 char *buf;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2893 unsigned char *begp, *endp;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2894 int pos = PT;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2895

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2896 validate_region (&b, &e);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2897 beg = XINT (b), end = XINT (e);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2898 if (beg < GPT && end >= GPT)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2899 move_gap (end);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2900

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2901 if (encodep && !NILP (coding->pre_write_conversion))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2902 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2903 /* We must call a pre-conversion function which may put a new

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2904 text to be converted in a new buffer. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2905 struct buffer *old = current_buffer, *new;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2906

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2907 TEMP_SET_PT (beg);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2908 call2 (coding->pre_write_conversion, b, e);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2909 if (old != current_buffer)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2910 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2911 /* Replace the original text by the text just generated. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2912 len = ZV - BEGV;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2913 new = current_buffer;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2914 set_buffer_internal (old);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2915 del_range (beg, end);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2916 insert_from_buffer (new, 1, len, 0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2917 end = beg + len;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2918 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2919 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2920

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2921 /* We may be able to shrink the conversion region. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2922 begp = POS_ADDR (beg); endp = begp + (end - beg);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2923 shrink_conversion_area (&begp, &endp, coding, encodep);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2924

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2925 if (begp == endp)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2926 /* We need no conversion. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2927 len = end - beg;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2928 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2929 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2930 beg += begp - POS_ADDR (beg);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2931 end = beg + (endp - begp);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2932

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2933 if (encodep)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2934 len = encoding_buffer_size (coding, end - beg);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2935 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2936 len = decoding_buffer_size (coding, end - beg);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2937 buf = get_conversion_buffer (len);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2938

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2939 coding->last_block = 1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2940 produced = (encodep

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2941 ? encode_coding (coding, POS_ADDR (beg), buf, end - beg, len,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2942 &consumed)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2943 : decode_coding (coding, POS_ADDR (beg), buf, end - beg, len,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2944 &consumed));

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2945

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2946 len = produced + (beg - XINT (b)) + (XINT (e) - end);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2947

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2948 TEMP_SET_PT (beg);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2949 insert (buf, produced);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2950 del_range (PT, PT + end - beg);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2951 if (pos >= end)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2952 pos = PT + (pos - end);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2953 else if (pos > beg)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2954 pos = beg;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2955 TEMP_SET_PT (pos);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2956 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2957

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2958 if (!encodep && !NILP (coding->post_read_conversion))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2959 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2960 /* We must call a post-conversion function which may alter

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2961 the text just converted. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2962 Lisp_Object insval;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2963

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2964 beg = XINT (b);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2965 TEMP_SET_PT (beg);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2966 insval = call1 (coding->post_read_conversion, make_number (len));

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2967 CHECK_NUMBER (insval, 0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2968 len = XINT (insval);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2969 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2970

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2971 return make_number (len);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2972 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2973

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2974 Lisp_Object

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2975 code_convert_string (str, coding, encodep)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2976 Lisp_Object str;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2977 struct coding_system *coding;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2978 int encodep;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2979 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2980 int len, consumed, produced;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2981 char *buf;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2982 unsigned char *begp, *endp;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2983 int head_skip, tail_skip;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2984 struct gcpro gcpro1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2985

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2986 if (encodep && !NILP (coding->pre_write_conversion)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2987 || !encodep && !NILP (coding->post_read_conversion))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2988 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2989 /* Since we have to call Lisp functions which assume target text

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2990 is in a buffer, after setting a temporary buffer, call

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2991 code_convert_region. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2992 int count = specpdl_ptr - specpdl;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2993 int len = XSTRING (str)->size;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2994 Lisp_Object result;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2995 struct buffer *old = current_buffer;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2996

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2997 record_unwind_protect (Fset_buffer, Fcurrent_buffer ());

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2998 temp_output_buffer_setup (" *code-converting-work*");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

2999 set_buffer_internal (XBUFFER (Vstandard_output));

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3000 insert_from_string (str, 0, len, 0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3001 code_convert_region (make_number (BEGV), make_number (ZV),

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3002 coding, encodep);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3003 result = make_buffer_string (BEGV, ZV, 0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3004 set_buffer_internal (old);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3005 return unbind_to (count, result);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3006 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3007

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3008 /* We may be able to shrink the conversion region. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3009 begp = XSTRING (str)->data;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3010 endp = begp + XSTRING (str)->size;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3011 shrink_conversion_area (&begp, &endp, coding, encodep);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3012

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3013 if (begp == endp)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3014 /* We need no conversion. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3015 return str;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3016

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3017 head_skip = begp - XSTRING (str)->data;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3018 tail_skip = XSTRING (str)->size - head_skip - (endp - begp);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3019

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3020 GCPRO1 (str);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3021

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3022 if (encodep)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3023 len = encoding_buffer_size (coding, endp - begp);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3024 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3025 len = decoding_buffer_size (coding, endp - begp);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3026 buf = get_conversion_buffer (len + head_skip + tail_skip);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3027

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3028 bcopy (XSTRING (str)->data, buf, head_skip);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3029 coding->last_block = 1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3030 produced = (encodep

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3031 ? encode_coding (coding, XSTRING (str)->data + head_skip,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3032 buf + head_skip, endp - begp, len, &consumed)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3033 : decode_coding (coding, XSTRING (str)->data + head_skip,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3034 buf + head_skip, endp - begp, len, &consumed));

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3035 bcopy (XSTRING (str)->data + head_skip + (endp - begp),

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3036 buf + head_skip + produced,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3037 tail_skip);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3038

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3039 UNGCPRO;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3040

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3041 return make_string (buf, head_skip + produced + tail_skip);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3042 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3043

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3044 DEFUN ("decode-coding-region", Fdecode_coding_region, Sdecode_coding_region,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3045 3, 3, 0,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3046 "Decode the text between START and END which is encoded in CODING-SYSTEM.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3047 Return length of decoded text.")

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3048 (b, e, coding_system)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3049 Lisp_Object b, e, coding_system;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3050 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3051 struct coding_system coding;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3052

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3053 CHECK_NUMBER_COERCE_MARKER (b, 0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3054 CHECK_NUMBER_COERCE_MARKER (e, 1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3055 CHECK_SYMBOL (coding_system, 2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3056

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3057 if (setup_coding_system (Fcheck_coding_system (coding_system), &coding) < 0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3058 error ("Invalid coding-system: %s", XSYMBOL (coding_system)->name->data);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3059

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3060 return code_convert_region (b, e, &coding, 0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3061 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3062

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3063 DEFUN ("encode-coding-region", Fencode_coding_region, Sencode_coding_region,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3064 3, 3, 0,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3065 "Encode the text between START and END to CODING-SYSTEM.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3066 Return length of encoded text.")

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3067 (b, e, coding_system)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3068 Lisp_Object b, e, coding_system;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3069 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3070 struct coding_system coding;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3071

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3072 CHECK_NUMBER_COERCE_MARKER (b, 0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3073 CHECK_NUMBER_COERCE_MARKER (e, 1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3074 CHECK_SYMBOL (coding_system, 2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3075

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3076 if (setup_coding_system (Fcheck_coding_system (coding_system), &coding) < 0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3077 error ("Invalid coding-system: %s", XSYMBOL (coding_system)->name->data);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3078

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3079 return code_convert_region (b, e, &coding, 1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3080 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3081

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3082 DEFUN ("decode-coding-string", Fdecode_coding_string, Sdecode_coding_string,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3083 2, 2, 0,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3084 "Decode STRING which is encoded in CODING-SYSTEM, and return the result.")

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3085 (string, coding_system)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3086 Lisp_Object string, coding_system;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3087 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3088 struct coding_system coding;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3089

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3090 CHECK_STRING (string, 0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3091 CHECK_SYMBOL (coding_system, 1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3092

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3093 if (setup_coding_system (Fcheck_coding_system (coding_system), &coding) < 0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3094 error ("Invalid coding-system: %s", XSYMBOL (coding_system)->name->data);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3095

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3096 return code_convert_string (string, &coding, 0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3097 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3098

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3099 DEFUN ("encode-coding-string", Fencode_coding_string, Sencode_coding_string,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3100 2, 2, 0,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3101 "Encode STRING to CODING-SYSTEM, and return the result.")

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3102 (string, coding_system)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3103 Lisp_Object string, coding_system;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3104 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3105 struct coding_system coding;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3106

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3107 CHECK_STRING (string, 0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3108 CHECK_SYMBOL (coding_system, 1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3109

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3110 if (setup_coding_system (Fcheck_coding_system (coding_system), &coding) < 0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3111 error ("Invalid coding-system: %s", XSYMBOL (coding_system)->name->data);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3112

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3113 return code_convert_string (string, &coding, 1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3114 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3115

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3116 DEFUN ("decode-sjis-char", Fdecode_sjis_char, Sdecode_sjis_char, 1, 1, 0,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3117 "Decode a JISX0208 character of SJIS coding-system-sjis.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3118 CODE is the character code in SJIS.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3119 Return the corresponding character.")

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3120 (code)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3121 Lisp_Object code;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3122 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3123 unsigned char c1, c2, s1, s2;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3124 Lisp_Object val;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3125

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3126 CHECK_NUMBER (code, 0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3127 s1 = (XFASTINT (code)) >> 8, s2 = (XFASTINT (code)) & 0xFF;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3128 DECODE_SJIS (s1, s2, c1, c2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3129 XSETFASTINT (val, MAKE_NON_ASCII_CHAR (charset_jisx0208, c1, c2));

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3130 return val;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3131 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3132

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3133 DEFUN ("encode-sjis-char", Fencode_sjis_char, Sencode_sjis_char, 1, 1, 0,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3134 "Encode a JISX0208 character CHAR to SJIS coding-system.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3135 Return the corresponding character code in SJIS.")

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3136 (ch)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3137 Lisp_Object ch;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3138 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3139 int charset;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3140 unsigned char c1, c2, s1, s2;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3141 Lisp_Object val;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3142

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3143 CHECK_NUMBER (ch, 0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3144 SPLIT_CHAR (XFASTINT (ch), charset, c1, c2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3145 if (charset == charset_jisx0208)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3146 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3147 ENCODE_SJIS (c1, c2, s1, s2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3148 XSETFASTINT (val, ((int)s1 << 8) | s2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3149 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3150 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3151 XSETFASTINT (val, 0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3152 return val;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3153 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3154

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3155 DEFUN ("decode-big5-char", Fdecode_big5_char, Sdecode_big5_char, 1, 1, 0,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3156 "Decode a Big5 character CODE of BIG5 coding-system.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3157 CODE is the character code in BIG5.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3158 Return the corresponding character.")

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3159 (code)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3160 Lisp_Object code;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3161 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3162 int charset;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3163 unsigned char b1, b2, c1, c2;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3164 Lisp_Object val;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3165

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3166 CHECK_NUMBER (code, 0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3167 b1 = (XFASTINT (code)) >> 8, b2 = (XFASTINT (code)) & 0xFF;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3168 DECODE_BIG5 (b1, b2, charset, c1, c2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3169 XSETFASTINT (val, MAKE_NON_ASCII_CHAR (charset, c1, c2));

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3170 return val;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3171 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3172

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3173 DEFUN ("encode-big5-char", Fencode_big5_char, Sencode_big5_char, 1, 1, 0,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3174 "Encode the Big5 character CHAR to BIG5 coding-system.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3175 Return the corresponding character code in Big5.")

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3176 (ch)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3177 Lisp_Object ch;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3178 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3179 int charset;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3180 unsigned char c1, c2, b1, b2;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3181 Lisp_Object val;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3182

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3183 CHECK_NUMBER (ch, 0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3184 SPLIT_CHAR (XFASTINT (ch), charset, c1, c2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3185 if (charset == charset_big5_1 || charset == charset_big5_2)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3186 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3187 ENCODE_BIG5 (charset, c1, c2, b1, b2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3188 XSETFASTINT (val, ((int)b1 << 8) | b2);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3189 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3190 else

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3191 XSETFASTINT (val, 0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3192 return val;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3193 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3194

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3195 DEFUN ("set-terminal-coding-system",

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3196 Fset_terminal_coding_system, Sset_terminal_coding_system, 1, 1,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3197 "zCoding-system for terminal display: ",

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3198 "Set coding-system of your terminal to CODING-SYSTEM.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3199 All outputs to terminal are encoded to this coding-system.")

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3200 (coding_system)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3201 Lisp_Object coding_system;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3202 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3203 CHECK_SYMBOL (coding_system, 0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3204 setup_coding_system (Fcheck_coding_system (coding_system), &terminal_coding);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3205 update_mode_lines++;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3206 if (!NILP (Finteractive_p ()))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3207 Fredraw_display ();

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3208 return Qnil;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3209 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3210

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3211 DEFUN ("terminal-coding-system",

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3212 Fterminal_coding_system, Sterminal_coding_system, 0, 0, 0,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3213 "Return coding-system of your terminal.")

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3214 ()

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3215 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3216 return terminal_coding.symbol;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3217 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3218

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3219 DEFUN ("set-keyboard-coding-system",

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3220 Fset_keyboard_coding_system, Sset_keyboard_coding_system, 1, 1,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3221 "zCoding-system for keyboard input: ",

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3222 "Set coding-system of what is sent from terminal keyboard to CODING-SYSTEM.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3223 All inputs from terminal are decoded from this coding-system.")

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3224 (coding_system)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3225 Lisp_Object coding_system;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3226 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3227 CHECK_SYMBOL (coding_system, 0);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3228 setup_coding_system (Fcheck_coding_system (coding_system), &keyboard_coding);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3229 return Qnil;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3230 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3231

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3232 DEFUN ("keyboard-coding-system",

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3233 Fkeyboard_coding_system, Skeyboard_coding_system, 0, 0, 0,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3234 "Return coding-system of what is sent from terminal keyboard.")

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3235 ()

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3236 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3237 return keyboard_coding.symbol;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3238 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3239

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3240

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3241 DEFUN ("find-coding-system", Ffind_coding_system, Sfind_coding_system,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3242 1, MANY, 0,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3243 "Return a cons of coding systems for I/O primitive OPERATION.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3244 Remaining arguments are for OPERATION.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3245 OPERATION is one of the following Emacs I/O primitives:\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3246 For file I/O, insert-file-contents or write-region.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3247 For process I/O, call-process, call-process-region, or start-process.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3248 For network I/O, open-network-stream.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3249 For each OPERATION, TARGET is selected from the arguments as below:\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3250 For file I/O, TARGET is a file name.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3251 For process I/O, TARGET is a process name.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3252 For network I/O, TARGET is a service name or a port number\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3253 \n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3254 The return value is a cons of coding systems for decoding and encoding\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3255 registered in nested alist `coding-system-alist' (which see) at a slot\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3256 corresponding to OPERATION and TARGET.

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3257 If a function symbol is at the slot, return a result of the function call.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3258 The function is called with one argument, a list of all the arguments.")

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3259 (nargs, args)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3260 int nargs;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3261 Lisp_Object *args;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3262 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3263 Lisp_Object operation, target_idx, target, val;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3264 register Lisp_Object chain;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3265

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3266 if (nargs < 2)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3267 error ("Too few arguments");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3268 operation = args[0];

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3269 if (!SYMBOLP (operation)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3270 || !INTEGERP (target_idx = Fget (operation, Qtarget_idx)))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3271 error ("Invalid first arguement");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3272 if (nargs < 1 + XINT (target_idx))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3273 error ("Too few arguments for operation: %s",

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3274 XSYMBOL (operation)->name->data);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3275 target = args[XINT (target_idx) + 1];

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3276 if (!(STRINGP (target)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3277 || (EQ (operation, Qopen_network_stream) && INTEGERP (target))))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3278 error ("Invalid %dth argument", XINT (target_idx) + 1);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3279

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3280 chain = Fassq (operation, Vcoding_system_alist);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3281 if (NILP (chain))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3282 return Qnil;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3283

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3284 for (chain = XCONS (chain)->cdr; CONSP (chain); chain = XCONS (chain)->cdr)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3285 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3286 Lisp_Object elt = XCONS (chain)->car;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3287

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3288 if (CONSP (elt)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3289 && ((STRINGP (target)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3290 && STRINGP (XCONS (elt)->car)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3291 && fast_string_match (XCONS (elt)->car, target) >= 0)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3292 || (INTEGERP (target) && EQ (target, XCONS (elt)->car))))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3293 return (CONSP (val = XCONS (elt)->cdr)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3294 ? val

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3295 : ((SYMBOLP (val) && Fboundp (val)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3296 ? call2 (val, Flist (nargs, args))

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3297 : Qnil)));

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3298 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3299 return Qnil;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3300 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3301

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3302 #endif /* emacs */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3303

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3304

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3305 /*** 8. Post-amble ***/

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3306

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3307 init_coding_once ()

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3308 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3309 int i;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3310

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3311 /* Emacs internal format specific initialize routine. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3312 for (i = 0; i <= 0x20; i++)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3313 emacs_code_class[i] = EMACS_control_code;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3314 emacs_code_class[0x0A] = EMACS_linefeed_code;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3315 emacs_code_class[0x0D] = EMACS_carriage_return_code;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3316 for (i = 0x21 ; i < 0x7F; i++)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3317 emacs_code_class[i] = EMACS_ascii_code;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3318 emacs_code_class[0x7F] = EMACS_control_code;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3319 emacs_code_class[0x80] = EMACS_leading_code_composition;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3320 for (i = 0x81; i < 0xFF; i++)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3321 emacs_code_class[i] = EMACS_invalid_code;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3322 emacs_code_class[LEADING_CODE_PRIVATE_11] = EMACS_leading_code_3;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3323 emacs_code_class[LEADING_CODE_PRIVATE_12] = EMACS_leading_code_3;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3324 emacs_code_class[LEADING_CODE_PRIVATE_21] = EMACS_leading_code_4;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3325 emacs_code_class[LEADING_CODE_PRIVATE_22] = EMACS_leading_code_4;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3326

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3327 /* ISO2022 specific initialize routine. */

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3328 for (i = 0; i < 0x20; i++)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3329 iso_code_class[i] = ISO_control_code;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3330 for (i = 0x21; i < 0x7F; i++)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3331 iso_code_class[i] = ISO_graphic_plane_0;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3332 for (i = 0x80; i < 0xA0; i++)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3333 iso_code_class[i] = ISO_control_code;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3334 for (i = 0xA1; i < 0xFF; i++)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3335 iso_code_class[i] = ISO_graphic_plane_1;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3336 iso_code_class[0x20] = iso_code_class[0x7F] = ISO_0x20_or_0x7F;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3337 iso_code_class[0xA0] = iso_code_class[0xFF] = ISO_0xA0_or_0xFF;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3338 iso_code_class[ISO_CODE_CR] = ISO_carriage_return;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3339 iso_code_class[ISO_CODE_SO] = ISO_shift_out;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3340 iso_code_class[ISO_CODE_SI] = ISO_shift_in;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3341 iso_code_class[ISO_CODE_SS2_7] = ISO_single_shift_2_7;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3342 iso_code_class[ISO_CODE_ESC] = ISO_escape;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3343 iso_code_class[ISO_CODE_SS2] = ISO_single_shift_2;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3344 iso_code_class[ISO_CODE_SS3] = ISO_single_shift_3;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3345 iso_code_class[ISO_CODE_CSI] = ISO_control_sequence_introducer;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3346

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3347 Qcoding_system = intern ("coding-system");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3348 staticpro (&Qcoding_system);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3349

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3350 Qeol_type = intern ("eol-type");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3351 staticpro (&Qeol_type);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3352

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3353 Qbuffer_file_coding_system = intern ("buffer-file-coding-system");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3354 staticpro (&Qbuffer_file_coding_system);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3355

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3356 Qpost_read_conversion = intern ("post-read-conversion");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3357 staticpro (&Qpost_read_conversion);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3358

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3359 Qpre_write_conversion = intern ("pre-write-conversion");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3360 staticpro (&Qpre_write_conversion);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3361

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3362 Qcoding_system_vector = intern ("coding-system-vector");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3363 staticpro (&Qcoding_system_vector);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3364

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3365 Qcoding_system_p = intern ("coding-system-p");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3366 staticpro (&Qcoding_system_p);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3367

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3368 Qcoding_system_error = intern ("coding-system-error");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3369 staticpro (&Qcoding_system_error);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3370

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3371 Fput (Qcoding_system_error, Qerror_conditions,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3372 Fcons (Qcoding_system_error, Fcons (Qerror, Qnil)));

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3373 Fput (Qcoding_system_error, Qerror_message,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3374 build_string ("Coding-system error"));

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3375

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3376 Qcoding_category_index = intern ("coding-category-index");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3377 staticpro (&Qcoding_category_index);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3378

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3379 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3380 int i;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3381 for (i = 0; i < CODING_CATEGORY_IDX_MAX; i++)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3382 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3383 coding_category_table[i] = intern (coding_category_name[i]);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3384 staticpro (&coding_category_table[i]);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3385 Fput (coding_category_table[i], Qcoding_category_index,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3386 make_number (i));

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3387 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3388 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3389

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3390 conversion_buffer_size = MINIMUM_CONVERSION_BUFFER_SIZE;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3391 conversion_buffer = (char *) xmalloc (MINIMUM_CONVERSION_BUFFER_SIZE);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3392

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3393 setup_coding_system (Qnil, &keyboard_coding);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3394 setup_coding_system (Qnil, &terminal_coding);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3395 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3396

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3397 #ifdef emacs

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3398

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3399 syms_of_coding ()

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3400 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3401 Qtarget_idx = intern ("target-idx");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3402 staticpro (&Qtarget_idx);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3403

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3404 Fput (Qinsert_file_contents, Qtarget_idx, make_number (0));

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3405 Fput (Qwrite_region, Qtarget_idx, make_number (2));

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3406

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3407 Qcall_process = intern ("call-process");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3408 staticpro (&Qcall_process);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3409 Fput (Qcall_process, Qtarget_idx, make_number (0));

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3410

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3411 Qcall_process_region = intern ("call-process-region");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3412 staticpro (&Qcall_process_region);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3413 Fput (Qcall_process_region, Qtarget_idx, make_number (2));

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3414

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3415 Qstart_process = intern ("start-process");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3416 staticpro (&Qstart_process);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3417 Fput (Qstart_process, Qtarget_idx, make_number (2));

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3418

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3419 Qopen_network_stream = intern ("open-network-stream");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3420 staticpro (&Qopen_network_stream);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3421 Fput (Qopen_network_stream, Qtarget_idx, make_number (3));

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3422

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3423 defsubr (&Scoding_system_vector);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3424 defsubr (&Scoding_system_p);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3425 defsubr (&Sread_coding_system);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3426 defsubr (&Sread_non_nil_coding_system);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3427 defsubr (&Scheck_coding_system);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3428 defsubr (&Sdetect_coding_region);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3429 defsubr (&Sdecode_coding_region);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3430 defsubr (&Sencode_coding_region);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3431 defsubr (&Sdecode_coding_string);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3432 defsubr (&Sencode_coding_string);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3433 defsubr (&Sdecode_sjis_char);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3434 defsubr (&Sencode_sjis_char);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3435 defsubr (&Sdecode_big5_char);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3436 defsubr (&Sencode_big5_char);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3437 defsubr (&Sset_terminal_coding_system);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3438 defsubr (&Sterminal_coding_system);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3439 defsubr (&Sset_keyboard_coding_system);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3440 defsubr (&Skeyboard_coding_system);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3441 defsubr (&Sfind_coding_system);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3442

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3443 DEFVAR_LISP ("coding-category-list", &Vcoding_category_list,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3444 "List of coding-categories (symbols) ordered by priority.");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3445 {

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3446 int i;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3447

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3448 Vcoding_category_list = Qnil;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3449 for (i = CODING_CATEGORY_IDX_MAX - 1; i >= 0; i--)

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3450 Vcoding_category_list

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3451 = Fcons (coding_category_table[i], Vcoding_category_list);

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3452 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3453

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3454 DEFVAR_LISP ("coding-system-for-read", &Vcoding_system_for_read,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3455 "A variable of internal use only.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3456 If the value is a coding system, it is used for decoding on read operation.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3457 If not, an appropriate element in `coding-system-alist' (which see) is used.");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3458 Vcoding_system_for_read = Qnil;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3459

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3460 DEFVAR_LISP ("coding-system-for-write", &Vcoding_system_for_write,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3461 "A variable of internal use only.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3462 If the value is a coding system, it is used for encoding on write operation.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3463 If not, an appropriate element in `coding-system-alist' (which see) is used.");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3464 Vcoding_system_for_write = Qnil;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3465

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3466 DEFVAR_LISP ("last-coding-system-used", &Vlast_coding_system_used,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3467 "Coding-system used in the latest file or process I/O.");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3468 Vlast_coding_system_used = Qnil;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3469

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3470 DEFVAR_LISP ("coding-system-alist", &Vcoding_system_alist,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3471 "Nested alist to decide a coding system for a specific I/O operation.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3472 The format is ((OPERATION . ((REGEXP . CODING-SYSTEMS) ...)) ...).\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3473

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3474 OPERATION is one of the following Emacs I/O primitives:\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3475 For file I/O, insert-file-contents and write-region.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3476 For process I/O, call-process, call-process-region, and start-process.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3477 For network I/O, open-network-stream.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3478 In addition, for process I/O, `process-argument' can be specified for\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3479 encoding arguments of the process.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3480 \n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3481 REGEXP is a regular expression matching a target of OPERATION, where\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3482 target is a file name for file I/O operations, a process name for\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3483 process I/O operations, or a service name for network I/O\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3484 operations. REGEXP might be a port number for network I/O operation.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3485 \n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3486 CODING-SYSTEMS is a cons of coding systems to encode and decode\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3487 character code on OPERATION, or a function symbol returning the cons.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3488 See the documentation of `find-coding-system' for more detail.");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3489 Vcoding_system_alist = Qnil;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3490

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3491 DEFVAR_INT ("eol-mnemonic-unix", &eol_mnemonic_unix,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3492 "Mnemonic character indicating UNIX-like end-of-line format (i.e. LF) .");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3493 eol_mnemonic_unix = '.';

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3494

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3495 DEFVAR_INT ("eol-mnemonic-dos", &eol_mnemonic_dos,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3496 "Mnemonic character indicating DOS-like end-of-line format (i.e. CRLF).");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3497 eol_mnemonic_dos = ':';

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3498

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3499 DEFVAR_INT ("eol-mnemonic-mac", &eol_mnemonic_mac,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3500 "Mnemonic character indicating MAC-like end-of-line format (i.e. CR).");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3501 eol_mnemonic_mac = '\'';

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3502

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3503 DEFVAR_INT ("eol-mnemonic-undecided", &eol_mnemonic_undecided,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3504 "Mnemonic character indicating end-of-line format is not yet decided.");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3505 eol_mnemonic_undecided = '-';

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3506

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3507 DEFVAR_LISP ("alternate-charset-table", &Valternate_charset_table,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3508 "Alist of charsets vs the alternate charsets.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3509 While decoding, if a charset (car part of an element) is found,\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3510 decode it as the alternate charset (cdr part of the element).");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3511 Valternate_charset_table = Qnil;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3512

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3513 DEFVAR_LISP ("charset-revision-table", &Vcharset_revision_alist,

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3514 "Alist of charsets vs revision numbers.\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3515 While encoding, if a charset (car part of an element) is found,\n\

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3516 designate it with the escape sequence identifing revision (cdr part of the element).");

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3517 Vcharset_revision_alist = Qnil;

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3518 }

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3519

d0d7b244b1d0 Initial revision

Karl Heuer <kwzh@gnu.org>

parents:

diff changeset

3520 #endif /* emacs */

Mercurial > emacs

annotate src/coding.c @ 17052:d0d7b244b1d0