pidgin.yaz: src/protocols/jabber/xmltok.c annotate

annotate src/protocols/jabber/xmltok.c @ 4245:cd84b0fd63fc

[gaim-migrate @ 4495] Now, shut up and leave me alone. committer: Tailor Script <tailor@pidgin.im>

author	Rob Flynn <gaim@robflynn.com>
date	Wed, 08 Jan 2003 05:52:17 +0000
parents	4e7cefc55971
children

rev	line source
2086 424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1 /*
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	2 The contents of this file are subject to the Mozilla Public License
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	3 Version 1.1 (the "License"); you may not use this file except in
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	4 compliance with the License. You may obtain a copy of the License at
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	5 http://www.mozilla.org/MPL/
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	6
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	7 Software distributed under the License is distributed on an "AS IS"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	8 basis, WITHOUT WARRANTY OF ANY KIND, either express or implied. See the
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	9 License for the specific language governing rights and limitations
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	10 under the License.
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	11
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	12 The Original Code is expat.
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	13
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	14 The Initial Developer of the Original Code is James Clark.
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	15 Portions created by James Clark are Copyright (C) 1998, 1999
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	16 James Clark. All Rights Reserved.
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	17
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	18 Contributor(s):
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	19
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	20 */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	21
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	22 #include "xmldef.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	23 #include "xmltok.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	24 #include "nametab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	25
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	26 #define VTABLE1 \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	27 { PREFIX(prologTok), PREFIX(contentTok), PREFIX(cdataSectionTok) }, \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	28 { PREFIX(attributeValueTok), PREFIX(entityValueTok) }, \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	29 PREFIX(sameName), \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	30 PREFIX(nameMatchesAscii), \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	31 PREFIX(nameLength), \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	32 PREFIX(skipS), \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	33 PREFIX(getAtts), \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	34 PREFIX(charRefNumber), \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	35 PREFIX(predefinedEntityName), \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	36 PREFIX(updatePosition), \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	37 PREFIX(isPublicId)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	38
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	39 #define VTABLE VTABLE1, PREFIX(toUtf8), PREFIX(toUtf16)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	40
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	41 #define UCS2_GET_NAMING(pages, hi, lo) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	42 (namingBitmap[(pages[hi] << 3) + ((lo) >> 5)] & (1 << ((lo) & 0x1F)))
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	43
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	44 /* A 2 byte UTF-8 representation splits the characters 11 bits
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	45 between the bottom 5 and 6 bits of the bytes.
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	46 We need 8 bits to index into pages, 3 bits to add to that index and
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	47 5 bits to generate the mask. */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	48 #define UTF8_GET_NAMING2(pages, byte) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	49 (namingBitmap[((pages)[(((byte)[0]) >> 2) & 7] << 3) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	50 + ((((byte)[0]) & 3) << 1) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	51 + ((((byte)[1]) >> 5) & 1)] \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	52 & (1 << (((byte)[1]) & 0x1F)))
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	53
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	54 /* A 3 byte UTF-8 representation splits the characters 16 bits
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	55 between the bottom 4, 6 and 6 bits of the bytes.
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	56 We need 8 bits to index into pages, 3 bits to add to that index and
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	57 5 bits to generate the mask. */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	58 #define UTF8_GET_NAMING3(pages, byte) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	59 (namingBitmap[((pages)[((((byte)[0]) & 0xF) << 4) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	60 + ((((byte)[1]) >> 2) & 0xF)] \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	61 << 3) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	62 + ((((byte)[1]) & 3) << 1) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	63 + ((((byte)[2]) >> 5) & 1)] \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	64 & (1 << (((byte)[2]) & 0x1F)))
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	65
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	66 #define UTF8_GET_NAMING(pages, p, n) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	67 ((n) == 2 \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	68 ? UTF8_GET_NAMING2(pages, (const unsigned char *)(p)) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	69 : ((n) == 3 \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	70 ? UTF8_GET_NAMING3(pages, (const unsigned char *)(p)) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	71 : 0))
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	72
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	73 #define UTF8_INVALID3(p) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	74 ((*p) == 0xED \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	75 ? (((p)[1] & 0x20) != 0) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	76 : ((*p) == 0xEF \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	77 ? ((p)[1] == 0xBF && ((p)[2] == 0xBF \|\| (p)[2] == 0xBE)) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	78 : 0))
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	79
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	80 #define UTF8_INVALID4(p) ((*p) == 0xF4 && ((p)[1] & 0x30) != 0)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	81
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	82 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	83 int isNever(const ENCODING enc, const char p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	84 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	85 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	86 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	87
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	88 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	89 int utf8_isName2(const ENCODING enc, const char p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	90 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	91 return UTF8_GET_NAMING2(namePages, (const unsigned char *)p);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	92 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	93
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	94 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	95 int utf8_isName3(const ENCODING enc, const char p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	96 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	97 return UTF8_GET_NAMING3(namePages, (const unsigned char *)p);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	98 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	99
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	100 #define utf8_isName4 isNever
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	101
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	102 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	103 int utf8_isNmstrt2(const ENCODING enc, const char p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	104 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	105 return UTF8_GET_NAMING2(nmstrtPages, (const unsigned char *)p);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	106 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	107
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	108 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	109 int utf8_isNmstrt3(const ENCODING enc, const char p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	110 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	111 return UTF8_GET_NAMING3(nmstrtPages, (const unsigned char *)p);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	112 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	113
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	114 #define utf8_isNmstrt4 isNever
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	115
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	116 #define utf8_isInvalid2 isNever
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	117
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	118 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	119 int utf8_isInvalid3(const ENCODING enc, const char p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	120 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	121 return UTF8_INVALID3((const unsigned char *)p);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	122 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	123
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	124 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	125 int utf8_isInvalid4(const ENCODING enc, const char p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	126 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	127 return UTF8_INVALID4((const unsigned char *)p);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	128 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	129
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	130 struct normal_encoding {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	131 ENCODING enc;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	132 unsigned char type[256];
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	133 #ifdef XML_MIN_SIZE
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	134 int (byteType)(const ENCODING , const char *);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	135 int (isNameMin)(const ENCODING , const char *);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	136 int (isNmstrtMin)(const ENCODING , const char *);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	137 int (byteToAscii)(const ENCODING , const char *);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	138 int (charMatches)(const ENCODING , const char *, int);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	139 #endif /* XML_MIN_SIZE */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	140 int (isName2)(const ENCODING , const char *);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	141 int (isName3)(const ENCODING , const char *);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	142 int (isName4)(const ENCODING , const char *);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	143 int (isNmstrt2)(const ENCODING , const char *);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	144 int (isNmstrt3)(const ENCODING , const char *);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	145 int (isNmstrt4)(const ENCODING , const char *);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	146 int (isInvalid2)(const ENCODING , const char *);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	147 int (isInvalid3)(const ENCODING , const char *);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	148 int (isInvalid4)(const ENCODING , const char *);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	149 };
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	150
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	151 #ifdef XML_MIN_SIZE
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	152
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	153 #define STANDARD_VTABLE(E) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	154 E ## byteType, \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	155 E ## isNameMin, \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	156 E ## isNmstrtMin, \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	157 E ## byteToAscii, \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	158 E ## charMatches,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	159
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	160 #else
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	161
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	162 #define STANDARD_VTABLE(E) /* as nothing */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	163
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	164 #endif
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	165
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	166 #define NORMAL_VTABLE(E) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	167 E ## isName2, \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	168 E ## isName3, \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	169 E ## isName4, \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	170 E ## isNmstrt2, \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	171 E ## isNmstrt3, \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	172 E ## isNmstrt4, \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	173 E ## isInvalid2, \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	174 E ## isInvalid3, \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	175 E ## isInvalid4
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	176
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	177 static int checkCharRefNumber(int);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	178
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	179 #include "xmltok_impl.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	180
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	181 #ifdef XML_MIN_SIZE
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	182 #define sb_isNameMin isNever
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	183 #define sb_isNmstrtMin isNever
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	184 #endif
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	185
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	186 #ifdef XML_MIN_SIZE
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	187 #define MINBPC(enc) ((enc)->minBytesPerChar)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	188 #else
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	189 /* minimum bytes per character */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	190 #define MINBPC(enc) 1
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	191 #endif
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	192
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	193 #define SB_BYTE_TYPE(enc, p) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	194 (((struct normal_encoding )(enc))->type[(unsigned char)(p)])
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	195
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	196 #ifdef XML_MIN_SIZE
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	197 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	198 int sb_byteType(const ENCODING enc, const char p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	199 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	200 return SB_BYTE_TYPE(enc, p);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	201 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	202 #define BYTE_TYPE(enc, p) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	203 (((const struct normal_encoding *)(enc))->byteType(enc, p))
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	204 #else
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	205 #define BYTE_TYPE(enc, p) SB_BYTE_TYPE(enc, p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	206 #endif
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	207
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	208 #ifdef XML_MIN_SIZE
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	209 #define BYTE_TO_ASCII(enc, p) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	210 (((const struct normal_encoding *)(enc))->byteToAscii(enc, p))
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	211 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	212 int sb_byteToAscii(const ENCODING enc, const char p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	213 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	214 return *p;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	215 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	216 #else
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	217 #define BYTE_TO_ASCII(enc, p) (*p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	218 #endif
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	219
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	220 #define IS_NAME_CHAR(enc, p, n) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	221 (((const struct normal_encoding *)(enc))->isName ## n(enc, p))
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	222 #define IS_NMSTRT_CHAR(enc, p, n) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	223 (((const struct normal_encoding *)(enc))->isNmstrt ## n(enc, p))
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	224 #define IS_INVALID_CHAR(enc, p, n) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	225 (((const struct normal_encoding *)(enc))->isInvalid ## n(enc, p))
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	226
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	227 #ifdef XML_MIN_SIZE
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	228 #define IS_NAME_CHAR_MINBPC(enc, p) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	229 (((const struct normal_encoding *)(enc))->isNameMin(enc, p))
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	230 #define IS_NMSTRT_CHAR_MINBPC(enc, p) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	231 (((const struct normal_encoding *)(enc))->isNmstrtMin(enc, p))
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	232 #else
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	233 #define IS_NAME_CHAR_MINBPC(enc, p) (0)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	234 #define IS_NMSTRT_CHAR_MINBPC(enc, p) (0)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	235 #endif
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	236
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	237 #ifdef XML_MIN_SIZE
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	238 #define CHAR_MATCHES(enc, p, c) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	239 (((const struct normal_encoding *)(enc))->charMatches(enc, p, c))
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	240 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	241 int sb_charMatches(const ENCODING enc, const char p, int c)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	242 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	243 return *p == c;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	244 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	245 #else
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	246 /* c is an ASCII character */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	247 #define CHAR_MATCHES(enc, p, c) (*(p) == c)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	248 #endif
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	249
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	250 #define PREFIX(ident) normal_ ## ident
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	251 #include "xmltok_impl.c"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	252
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	253 #undef MINBPC
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	254 #undef BYTE_TYPE
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	255 #undef BYTE_TO_ASCII
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	256 #undef CHAR_MATCHES
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	257 #undef IS_NAME_CHAR
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	258 #undef IS_NAME_CHAR_MINBPC
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	259 #undef IS_NMSTRT_CHAR
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	260 #undef IS_NMSTRT_CHAR_MINBPC
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	261 #undef IS_INVALID_CHAR
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	262
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	263 enum { /* UTF8_cvalN is value of masked first byte of N byte sequence */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	264 UTF8_cval1 = 0x00,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	265 UTF8_cval2 = 0xc0,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	266 UTF8_cval3 = 0xe0,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	267 UTF8_cval4 = 0xf0
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	268 };
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	269
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	270 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	271 void utf8_toUtf8(const ENCODING *enc,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	272 const char *fromP, const char fromLim,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	273 char *toP, const char toLim)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	274 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	275 char *to;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	276 const char *from;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	277 if (fromLim - fromP > toLim - toP) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	278 /* Avoid copying partial characters. */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	279 for (fromLim = fromP + (toLim - toP); fromLim > *fromP; fromLim--)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	280 if (((unsigned char)fromLim[-1] & 0xc0) != 0x80)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	281 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	282 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	283 for (to = toP, from = fromP; from != fromLim; from++, to++)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	284 to = from;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	285 *fromP = from;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	286 *toP = to;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	287 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	288
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	289 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	290 void utf8_toUtf16(const ENCODING *enc,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	291 const char *fromP, const char fromLim,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	292 unsigned short *toP, const unsigned short toLim)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	293 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	294 unsigned short to = toP;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	295 const char from = fromP;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	296 while (from != fromLim && to != toLim) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	297 switch (((struct normal_encoding )enc)->type[(unsigned char)from]) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	298 case BT_LEAD2:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	299 *to++ = ((from[0] & 0x1f) << 6) \| (from[1] & 0x3f);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	300 from += 2;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	301 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	302 case BT_LEAD3:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	303 *to++ = ((from[0] & 0xf) << 12) \| ((from[1] & 0x3f) << 6) \| (from[2] & 0x3f);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	304 from += 3;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	305 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	306 case BT_LEAD4:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	307 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	308 unsigned long n;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	309 if (to + 1 == toLim)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	310 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	311 n = ((from[0] & 0x7) << 18) \| ((from[1] & 0x3f) << 12) \| ((from[2] & 0x3f) << 6) \| (from[3] & 0x3f);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	312 n -= 0x10000;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	313 to[0] = (unsigned short)((n >> 10) \| 0xD800);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	314 to[1] = (unsigned short)((n & 0x3FF) \| 0xDC00);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	315 to += 2;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	316 from += 4;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	317 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	318 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	319 default:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	320 to++ = from++;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	321 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	322 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	323 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	324 *fromP = from;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	325 *toP = to;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	326 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	327
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	328 #ifdef XML_NS
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	329 static const struct normal_encoding utf8_encoding_ns = {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	330 { VTABLE1, utf8_toUtf8, utf8_toUtf16, 1, 1, 0 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	331 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	332 #include "asciitab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	333 #include "utf8tab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	334 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	335 STANDARD_VTABLE(sb_) NORMAL_VTABLE(utf8_)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	336 };
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	337 #endif
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	338
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	339 static const struct normal_encoding utf8_encoding = {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	340 { VTABLE1, utf8_toUtf8, utf8_toUtf16, 1, 1, 0 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	341 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	342 #define BT_COLON BT_NMSTRT
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	343 #include "asciitab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	344 #undef BT_COLON
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	345 #include "utf8tab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	346 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	347 STANDARD_VTABLE(sb_) NORMAL_VTABLE(utf8_)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	348 };
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	349
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	350 #ifdef XML_NS
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	351
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	352 static const struct normal_encoding internal_utf8_encoding_ns = {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	353 { VTABLE1, utf8_toUtf8, utf8_toUtf16, 1, 1, 0 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	354 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	355 #include "iasciitab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	356 #include "utf8tab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	357 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	358 STANDARD_VTABLE(sb_) NORMAL_VTABLE(utf8_)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	359 };
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	360
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	361 #endif
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	362
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	363 static const struct normal_encoding internal_utf8_encoding = {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	364 { VTABLE1, utf8_toUtf8, utf8_toUtf16, 1, 1, 0 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	365 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	366 #define BT_COLON BT_NMSTRT
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	367 #include "iasciitab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	368 #undef BT_COLON
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	369 #include "utf8tab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	370 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	371 STANDARD_VTABLE(sb_) NORMAL_VTABLE(utf8_)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	372 };
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	373
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	374 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	375 void latin1_toUtf8(const ENCODING *enc,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	376 const char *fromP, const char fromLim,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	377 char *toP, const char toLim)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	378 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	379 for (;;) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	380 unsigned char c;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	381 if (*fromP == fromLim)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	382 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	383 c = (unsigned char)**fromP;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	384 if (c & 0x80) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	385 if (toLim - *toP < 2)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	386 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	387 (toP)++ = ((c >> 6) \| UTF8_cval2);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	388 (toP)++ = ((c & 0x3f) \| 0x80);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	389 (*fromP)++;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	390 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	391 else {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	392 if (*toP == toLim)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	393 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	394 (toP)++ = (fromP)++;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	395 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	396 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	397 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	398
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	399 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	400 void latin1_toUtf16(const ENCODING *enc,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	401 const char *fromP, const char fromLim,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	402 unsigned short *toP, const unsigned short toLim)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	403 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	404 while (fromP != fromLim && toP != toLim)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	405 (toP)++ = (unsigned char)(fromP)++;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	406 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	407
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	408 #ifdef XML_NS
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	409
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	410 static const struct normal_encoding latin1_encoding_ns = {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	411 { VTABLE1, latin1_toUtf8, latin1_toUtf16, 1, 0, 0 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	412 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	413 #include "asciitab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	414 #include "latin1tab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	415 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	416 STANDARD_VTABLE(sb_)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	417 };
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	418
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	419 #endif
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	420
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	421 static const struct normal_encoding latin1_encoding = {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	422 { VTABLE1, latin1_toUtf8, latin1_toUtf16, 1, 0, 0 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	423 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	424 #define BT_COLON BT_NMSTRT
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	425 #include "asciitab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	426 #undef BT_COLON
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	427 #include "latin1tab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	428 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	429 STANDARD_VTABLE(sb_)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	430 };
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	431
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	432 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	433 void ascii_toUtf8(const ENCODING *enc,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	434 const char *fromP, const char fromLim,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	435 char *toP, const char toLim)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	436 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	437 while (fromP != fromLim && toP != toLim)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	438 (toP)++ = (fromP)++;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	439 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	440
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	441 #ifdef XML_NS
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	442
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	443 static const struct normal_encoding ascii_encoding_ns = {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	444 { VTABLE1, ascii_toUtf8, latin1_toUtf16, 1, 1, 0 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	445 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	446 #include "asciitab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	447 /* BT_NONXML == 0 */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	448 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	449 STANDARD_VTABLE(sb_)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	450 };
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	451
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	452 #endif
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	453
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	454 static const struct normal_encoding ascii_encoding = {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	455 { VTABLE1, ascii_toUtf8, latin1_toUtf16, 1, 1, 0 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	456 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	457 #define BT_COLON BT_NMSTRT
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	458 #include "asciitab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	459 #undef BT_COLON
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	460 /* BT_NONXML == 0 */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	461 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	462 STANDARD_VTABLE(sb_)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	463 };
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	464
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	465 static int unicode_byte_type(char hi, char lo)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	466 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	467 switch ((unsigned char)hi) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	468 case 0xD8: case 0xD9: case 0xDA: case 0xDB:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	469 return BT_LEAD4;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	470 case 0xDC: case 0xDD: case 0xDE: case 0xDF:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	471 return BT_TRAIL;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	472 case 0xFF:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	473 switch ((unsigned char)lo) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	474 case 0xFF:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	475 case 0xFE:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	476 return BT_NONXML;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	477 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	478 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	479 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	480 return BT_NONASCII;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	481 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	482
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	483 #define DEFINE_UTF16_TO_UTF8(E) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	484 static \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	485 void E ## toUtf8(const ENCODING *enc, \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	486 const char *fromP, const char fromLim, \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	487 char *toP, const char toLim) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	488 { \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	489 const char *from; \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	490 for (from = *fromP; from != fromLim; from += 2) { \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	491 int plane; \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	492 unsigned char lo2; \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	493 unsigned char lo = GET_LO(from); \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	494 unsigned char hi = GET_HI(from); \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	495 switch (hi) { \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	496 case 0: \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	497 if (lo < 0x80) { \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	498 if (*toP == toLim) { \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	499 *fromP = from; \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	500 return; \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	501 } \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	502 (toP)++ = lo; \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	503 break; \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	504 } \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	505 /* fall through */ \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	506 case 0x1: case 0x2: case 0x3: \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	507 case 0x4: case 0x5: case 0x6: case 0x7: \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	508 if (toLim - *toP < 2) { \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	509 *fromP = from; \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	510 return; \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	511 } \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	512 (toP)++ = ((lo >> 6) \| (hi << 2) \| UTF8_cval2); \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	513 (toP)++ = ((lo & 0x3f) \| 0x80); \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	514 break; \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	515 default: \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	516 if (toLim - *toP < 3) { \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	517 *fromP = from; \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	518 return; \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	519 } \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	520 /* 16 bits divided 4, 6, 6 amongst 3 bytes */ \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	521 (toP)++ = ((hi >> 4) \| UTF8_cval3); \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	522 (toP)++ = (((hi & 0xf) << 2) \| (lo >> 6) \| 0x80); \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	523 (toP)++ = ((lo & 0x3f) \| 0x80); \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	524 break; \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	525 case 0xD8: case 0xD9: case 0xDA: case 0xDB: \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	526 if (toLim - *toP < 4) { \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	527 *fromP = from; \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	528 return; \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	529 } \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	530 plane = (((hi & 0x3) << 2) \| ((lo >> 6) & 0x3)) + 1; \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	531 (toP)++ = ((plane >> 2) \| UTF8_cval4); \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	532 (toP)++ = (((lo >> 2) & 0xF) \| ((plane & 0x3) << 4) \| 0x80); \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	533 from += 2; \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	534 lo2 = GET_LO(from); \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	535 (toP)++ = (((lo & 0x3) << 4) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	536 \| ((GET_HI(from) & 0x3) << 2) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	537 \| (lo2 >> 6) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	538 \| 0x80); \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	539 (toP)++ = ((lo2 & 0x3f) \| 0x80); \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	540 break; \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	541 } \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	542 } \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	543 *fromP = from; \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	544 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	545
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	546 #define DEFINE_UTF16_TO_UTF16(E) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	547 static \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	548 void E ## toUtf16(const ENCODING *enc, \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	549 const char *fromP, const char fromLim, \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	550 unsigned short *toP, const unsigned short toLim) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	551 { \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	552 /* Avoid copying first half only of surrogate */ \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	553 if (fromLim - fromP > ((toLim - toP) << 1) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	554 && (GET_HI(fromLim - 2) & 0xF8) == 0xD8) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	555 fromLim -= 2; \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	556 for (; fromP != fromLim && toP != toLim; *fromP += 2) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	557 (toP)++ = (GET_HI(fromP) << 8) \| GET_LO(fromP); \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	558 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	559
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	560 #define SET2(ptr, ch) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	561 (((ptr)[0] = ((ch) & 0xff)), ((ptr)[1] = ((ch) >> 8)))
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	562 #define GET_LO(ptr) ((unsigned char)(ptr)[0])
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	563 #define GET_HI(ptr) ((unsigned char)(ptr)[1])
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	564
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	565 DEFINE_UTF16_TO_UTF8(little2_)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	566 DEFINE_UTF16_TO_UTF16(little2_)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	567
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	568 #undef SET2
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	569 #undef GET_LO
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	570 #undef GET_HI
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	571
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	572 #define SET2(ptr, ch) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	573 (((ptr)[0] = ((ch) >> 8)), ((ptr)[1] = ((ch) & 0xFF)))
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	574 #define GET_LO(ptr) ((unsigned char)(ptr)[1])
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	575 #define GET_HI(ptr) ((unsigned char)(ptr)[0])
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	576
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	577 DEFINE_UTF16_TO_UTF8(big2_)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	578 DEFINE_UTF16_TO_UTF16(big2_)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	579
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	580 #undef SET2
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	581 #undef GET_LO
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	582 #undef GET_HI
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	583
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	584 #define LITTLE2_BYTE_TYPE(enc, p) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	585 ((p)[1] == 0 \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	586 ? ((struct normal_encoding )(enc))->type[(unsigned char)(p)] \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	587 : unicode_byte_type((p)[1], (p)[0]))
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	588 #define LITTLE2_BYTE_TO_ASCII(enc, p) ((p)[1] == 0 ? (p)[0] : -1)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	589 #define LITTLE2_CHAR_MATCHES(enc, p, c) ((p)[1] == 0 && (p)[0] == c)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	590 #define LITTLE2_IS_NAME_CHAR_MINBPC(enc, p) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	591 UCS2_GET_NAMING(namePages, (unsigned char)p[1], (unsigned char)p[0])
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	592 #define LITTLE2_IS_NMSTRT_CHAR_MINBPC(enc, p) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	593 UCS2_GET_NAMING(nmstrtPages, (unsigned char)p[1], (unsigned char)p[0])
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	594
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	595 #ifdef XML_MIN_SIZE
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	596
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	597 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	598 int little2_byteType(const ENCODING enc, const char p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	599 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	600 return LITTLE2_BYTE_TYPE(enc, p);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	601 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	602
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	603 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	604 int little2_byteToAscii(const ENCODING enc, const char p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	605 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	606 return LITTLE2_BYTE_TO_ASCII(enc, p);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	607 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	608
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	609 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	610 int little2_charMatches(const ENCODING enc, const char p, int c)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	611 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	612 return LITTLE2_CHAR_MATCHES(enc, p, c);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	613 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	614
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	615 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	616 int little2_isNameMin(const ENCODING enc, const char p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	617 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	618 return LITTLE2_IS_NAME_CHAR_MINBPC(enc, p);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	619 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	620
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	621 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	622 int little2_isNmstrtMin(const ENCODING enc, const char p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	623 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	624 return LITTLE2_IS_NMSTRT_CHAR_MINBPC(enc, p);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	625 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	626
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	627 #undef VTABLE
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	628 #define VTABLE VTABLE1, little2_toUtf8, little2_toUtf16
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	629
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	630 #else /* not XML_MIN_SIZE */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	631
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	632 #undef PREFIX
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	633 #define PREFIX(ident) little2_ ## ident
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	634 #define MINBPC(enc) 2
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	635 /* CHAR_MATCHES is guaranteed to have MINBPC bytes available. */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	636 #define BYTE_TYPE(enc, p) LITTLE2_BYTE_TYPE(enc, p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	637 #define BYTE_TO_ASCII(enc, p) LITTLE2_BYTE_TO_ASCII(enc, p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	638 #define CHAR_MATCHES(enc, p, c) LITTLE2_CHAR_MATCHES(enc, p, c)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	639 #define IS_NAME_CHAR(enc, p, n) 0
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	640 #define IS_NAME_CHAR_MINBPC(enc, p) LITTLE2_IS_NAME_CHAR_MINBPC(enc, p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	641 #define IS_NMSTRT_CHAR(enc, p, n) (0)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	642 #define IS_NMSTRT_CHAR_MINBPC(enc, p) LITTLE2_IS_NMSTRT_CHAR_MINBPC(enc, p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	643
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	644 #include "xmltok_impl.c"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	645
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	646 #undef MINBPC
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	647 #undef BYTE_TYPE
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	648 #undef BYTE_TO_ASCII
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	649 #undef CHAR_MATCHES
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	650 #undef IS_NAME_CHAR
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	651 #undef IS_NAME_CHAR_MINBPC
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	652 #undef IS_NMSTRT_CHAR
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	653 #undef IS_NMSTRT_CHAR_MINBPC
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	654 #undef IS_INVALID_CHAR
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	655
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	656 #endif /* not XML_MIN_SIZE */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	657
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	658 #ifdef XML_NS
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	659
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	660 static const struct normal_encoding little2_encoding_ns = {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	661 { VTABLE, 2, 0,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	662 #if XML_BYTE_ORDER == 12
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	663 1
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	664 #else
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	665 0
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	666 #endif
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	667 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	668 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	669 #include "asciitab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	670 #include "latin1tab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	671 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	672 STANDARD_VTABLE(little2_)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	673 };
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	674
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	675 #endif
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	676
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	677 static const struct normal_encoding little2_encoding = {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	678 { VTABLE, 2, 0,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	679 #if XML_BYTE_ORDER == 12
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	680 1
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	681 #else
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	682 0
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	683 #endif
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	684 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	685 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	686 #define BT_COLON BT_NMSTRT
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	687 #include "asciitab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	688 #undef BT_COLON
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	689 #include "latin1tab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	690 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	691 STANDARD_VTABLE(little2_)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	692 };
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	693
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	694 #if XML_BYTE_ORDER != 21
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	695
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	696 #ifdef XML_NS
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	697
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	698 static const struct normal_encoding internal_little2_encoding_ns = {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	699 { VTABLE, 2, 0, 1 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	700 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	701 #include "iasciitab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	702 #include "latin1tab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	703 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	704 STANDARD_VTABLE(little2_)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	705 };
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	706
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	707 #endif
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	708
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	709 static const struct normal_encoding internal_little2_encoding = {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	710 { VTABLE, 2, 0, 1 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	711 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	712 #define BT_COLON BT_NMSTRT
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	713 #include "iasciitab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	714 #undef BT_COLON
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	715 #include "latin1tab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	716 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	717 STANDARD_VTABLE(little2_)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	718 };
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	719
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	720 #endif
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	721
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	722
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	723 #define BIG2_BYTE_TYPE(enc, p) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	724 ((p)[0] == 0 \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	725 ? ((struct normal_encoding *)(enc))->type[(unsigned char)(p)[1]] \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	726 : unicode_byte_type((p)[0], (p)[1]))
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	727 #define BIG2_BYTE_TO_ASCII(enc, p) ((p)[0] == 0 ? (p)[1] : -1)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	728 #define BIG2_CHAR_MATCHES(enc, p, c) ((p)[0] == 0 && (p)[1] == c)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	729 #define BIG2_IS_NAME_CHAR_MINBPC(enc, p) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	730 UCS2_GET_NAMING(namePages, (unsigned char)p[0], (unsigned char)p[1])
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	731 #define BIG2_IS_NMSTRT_CHAR_MINBPC(enc, p) \
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	732 UCS2_GET_NAMING(nmstrtPages, (unsigned char)p[0], (unsigned char)p[1])
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	733
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	734 #ifdef XML_MIN_SIZE
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	735
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	736 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	737 int big2_byteType(const ENCODING enc, const char p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	738 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	739 return BIG2_BYTE_TYPE(enc, p);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	740 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	741
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	742 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	743 int big2_byteToAscii(const ENCODING enc, const char p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	744 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	745 return BIG2_BYTE_TO_ASCII(enc, p);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	746 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	747
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	748 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	749 int big2_charMatches(const ENCODING enc, const char p, int c)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	750 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	751 return BIG2_CHAR_MATCHES(enc, p, c);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	752 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	753
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	754 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	755 int big2_isNameMin(const ENCODING enc, const char p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	756 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	757 return BIG2_IS_NAME_CHAR_MINBPC(enc, p);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	758 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	759
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	760 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	761 int big2_isNmstrtMin(const ENCODING enc, const char p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	762 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	763 return BIG2_IS_NMSTRT_CHAR_MINBPC(enc, p);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	764 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	765
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	766 #undef VTABLE
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	767 #define VTABLE VTABLE1, big2_toUtf8, big2_toUtf16
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	768
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	769 #else /* not XML_MIN_SIZE */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	770
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	771 #undef PREFIX
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	772 #define PREFIX(ident) big2_ ## ident
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	773 #define MINBPC(enc) 2
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	774 /* CHAR_MATCHES is guaranteed to have MINBPC bytes available. */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	775 #define BYTE_TYPE(enc, p) BIG2_BYTE_TYPE(enc, p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	776 #define BYTE_TO_ASCII(enc, p) BIG2_BYTE_TO_ASCII(enc, p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	777 #define CHAR_MATCHES(enc, p, c) BIG2_CHAR_MATCHES(enc, p, c)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	778 #define IS_NAME_CHAR(enc, p, n) 0
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	779 #define IS_NAME_CHAR_MINBPC(enc, p) BIG2_IS_NAME_CHAR_MINBPC(enc, p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	780 #define IS_NMSTRT_CHAR(enc, p, n) (0)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	781 #define IS_NMSTRT_CHAR_MINBPC(enc, p) BIG2_IS_NMSTRT_CHAR_MINBPC(enc, p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	782
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	783 #include "xmltok_impl.c"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	784
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	785 #undef MINBPC
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	786 #undef BYTE_TYPE
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	787 #undef BYTE_TO_ASCII
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	788 #undef CHAR_MATCHES
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	789 #undef IS_NAME_CHAR
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	790 #undef IS_NAME_CHAR_MINBPC
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	791 #undef IS_NMSTRT_CHAR
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	792 #undef IS_NMSTRT_CHAR_MINBPC
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	793 #undef IS_INVALID_CHAR
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	794
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	795 #endif /* not XML_MIN_SIZE */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	796
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	797 #ifdef XML_NS
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	798
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	799 static const struct normal_encoding big2_encoding_ns = {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	800 { VTABLE, 2, 0,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	801 #if XML_BYTE_ORDER == 21
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	802 1
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	803 #else
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	804 0
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	805 #endif
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	806 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	807 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	808 #include "asciitab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	809 #include "latin1tab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	810 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	811 STANDARD_VTABLE(big2_)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	812 };
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	813
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	814 #endif
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	815
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	816 static const struct normal_encoding big2_encoding = {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	817 { VTABLE, 2, 0,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	818 #if XML_BYTE_ORDER == 21
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	819 1
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	820 #else
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	821 0
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	822 #endif
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	823 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	824 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	825 #define BT_COLON BT_NMSTRT
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	826 #include "asciitab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	827 #undef BT_COLON
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	828 #include "latin1tab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	829 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	830 STANDARD_VTABLE(big2_)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	831 };
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	832
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	833 #if XML_BYTE_ORDER != 12
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	834
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	835 #ifdef XML_NS
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	836
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	837 static const struct normal_encoding internal_big2_encoding_ns = {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	838 { VTABLE, 2, 0, 1 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	839 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	840 #include "iasciitab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	841 #include "latin1tab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	842 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	843 STANDARD_VTABLE(big2_)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	844 };
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	845
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	846 #endif
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	847
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	848 static const struct normal_encoding internal_big2_encoding = {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	849 { VTABLE, 2, 0, 1 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	850 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	851 #define BT_COLON BT_NMSTRT
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	852 #include "iasciitab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	853 #undef BT_COLON
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	854 #include "latin1tab.h"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	855 },
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	856 STANDARD_VTABLE(big2_)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	857 };
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	858
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	859 #endif
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	860
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	861 #undef PREFIX
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	862
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	863 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	864 int streqci(const char s1, const char s2)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	865 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	866 for (;;) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	867 char c1 = *s1++;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	868 char c2 = *s2++;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	869 if ('a' <= c1 && c1 <= 'z')
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	870 c1 += 'A' - 'a';
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	871 if ('a' <= c2 && c2 <= 'z')
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	872 c2 += 'A' - 'a';
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	873 if (c1 != c2)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	874 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	875 if (!c1)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	876 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	877 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	878 return 1;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	879 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	880
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	881 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	882 void initUpdatePosition(const ENCODING enc, const char ptr,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	883 const char end, POSITION pos)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	884 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	885 normal_updatePosition(&utf8_encoding.enc, ptr, end, pos);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	886 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	887
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	888 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	889 int toAscii(const ENCODING enc, const char ptr, const char *end)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	890 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	891 char buf[1];
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	892 char *p = buf;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	893 XmlUtf8Convert(enc, &ptr, end, &p, p + 1);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	894 if (p == buf)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	895 return -1;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	896 else
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	897 return buf[0];
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	898 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	899
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	900 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	901 int isSpace(int c)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	902 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	903 switch (c) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	904 case 0x20:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	905 case 0xD:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	906 case 0xA:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	907 case 0x9:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	908 return 1;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	909 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	910 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	911 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	912
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	913 /* Return 1 if there's just optional white space
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	914 or there's an S followed by name=val. */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	915 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	916 int parsePseudoAttribute(const ENCODING *enc,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	917 const char *ptr,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	918 const char *end,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	919 const char **namePtr,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	920 const char **valPtr,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	921 const char **nextTokPtr)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	922 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	923 int c;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	924 char open;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	925 if (ptr == end) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	926 *namePtr = 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	927 return 1;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	928 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	929 if (!isSpace(toAscii(enc, ptr, end))) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	930 *nextTokPtr = ptr;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	931 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	932 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	933 do {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	934 ptr += enc->minBytesPerChar;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	935 } while (isSpace(toAscii(enc, ptr, end)));
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	936 if (ptr == end) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	937 *namePtr = 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	938 return 1;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	939 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	940 *namePtr = ptr;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	941 for (;;) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	942 c = toAscii(enc, ptr, end);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	943 if (c == -1) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	944 *nextTokPtr = ptr;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	945 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	946 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	947 if (c == '=')
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	948 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	949 if (isSpace(c)) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	950 do {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	951 ptr += enc->minBytesPerChar;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	952 } while (isSpace(c = toAscii(enc, ptr, end)));
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	953 if (c != '=') {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	954 *nextTokPtr = ptr;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	955 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	956 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	957 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	958 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	959 ptr += enc->minBytesPerChar;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	960 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	961 if (ptr == *namePtr) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	962 *nextTokPtr = ptr;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	963 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	964 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	965 ptr += enc->minBytesPerChar;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	966 c = toAscii(enc, ptr, end);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	967 while (isSpace(c)) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	968 ptr += enc->minBytesPerChar;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	969 c = toAscii(enc, ptr, end);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	970 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	971 if (c != '"' && c != '\'') {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	972 *nextTokPtr = ptr;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	973 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	974 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	975 open = c;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	976 ptr += enc->minBytesPerChar;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	977 *valPtr = ptr;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	978 for (;; ptr += enc->minBytesPerChar) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	979 c = toAscii(enc, ptr, end);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	980 if (c == open)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	981 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	982 if (!('a' <= c && c <= 'z')
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	983 && !('A' <= c && c <= 'Z')
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	984 && !('0' <= c && c <= '9')
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	985 && c != '.'
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	986 && c != '-'
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	987 && c != '_') {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	988 *nextTokPtr = ptr;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	989 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	990 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	991 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	992 *nextTokPtr = ptr + enc->minBytesPerChar;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	993 return 1;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	994 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	995
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	996 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	997 int doParseXmlDecl(const ENCODING (encodingFinder)(const ENCODING *,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	998 const char *,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	999 const char *),
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1000 int isGeneralTextEntity,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1001 const ENCODING *enc,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1002 const char *ptr,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1003 const char *end,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1004 const char **badPtr,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1005 const char **versionPtr,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1006 const char **encodingName,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1007 const ENCODING **encoding,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1008 int *standalone)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1009 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1010 const char *val = 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1011 const char *name = 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1012 ptr += 5 * enc->minBytesPerChar;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1013 end -= 2 * enc->minBytesPerChar;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1014 if (!parsePseudoAttribute(enc, ptr, end, &name, &val, &ptr) \|\| !name) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1015 *badPtr = ptr;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1016 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1017 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1018 if (!XmlNameMatchesAscii(enc, name, "version")) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1019 if (!isGeneralTextEntity) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1020 *badPtr = name;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1021 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1022 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1023 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1024 else {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1025 if (versionPtr)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1026 *versionPtr = val;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1027 if (!parsePseudoAttribute(enc, ptr, end, &name, &val, &ptr)) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1028 *badPtr = ptr;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1029 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1030 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1031 if (!name) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1032 if (isGeneralTextEntity) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1033 /* a TextDecl must have an EncodingDecl */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1034 *badPtr = ptr;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1035 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1036 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1037 return 1;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1038 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1039 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1040 if (XmlNameMatchesAscii(enc, name, "encoding")) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1041 int c = toAscii(enc, val, end);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1042 if (!('a' <= c && c <= 'z') && !('A' <= c && c <= 'Z')) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1043 *badPtr = val;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1044 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1045 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1046 if (encodingName)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1047 *encodingName = val;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1048 if (encoding)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1049 *encoding = encodingFinder(enc, val, ptr - enc->minBytesPerChar);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1050 if (!parsePseudoAttribute(enc, ptr, end, &name, &val, &ptr)) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1051 *badPtr = ptr;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1052 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1053 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1054 if (!name)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1055 return 1;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1056 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1057 if (!XmlNameMatchesAscii(enc, name, "standalone") \|\| isGeneralTextEntity) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1058 *badPtr = name;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1059 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1060 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1061 if (XmlNameMatchesAscii(enc, val, "yes")) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1062 if (standalone)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1063 *standalone = 1;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1064 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1065 else if (XmlNameMatchesAscii(enc, val, "no")) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1066 if (standalone)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1067 *standalone = 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1068 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1069 else {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1070 *badPtr = val;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1071 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1072 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1073 while (isSpace(toAscii(enc, ptr, end)))
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1074 ptr += enc->minBytesPerChar;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1075 if (ptr != end) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1076 *badPtr = ptr;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1077 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1078 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1079 return 1;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1080 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1081
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1082 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1083 int checkCharRefNumber(int result)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1084 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1085 switch (result >> 8) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1086 case 0xD8: case 0xD9: case 0xDA: case 0xDB:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1087 case 0xDC: case 0xDD: case 0xDE: case 0xDF:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1088 return -1;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1089 case 0:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1090 if (latin1_encoding.type[result] == BT_NONXML)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1091 return -1;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1092 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1093 case 0xFF:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1094 if (result == 0xFFFE \|\| result == 0xFFFF)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1095 return -1;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1096 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1097 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1098 return result;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1099 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1100
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1101 int XmlUtf8Encode(int c, char *buf)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1102 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1103 enum {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1104 /* minN is minimum legal resulting value for N byte sequence */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1105 min2 = 0x80,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1106 min3 = 0x800,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1107 min4 = 0x10000
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1108 };
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1109
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1110 if (c < 0)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1111 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1112 if (c < min2) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1113 buf[0] = (c \| UTF8_cval1);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1114 return 1;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1115 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1116 if (c < min3) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1117 buf[0] = ((c >> 6) \| UTF8_cval2);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1118 buf[1] = ((c & 0x3f) \| 0x80);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1119 return 2;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1120 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1121 if (c < min4) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1122 buf[0] = ((c >> 12) \| UTF8_cval3);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1123 buf[1] = (((c >> 6) & 0x3f) \| 0x80);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1124 buf[2] = ((c & 0x3f) \| 0x80);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1125 return 3;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1126 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1127 if (c < 0x110000) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1128 buf[0] = ((c >> 18) \| UTF8_cval4);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1129 buf[1] = (((c >> 12) & 0x3f) \| 0x80);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1130 buf[2] = (((c >> 6) & 0x3f) \| 0x80);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1131 buf[3] = ((c & 0x3f) \| 0x80);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1132 return 4;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1133 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1134 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1135 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1136
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1137 int XmlUtf16Encode(int charNum, unsigned short *buf)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1138 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1139 if (charNum < 0)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1140 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1141 if (charNum < 0x10000) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1142 buf[0] = charNum;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1143 return 1;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1144 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1145 if (charNum < 0x110000) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1146 charNum -= 0x10000;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1147 buf[0] = (charNum >> 10) + 0xD800;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1148 buf[1] = (charNum & 0x3FF) + 0xDC00;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1149 return 2;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1150 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1151 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1152 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1153
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1154 struct unknown_encoding {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1155 struct normal_encoding normal;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1156 int (convert)(void userData, const char *p);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1157 void *userData;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1158 unsigned short utf16[256];
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1159 char utf8[256][4];
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1160 };
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1161
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1162 int XmlSizeOfUnknownEncoding()
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1163 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1164 return sizeof(struct unknown_encoding);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1165 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1166
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1167 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1168 int unknown_isName(const ENCODING enc, const char p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1169 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1170 int c = ((const struct unknown_encoding *)enc)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1171 ->convert(((const struct unknown_encoding *)enc)->userData, p);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1172 if (c & ~0xFFFF)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1173 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1174 return UCS2_GET_NAMING(namePages, c >> 8, c & 0xFF);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1175 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1176
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1177 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1178 int unknown_isNmstrt(const ENCODING enc, const char p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1179 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1180 int c = ((const struct unknown_encoding *)enc)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1181 ->convert(((const struct unknown_encoding *)enc)->userData, p);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1182 if (c & ~0xFFFF)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1183 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1184 return UCS2_GET_NAMING(nmstrtPages, c >> 8, c & 0xFF);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1185 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1186
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1187 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1188 int unknown_isInvalid(const ENCODING enc, const char p)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1189 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1190 int c = ((const struct unknown_encoding *)enc)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1191 ->convert(((const struct unknown_encoding *)enc)->userData, p);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1192 return (c & ~0xFFFF) \|\| checkCharRefNumber(c) < 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1193 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1194
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1195 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1196 void unknown_toUtf8(const ENCODING *enc,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1197 const char *fromP, const char fromLim,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1198 char *toP, const char toLim)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1199 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1200 char buf[XML_UTF8_ENCODE_MAX];
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1201 for (;;) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1202 const char *utf8;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1203 int n;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1204 if (*fromP == fromLim)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1205 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1206 utf8 = ((const struct unknown_encoding )enc)->utf8[(unsigned char)*fromP];
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1207 n = *utf8++;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1208 if (n == 0) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1209 int c = ((const struct unknown_encoding *)enc)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1210 ->convert(((const struct unknown_encoding )enc)->userData, fromP);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1211 n = XmlUtf8Encode(c, buf);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1212 if (n > toLim - *toP)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1213 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1214 utf8 = buf;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1215 fromP += ((const struct normal_encoding )enc)->type[(unsigned char)**fromP]
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1216 - (BT_LEAD2 - 2);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1217 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1218 else {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1219 if (n > toLim - *toP)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1220 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1221 (*fromP)++;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1222 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1223 do {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1224 (toP)++ = *utf8++;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1225 } while (--n != 0);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1226 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1227 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1228
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1229 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1230 void unknown_toUtf16(const ENCODING *enc,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1231 const char *fromP, const char fromLim,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1232 unsigned short *toP, const unsigned short toLim)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1233 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1234 while (fromP != fromLim && toP != toLim) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1235 unsigned short c
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1236 = ((const struct unknown_encoding )enc)->utf16[(unsigned char)*fromP];
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1237 if (c == 0) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1238 c = (unsigned short)((const struct unknown_encoding *)enc)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1239 ->convert(((const struct unknown_encoding )enc)->userData, fromP);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1240 fromP += ((const struct normal_encoding )enc)->type[(unsigned char)**fromP]
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1241 - (BT_LEAD2 - 2);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1242 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1243 else
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1244 (*fromP)++;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1245 (toP)++ = c;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1246 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1247 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1248
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1249 ENCODING *
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1250 XmlInitUnknownEncoding(void *mem,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1251 int *table,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1252 int (convert)(void userData, const char *p),
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1253 void *userData)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1254 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1255 int i;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1256 struct unknown_encoding *e = mem;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1257 for (i = 0; i < sizeof(struct normal_encoding); i++)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1258 ((char )mem)[i] = ((char )&latin1_encoding)[i];
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1259 for (i = 0; i < 128; i++)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1260 if (latin1_encoding.type[i] != BT_OTHER
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1261 && latin1_encoding.type[i] != BT_NONXML
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1262 && table[i] != i)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1263 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1264 for (i = 0; i < 256; i++) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1265 int c = table[i];
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1266 if (c == -1) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1267 e->normal.type[i] = BT_MALFORM;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1268 /* This shouldn't really get used. */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1269 e->utf16[i] = 0xFFFF;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1270 e->utf8[i][0] = 1;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1271 e->utf8[i][1] = 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1272 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1273 else if (c < 0) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1274 if (c < -4)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1275 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1276 e->normal.type[i] = BT_LEAD2 - (c + 2);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1277 e->utf8[i][0] = 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1278 e->utf16[i] = 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1279 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1280 else if (c < 0x80) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1281 if (latin1_encoding.type[c] != BT_OTHER
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1282 && latin1_encoding.type[c] != BT_NONXML
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1283 && c != i)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1284 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1285 e->normal.type[i] = latin1_encoding.type[c];
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1286 e->utf8[i][0] = 1;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1287 e->utf8[i][1] = (char)c;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1288 e->utf16[i] = c == 0 ? 0xFFFF : c;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1289 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1290 else if (checkCharRefNumber(c) < 0) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1291 e->normal.type[i] = BT_NONXML;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1292 /* This shouldn't really get used. */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1293 e->utf16[i] = 0xFFFF;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1294 e->utf8[i][0] = 1;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1295 e->utf8[i][1] = 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1296 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1297 else {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1298 if (c > 0xFFFF)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1299 return 0;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1300 if (UCS2_GET_NAMING(nmstrtPages, c >> 8, c & 0xff))
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1301 e->normal.type[i] = BT_NMSTRT;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1302 else if (UCS2_GET_NAMING(namePages, c >> 8, c & 0xff))
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1303 e->normal.type[i] = BT_NAME;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1304 else
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1305 e->normal.type[i] = BT_OTHER;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1306 e->utf8[i][0] = (char)XmlUtf8Encode(c, e->utf8[i] + 1);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1307 e->utf16[i] = c;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1308 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1309 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1310 e->userData = userData;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1311 e->convert = convert;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1312 if (convert) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1313 e->normal.isName2 = unknown_isName;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1314 e->normal.isName3 = unknown_isName;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1315 e->normal.isName4 = unknown_isName;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1316 e->normal.isNmstrt2 = unknown_isNmstrt;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1317 e->normal.isNmstrt3 = unknown_isNmstrt;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1318 e->normal.isNmstrt4 = unknown_isNmstrt;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1319 e->normal.isInvalid2 = unknown_isInvalid;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1320 e->normal.isInvalid3 = unknown_isInvalid;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1321 e->normal.isInvalid4 = unknown_isInvalid;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1322 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1323 e->normal.enc.utf8Convert = unknown_toUtf8;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1324 e->normal.enc.utf16Convert = unknown_toUtf16;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1325 return &(e->normal.enc);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1326 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1327
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1328 /* If this enumeration is changed, getEncodingIndex and encodings
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1329 must also be changed. */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1330 enum {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1331 UNKNOWN_ENC = -1,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1332 ISO_8859_1_ENC = 0,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1333 US_ASCII_ENC,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1334 UTF_8_ENC,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1335 UTF_16_ENC,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1336 UTF_16BE_ENC,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1337 UTF_16LE_ENC,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1338 /* must match encodingNames up to here */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1339 NO_ENC
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1340 };
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1341
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1342 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1343 int getEncodingIndex(const char *name)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1344 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1345 static const char *encodingNames[] = {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1346 "ISO-8859-1",
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1347 "US-ASCII",
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1348 "UTF-8",
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1349 "UTF-16",
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1350 "UTF-16BE"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1351 "UTF-16LE",
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1352 };
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1353 int i;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1354 if (name == 0)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1355 return NO_ENC;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1356 for (i = 0; i < sizeof(encodingNames)/sizeof(encodingNames[0]); i++)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1357 if (streqci(name, encodingNames[i]))
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1358 return i;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1359 return UNKNOWN_ENC;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1360 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1361
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1362 /* For binary compatibility, we store the index of the encoding specified
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1363 at initialization in the isUtf16 member. */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1364
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1365 #define INIT_ENC_INDEX(enc) ((enc)->initEnc.isUtf16)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1366
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1367 /* This is what detects the encoding.
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1368 encodingTable maps from encoding indices to encodings;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1369 INIT_ENC_INDEX(enc) is the index of the external (protocol) specified encoding;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1370 state is XML_CONTENT_STATE if we're parsing an external text entity,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1371 and XML_PROLOG_STATE otherwise.
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1372 */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1373
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1374
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1375 static
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1376 int initScan(const ENCODING **encodingTable,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1377 const INIT_ENCODING *enc,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1378 int state,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1379 const char *ptr,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1380 const char *end,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1381 const char **nextTokPtr)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1382 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1383 const ENCODING **encPtr;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1384
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1385 if (ptr == end)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1386 return XML_TOK_NONE;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1387 encPtr = enc->encPtr;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1388 if (ptr + 1 == end) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1389 /* only a single byte available for auto-detection */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1390 /* a well-formed document entity must have more than one byte */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1391 if (state != XML_CONTENT_STATE)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1392 return XML_TOK_PARTIAL;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1393 /* so we're parsing an external text entity... */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1394 /* if UTF-16 was externally specified, then we need at least 2 bytes */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1395 switch (INIT_ENC_INDEX(enc)) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1396 case UTF_16_ENC:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1397 case UTF_16LE_ENC:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1398 case UTF_16BE_ENC:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1399 return XML_TOK_PARTIAL;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1400 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1401 switch ((unsigned char)*ptr) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1402 case 0xFE:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1403 case 0xFF:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1404 case 0xEF: /* possibly first byte of UTF-8 BOM */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1405 if (INIT_ENC_INDEX(enc) == ISO_8859_1_ENC
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1406 && state == XML_CONTENT_STATE)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1407 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1408 /* fall through */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1409 case 0x00:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1410 case 0x3C:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1411 return XML_TOK_PARTIAL;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1412 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1413 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1414 else {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1415 switch (((unsigned char)ptr[0] << 8) \| (unsigned char)ptr[1]) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1416 case 0xFEFF:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1417 if (INIT_ENC_INDEX(enc) == ISO_8859_1_ENC
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1418 && state == XML_CONTENT_STATE)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1419 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1420 *nextTokPtr = ptr + 2;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1421 *encPtr = encodingTable[UTF_16BE_ENC];
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1422 return XML_TOK_BOM;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1423 /* 00 3C is handled in the default case */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1424 case 0x3C00:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1425 if ((INIT_ENC_INDEX(enc) == UTF_16BE_ENC
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1426 \|\| INIT_ENC_INDEX(enc) == UTF_16_ENC)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1427 && state == XML_CONTENT_STATE)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1428 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1429 *encPtr = encodingTable[UTF_16LE_ENC];
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1430 return XmlTok(*encPtr, state, ptr, end, nextTokPtr);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1431 case 0xFFFE:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1432 if (INIT_ENC_INDEX(enc) == ISO_8859_1_ENC
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1433 && state == XML_CONTENT_STATE)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1434 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1435 *nextTokPtr = ptr + 2;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1436 *encPtr = encodingTable[UTF_16LE_ENC];
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1437 return XML_TOK_BOM;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1438 case 0xEFBB:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1439 /* Maybe a UTF-8 BOM (EF BB BF) */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1440 /* If there's an explicitly specified (external) encoding
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1441 of ISO-8859-1 or some flavour of UTF-16
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1442 and this is an external text entity,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1443 don't look for the BOM,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1444 because it might be a legal data. */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1445 if (state == XML_CONTENT_STATE) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1446 int e = INIT_ENC_INDEX(enc);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1447 if (e == ISO_8859_1_ENC \|\| e == UTF_16BE_ENC \|\| e == UTF_16LE_ENC \|\| e == UTF_16_ENC)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1448 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1449 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1450 if (ptr + 2 == end)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1451 return XML_TOK_PARTIAL;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1452 if ((unsigned char)ptr[2] == 0xBF) {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1453 *encPtr = encodingTable[UTF_8_ENC];
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1454 return XML_TOK_BOM;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1455 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1456 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1457 default:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1458 if (ptr[0] == '\0') {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1459 /* 0 isn't a legal data character. Furthermore a document entity can only
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1460 start with ASCII characters. So the only way this can fail to be big-endian
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1461 UTF-16 if it it's an external parsed general entity that's labelled as
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1462 UTF-16LE. */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1463 if (state == XML_CONTENT_STATE && INIT_ENC_INDEX(enc) == UTF_16LE_ENC)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1464 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1465 *encPtr = encodingTable[UTF_16BE_ENC];
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1466 return XmlTok(*encPtr, state, ptr, end, nextTokPtr);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1467 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1468 else if (ptr[1] == '\0') {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1469 /* We could recover here in the case:
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1470 - parsing an external entity
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1471 - second byte is 0
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1472 - no externally specified encoding
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1473 - no encoding declaration
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1474 by assuming UTF-16LE. But we don't, because this would mean when
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1475 presented just with a single byte, we couldn't reliably determine
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1476 whether we needed further bytes. */
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1477 if (state == XML_CONTENT_STATE)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1478 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1479 *encPtr = encodingTable[UTF_16LE_ENC];
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1480 return XmlTok(*encPtr, state, ptr, end, nextTokPtr);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1481 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1482 break;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1483 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1484 }
3127 4e7cefc55971 [gaim-migrate @ 3142] Sean Egan <seanegan@gmail.com> parents: 2086 diff changeset	1485 *encPtr = encodingTable[(int)INIT_ENC_INDEX(enc)];
2086 424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1486 return XmlTok(*encPtr, state, ptr, end, nextTokPtr);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1487 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1488
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1489
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1490 #define NS(x) x
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1491 #define ns(x) x
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1492 #include "xmltok_ns.c"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1493 #undef NS
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1494 #undef ns
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1495
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1496 #ifdef XML_NS
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1497
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1498 #define NS(x) x ## NS
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1499 #define ns(x) x ## _ns
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1500
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1501 #include "xmltok_ns.c"
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1502
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1503 #undef NS
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1504 #undef ns
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1505
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1506 ENCODING *
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1507 XmlInitUnknownEncodingNS(void *mem,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1508 int *table,
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1509 int (convert)(void userData, const char *p),
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1510 void *userData)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1511 {
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1512 ENCODING *enc = XmlInitUnknownEncoding(mem, table, convert, userData);
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1513 if (enc)
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1514 ((struct normal_encoding *)enc)->type[':'] = BT_COLON;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1515 return enc;
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1516 }
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1517
424a40f12a6c [gaim-migrate @ 2096] Eric Warmenhoven <eric@warmenhoven.org> parents: diff changeset	1518 #endif /* XML_NS */

Mercurial > pidgin.yaz

annotate src/protocols/jabber/xmltok.c @ 4245:cd84b0fd63fc