emacs: admin/charsets/mapconv annotate

annotate admin/charsets/mapconv @ 89746:b7afe7c870d3

In UNICODE2 case, sort by 4th field after running an awk program.

author	Kenichi Handa <handa@m17n.org>
date	Sun, 25 Jan 2004 23:37:19 +0000
parents	a750cf193ec6
children	59bbae51ad73

rev	line source
88123 375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	1 #!/bin/sh
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	2 #
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	3 # Copyright (C) 2003
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	4 # National Institute of Advanced Industrial Science and Technology (AIST)
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	5 # Registration Number H13PRO009
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	6 #
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	7 # This file is part of GNU Emacs.
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	8 #
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	9 # GNU Emacs is free software; you can redistribute it and/or modify
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	10 # it under the terms of the GNU General Public License as published by
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	11 # the Free Software Foundation; either version 2, or (at your option)
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	12 # any later version.
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	13 #
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	14 # GNU Emacs is distributed in the hope that it will be useful,
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	15 # but WITHOUT ANY WARRANTY; without even the implied warranty of
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	16 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	17 # GNU General Public License for more details.
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	18 #
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	19 # You should have received a copy of the GNU General Public License
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	20 # along with GNU Emacs; see the file COPYING. If not, write to the
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	21 # Free Software Foundation, Inc., 59 Temple Place - Suite 330,
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	22 # Boston, MA 02111-1307, USA.
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	23
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	24 # Comment:
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	25 # Convert charset map of various format into this:
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	26 # 0xXX 0xYYYY
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	27 # where,
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	28 # XX is a code point of the charset in hexa-decimal,
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	29 # YYYY is the corresponding Unicode character code in hexa-decimal.
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	30 # Arguments are:
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	31 # $1: source map file
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	32 # $2: address pattern for sed (optionally with substitution command)
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	33 # $3: format of source map file
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	34 # GLIBC-1 GLIBC-2 GLIBC-2-7 CZYBORRA IANA UNICODE YASUOKA MICROSOFT
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	35 # $4: awk script
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	36
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	37 BASE=`basename $1`
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	38
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	39 case "$3" in
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	40 GLIBC*)
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	41 SOURCE=`echo $1 \| sed 's/.$glibc.$$/\1/'`;;
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	42 CZYBORRA)
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	43 SOURCE="http://czyborra.com/charsets/${BASE}";;
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	44 IANA)
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	45 SOURCE="http://www.iana.org/assignments/charset-reg/${BASE}";;
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	46 UNICODE)
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	47 SOURCE="http://www.unicode.org/Public/MAPPINGS/.../${BASE}";;
89742 a750cf193ec6 Handle UNICODE2. Kenichi Handa <handa@m17n.org> parents: 88123 diff changeset	48 UNICODE2)
a750cf193ec6 Handle UNICODE2. Kenichi Handa <handa@m17n.org> parents: 88123 diff changeset	49 SOURCE="http://www.unicode.org/Public/MAPPINGS/.../${BASE}";;
88123 375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	50 YASUOKA)
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	51 SOURCE="http://kanji.zinbun.kyoto-u.ac.jp/~yasuoka/.../${BASE}";;
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	52 MICROSOFT)
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	53 SOURCE="http://www.microsoft.com/globaldev/reference/oem/${BASE}";;
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	54 *)
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	55 echo "Unknown file type: $3";
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	56 exit 1;;
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	57 esac
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	58
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	59 echo "# Generated from $SOURCE"
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	60
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	61 if [ -n "$4" ] ; then
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	62 if [ -f "$4" ] ; then
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	63 AWKPROG="gawk -f $4"
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	64 else
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	65 echo "Awk program does not exist: $4"
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	66 exit 1
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	67 fi
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	68 else
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	69 AWKPROG=cat
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	70 fi
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	71
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	72 if [ "$3" == "GLIBC-1" ] ; then
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	73 # Source format is:
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	74 # <UYYYY> /xXX
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	75 sed -n -e "$2 p" < $1 \
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	76 \| sed -e 's,<U$[^>]$>[ ]/x$..$.*,0x\2 0x\1,' \
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	77 \| sort \| ${AWKPROG}
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	78 elif [ "$3" == "GLIBC-2" ] ; then
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	79 # Source format is:
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	80 # <UYYYY> /xXX/xZZ
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	81 sed -n -e "$2 p" < $1 \
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	82 \| sed -e 's,<U$[^>]$>[ ]/x$..$/x$..$.*,0x\2\3 0x\1,' \
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	83 \| sort \| ${AWKPROG}
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	84 elif [ "$3" == "GLIBC-2-7" ] ; then
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	85 # Source format is:
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	86 # <UYYYY> /xXX/xZZ
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	87 # We must drop MSBs of XX and ZZ
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	88 sed -n -e "$2 p" < $1 \
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	89 \| sed -e 's/xa/x2/g' -e 's/xb/x3/g' -e 's/xc/x4/g' \
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	90 -e 's/xd/x5/g' -e 's/xe/x6/g' -e 's/xf/x7/g' \
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	91 -e 's,<U$[^>]$>[ ]/x$..$/x$..$.*,0x\2\3 0x\1,' \
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	92 \| tee temp \
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	93 \| sort \| ${AWKPROG}
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	94 elif [ "$3" == "CZYBORRA" ] ; then
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	95 # Source format is:
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	96 # =XX U+YYYY
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	97 zcat $1 \| sed -n -e "$2 p" \
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	98 \| sed -e 's/=$..$[^U]U+$[0-9A-F]$.*/0x\1 0x\2/' \
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	99 \| sort \| ${AWKPROG}
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	100 elif [ "$3" == "IANA" ] ; then
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	101 # Source format is:
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	102 # 0xXX 0xYYYY
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	103 sed -n -e "$2 p" < $1 \
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	104 \| sed -e 's/$0x[0-9A-Fa-f]$[^0]$0x[0-9A-Fa-f]$./\1 \2/' \
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	105 \| sort \| ${AWKPROG}
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	106 elif [ "$3" == "UNICODE" ] ; then
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	107 # Source format is:
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	108 # YYYY XX
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	109 sed -n -e "$2 p" < $1 \
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	110 \| sed -e 's/$[0-9A-F]$[^0-9A-F]$[0-9A-F]$./0x\2 0x\1/' \
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	111 \| sort \| ${AWKPROG}
89742 a750cf193ec6 Handle UNICODE2. Kenichi Handa <handa@m17n.org> parents: 88123 diff changeset	112 elif [ "$3" == "UNICODE2" ] ; then
a750cf193ec6 Handle UNICODE2. Kenichi Handa <handa@m17n.org> parents: 88123 diff changeset	113 # Source format is:
a750cf193ec6 Handle UNICODE2. Kenichi Handa <handa@m17n.org> parents: 88123 diff changeset	114 # 0xXXXX 0xYYYY # ...
a750cf193ec6 Handle UNICODE2. Kenichi Handa <handa@m17n.org> parents: 88123 diff changeset	115 sed -n -e "$2 p" < $1 \
a750cf193ec6 Handle UNICODE2. Kenichi Handa <handa@m17n.org> parents: 88123 diff changeset	116 \| sed -e 's/$[0-9A-Fx]$[^0]$[0-9A-Fx]$./\1 \2/' \
89746 b7afe7c870d3 In UNICODE2 case, sort by 4th field after Kenichi Handa <handa@m17n.org> parents: 89742 diff changeset	117 \| ${AWKPROG} \| sort -n -k 4,4
88123 375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	118 elif [ "$3" == "YASUOKA" ] ; then
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	119 # Source format is:
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	120 # YYYY 0-XXXX (XXXX is a Kuten code)
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	121 sed -n -e "$2 p" < $1 \
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	122 \| sed -e 's/$[0-9A-F]$[^0]0-$[0-9]$./0x\2 0x\1/' \
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	123 \| sort \| ${AWKPROG}
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	124 elif [ "$3" == "MICROSOFT" ] ; then
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	125 # Source format is:
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	126 # XX = U+YYYY
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	127 sed -n -e "$2 p" < $1 \
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	128 \| sed -e 's/$[0-9A-F]$.U+$[0-9A-F]$./0x\1 0x\2/' \
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	129 \| sort \| ${AWKPROG}
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	130 else
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	131 echo "Invalid arguments"
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	132 exit 1
375f2633d815 New directory Kenichi Handa <handa@m17n.org> parents: diff changeset	133 fi

Mercurial > emacs

annotate admin/charsets/mapconv @ 89746:b7afe7c870d3