[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[cgreek-ja:01106] Re: modern greek in cgreek20
高橋です。
Xのフォント設定や、Emacsのパス設定などは、各Linuxディストリビューショ
ンが各々のポリシーの下にカスタマイズを加えているようです。私はVineを使っ
ていないので、具体的にどうなっているかはわかりません。でもまあ、動いて
いるのですから、とりあえずはいいことにしましょう。
haruichi yabuki writes:
> cgreek21 から Unicode セーブ したファイルに付いて, 例えば
> A. '言'のコードを調べてみると
> character: 言 (0156100, 56384, 0xdc40)
> charset: japanese-jisx0208 (JISX0208.1983/1990 Japanese Kanji: ISO-IR-87)
> code point: 56 64
> syntax: word
> category: C:Chinese (Han) characters of 2-byte character sets
> j:Japanese
> |:While filling, we can break a line at this character.
> buffer code: 0x92 0xB8 0xC0
> file code: 0xE8 0xA8 0x80 (encoded by coding system utf-8-unix)
> font: -JIS-Fixed-Medium-R-Normal--24-230-75-75-C-240-JISX0208.1983-0
> B. 鋭アクセント付きη のコードを調べてみると
> character: ... (01234265, 342197, 0x538b5)
> charset: mule-unicode-0100-24ff <-------------------------ここ確認しました
> (Unicode characters of the range U+0100..U+24FF.)
> code point: 113 53
> syntax: word
> category: g:Greek u:Mule unicode characters
> buffer code: 0x9C 0xF4 0xF1 0xB5
> file code: 0xE1 0xBD 0xB5 (encoded by coding system utf-8-unix)
> font: -Etl-Fixed-Medium-R-Normal--24-240-72-72-C-120-ISO10646-1
> '言'の方は unicode coding ではないのですか?
Emacs内部における漢字部分はUnicodeに基づいていません。が、それをファ
イルに書き出すときはまた別の話です。Mule-UCSは、ファイルからメモリに読
み込むとき、またメモリからファイルに書き出すときに、Emacsの内部表現と
Unicode表現の相互変換を行ないます。
> >..日本語部分を Unicode をセーブすることを想定していませんから..
> どうなっているんでしょう??
Mule-UCS無しのEmacsは、Unicodeの漢字部分を扱うことができません。
(Unicodeのギリシア文字、ラテン文字は扱うことができます。) ですから
Mule-UCSを入れない状態で、漢字を含むバッファに対して "Save Unicode
File" を実行しようとすると文句を言われる筈です。
そもそもCGreek21は、Mule-UCSのことをまったく考えずに設計されました。
"Save Unicode File" および "Open Unicode File" というメニューは、非漢
字圏の人向けに作ったものです。漢字が含まれるテキストの場合は、まずギリ
シア文字とアクセント付きラテン文字をTeXの表現に変換してASCII化し、その
後で全体をEUCなりSJISなりで入出力するつもりでした。
ですのでMule-UCSと組み合わせたときに本当にうまく行くかどうか不安だった
のですが、"Save Unicode File" のコードを読み直してみたところ、このまま
でも大丈夫なんじゃないかという気がしてきました。「言」1文字だけのバッ
ファを作り、それを "Save Unicode File" でセーブしてみて下さい。その後
xterm 等から
$ od -t x1 ファイル名
と打ち、1行目に
0000000 e8 a8 80
のように出れば、まず大丈夫だと思います。
>> 念のためにギリシア文字の上で C-u C-x = を実行し、2行目に表示される
>> charset が mule-unicode-0100-24ff になっていることを確認して下さい。
> はい, 上の矢印の所ですね. 確認しました.
安心しました。Fedoraの場合はここが思った通りにならず、水落さんと少々悩
みましたから。
--
TAKAHASHI Naoto
ntakahas@xxxxxxxx
http://www.m17n.org/ntakahas/