[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[cgreek-ja:01106] Re: modern greek in cgreek20



高橋です。

Xのフォント設定や、Emacsのパス設定などは、各Linuxディストリビューショ
ンが各々のポリシーの下にカスタマイズを加えているようです。私はVineを使っ
ていないので、具体的にどうなっているかはわかりません。でもまあ、動いて
いるのですから、とりあえずはいいことにしましょう。

haruichi yabuki writes:

> cgreek21 から Unicode セーブ したファイルに付いて, 例えば
> A. '言'のコードを調べてみると
>   character: 言 (0156100, 56384, 0xdc40)
>     charset: japanese-jisx0208 (JISX0208.1983/1990 Japanese Kanji: ISO-IR-87)
>  code point: 56 64
>      syntax: word
>    category: C:Chinese (Han) characters of 2-byte character sets  
> 	     j:Japanese  
> 	     |:While filling, we can break a line at this character.  
> buffer code: 0x92 0xB8 0xC0
>   file code: 0xE8 0xA8 0x80 (encoded by coding system utf-8-unix)
>        font: -JIS-Fixed-Medium-R-Normal--24-230-75-75-C-240-JISX0208.1983-0

> B. 鋭アクセント付きη のコードを調べてみると
>   character: ... (01234265, 342197, 0x538b5)
>     charset: mule-unicode-0100-24ff  <-------------------------ここ確認しました
> 	     (Unicode characters of the range U+0100..U+24FF.)
>  code point: 113 53
>      syntax: word
>    category: g:Greek   u:Mule unicode characters  
> buffer code: 0x9C 0xF4 0xF1 0xB5
>   file code: 0xE1 0xBD 0xB5 (encoded by coding system utf-8-unix)
>        font: -Etl-Fixed-Medium-R-Normal--24-240-72-72-C-120-ISO10646-1

> '言'の方は unicode coding ではないのですか?

Emacs内部における漢字部分はUnicodeに基づいていません。が、それをファ
イルに書き出すときはまた別の話です。Mule-UCSは、ファイルからメモリに読
み込むとき、またメモリからファイルに書き出すときに、Emacsの内部表現と
Unicode表現の相互変換を行ないます。

> >..日本語部分を Unicode をセーブすることを想定していませんから..
> どうなっているんでしょう??

Mule-UCS無しのEmacsは、Unicodeの漢字部分を扱うことができません。
(Unicodeのギリシア文字、ラテン文字は扱うことができます。) ですから
Mule-UCSを入れない状態で、漢字を含むバッファに対して "Save Unicode
File" を実行しようとすると文句を言われる筈です。

そもそもCGreek21は、Mule-UCSのことをまったく考えずに設計されました。
"Save Unicode File" および "Open Unicode File" というメニューは、非漢
字圏の人向けに作ったものです。漢字が含まれるテキストの場合は、まずギリ
シア文字とアクセント付きラテン文字をTeXの表現に変換してASCII化し、その
後で全体をEUCなりSJISなりで入出力するつもりでした。

ですのでMule-UCSと組み合わせたときに本当にうまく行くかどうか不安だった
のですが、"Save Unicode File" のコードを読み直してみたところ、このまま
でも大丈夫なんじゃないかという気がしてきました。「言」1文字だけのバッ
ファを作り、それを "Save Unicode File" でセーブしてみて下さい。その後
xterm 等から

  $ od -t x1 ファイル名

と打ち、1行目に

  0000000 e8 a8 80

のように出れば、まず大丈夫だと思います。

>> 念のためにギリシア文字の上で C-u C-x = を実行し、2行目に表示される
>> charset が mule-unicode-0100-24ff になっていることを確認して下さい。
> はい, 上の矢印の所ですね. 確認しました.

安心しました。Fedoraの場合はここが思った通りにならず、水落さんと少々悩
みましたから。

-- 
TAKAHASHI Naoto
ntakahas@xxxxxxxx
http://www.m17n.org/ntakahas/