[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[mule-cgreek:00763] Re: iota adscriptum in Unicode
- To: mule-cgreek@xxxxxxxx, ntakahas@xxxxxxxxx
- Subject: [mule-cgreek:00763] Re: iota adscriptum in Unicode
- From: Kenji Mizuochi <knj_miz@xxxxxxxxxxxxx>
- Date: Wed, 21 Jun 2000 01:53:36 +0900
- In-reply-to: <200005260835.RAA16171@etlnao.etl.go.jp>
- References: <200005260835.RAA16171@etlnao.etl.go.jp>
- Reply-to: mule-cgreek@xxxxxxxx
高橋さん、
ちょっと、database.el が一段落つきそうなので、前のメールを読み直していました。
下書のイオタの件ですが、この間「鎌田さんと同じ意見です」と書きましたが、結論
的にはそうなのですが、少し補足したいことがあって書きます。
> Unicode 3.0 では、今の CGreek で使っているのよりもずっとたくさんの文字
> (の組み合わせ) にコードが割り振られています。たとえば
>
> 気息記号 + アクセント + 大文字母音 + 並記のイオタ
>
> なんていうのにも一つ一つ独立したコードが割り振られています。これは今の
> CGreek では
>
> (気息記号 + アクセント) + 大文字母音 + イオタ
>
> と3文字で表示されることになります。で、質問なんですが、
>
> Q1.「気息記号 + 大文字母音」(あるいは「アクセント + 大文字母音」、ある
> いは「気息記号 + アクセント + 大文字母音」)は今まで通り2文字として
> 扱うべきでしょうか、それとも Unicode 流に1文字として扱うべきでしょ
> うか?
>
> Q2.「大文字母音 (気息記号とアクセントはあったりなかったり) + 並記のイ
> オタ」は今まで通り2文字ないし3文字として扱う方べきでしょうか、それ
> とも Unicode 流に1文字として扱うべきでしょうか?
>
> 素人的考えですと、1.は1文字として扱った方が便利なんじゃないかと思いま
> す。大文字と小文字の対応がきれいにとれるからです。
>
> 2.の方はちょっと難問です。手元の本によりますと
>
> a) 固有名詞等で主母音が大文字で書き始められる場合、並記のイオタ自身は
> 小文字のイオタで書かれる
>
> b) すべての文字が大文字で書かれる場合、並記のイオタ自身も大文字になる
>
> ということになっています。が、Unicode 3.0 に入っている「大文字母音 +
> 並記のイオタ」におけるイオタは常に小文字です。つまり、もし Unicode 流
> を採用するとなると、
>
> 「小文字母音 + 下書きのイオタ」と「大文字母音 + 並記の(小文字)イオタ」
> の二者は capitalize-word (M-c) と downcase-word (M-d) で相互変換可能
>
> なのにもかかわらず、ひとたびこれを upcase-word (M-u) で全部大文字にし
> てしまうと、イオタが並記なのかそうでないのかがわからなくなってしまいま
> す。たとえば aima が全部大文字で AIMA と書かれていた場合、このIが並記
> のイオタなのか、それとも独立したイオタなのかを機械的に判断することはで
> きません。これでは検索時に困るのではないでしょうか?
>
> ちょっとややこしい話になったかもしれません。別の言い方をすると、もしで
> きる限り1文字としてまとめて扱う方式を採用した場合、「母音 + 並記のイオ
> タ」という組み合わせ(文字的には1文字)と、「母音」と「独立イオタ」の連
> 続(文字的には2文字)は区別されるべきか否かが知りたいわけです。そんなの
> どっちでもいいよ、というのならもちろんそれでも構いません。
多分このような設定になっているのには、ギリシア語の歴史的経緯の問題がある、
と思います。
(1) 実は、古典ギリシアの時代には、「小文字」はなくて、大文字ばかりでした。
(小文字は、文字を写本として書き写してゆく中で中世にできました。)
(2) また、「下書のイオタ」も古典時代にはなくて、「通常のイオタ」として
一文字で書かれており、前の母音とは別の二文字でした。
(3) さらに、いわゆる「気息記号」、「アクセント記号」も古典時代の写本には
なく、これも中世の文献学者が発明したものです。
(4) また、単語を区切るスペースもなく、すべての単語は (日本語と同様) 続け
て書かれていました。
# 学生時代に、ギリシア語の試験で、すべて大文字ばかりで書かれていて、単
# 語の区切りのない、気息・アクセント記号のないギリシア語を、通常の形式
# に書き直し、訳せ、という問題が出たことがあって、ひどく悪い成績をとっ
# たことがあります (^^;)
# .... 東大の久保正彰先生の授業でした。
というわけで、「碑文」や「写本」の研究などをやろうとする人にとっては、下書
のイオタは、二文字になっていた方がよいわけです。そもそも単語の区切りなどが
問題になってくるわけですから ....
ちょっと答えになっていないのですが、結論的には、両方扱えるようになっていた
方がよい、ということになりましょうか。
ご参考までに。
------------------------------------------
Prof.Kenji Mizuochi 水落 健治
Meijigakuin University
E-Mail: mizuochi@xxxxxxxxxxxxxxxxxxxxx
knj_miz@xxxxxxxxxxxxx
------------------------------------------