>>>>> In [utf-2000 : No.00036]
>>>>> "山岡" = Katsumi Yamaoka <yamaoka(a)jpl.org> wrote:
山岡> 某 ML で飛び交っているメールの
山岡> Content-Type: text/plain; charset=UTF-8
山岡> Content-Transfer-Encoding: quoted-printable
山岡> なパートが読めないのですが (^^;;)、私は XEmacs の build に失敗し
山岡> ているのでしょうか?
;; 失敗しているとしたら、UTF-2000 を日常用途に使っていることではないか
;; と。(^_^;
山岡> 文脈から想像するに、それらの記事では Mule-UCS-0.52 が使われてい
山岡> て、次のように encode されていますが、
山岡> "奥" -> "=E5=A5=A5"
山岡> "岡" -> "=E5=B2=A1"
山岡> XEmacs 21.2.19 + UTF-2000-MULE 0.7 では以下のように encode され
山岡> ます。
山岡> "奥" -> "=F8=BB=86=A9=83"
山岡> "岡" -> "=F8=BB=86=A9=91"
山岡> また、続く二つのパートにはどちらも同じ文章が書かれていて、XEmacs
山岡> では正しく (?) 読むことができます。
現在の UTF-2000 では MULE-charset と BMP の統合漢字との変換は実装され
ていません。このため、BMP の font があって、それを ucs-bmp に設定すれ
ば読めるかも知れませんが、ISO/IEC 2022 の図形文字集合用の font を使っ
て統合漢字を表示することはできないし、また、ISO/IEC 2022 の図形文字集
合と符号位置から BMP に変換することもできません。代わりに、0群の私用
領域に1対1に写像されます。
近い将来に多 byte 文字集合に対して任意の変換表を設定する機能が用意され、
それを使って XEmacs-UCS (ucs-conv) と同様に BMP の統合漢字と相互に変換
することが可能になるのではないかと思います。しかしながら、現在は、
UTF-2000 を使って日本語を含む utf-8 を扱うのは現実的ではないでしょう。
--
匿名希望 (^_^;