XEmacs 21.2.16 UTF-2000 Version 0.3 (今宮) をお送りします。
以下は、UTF-2000 Version 0.2 (JR 難波) からの差分になっています:
[主な変更点]
・--with-mule だけ付けると従来式 MULE 表現になる
・--with-mule と --with-ucs4(新設)を指定すると文字表現のみ UCS-4 にな
る
・--with-mule と --with-utf-2000 を付けると、文字表現が UCS-4, buffer
/ 文字列表現が UTF-8 になる
[既知の問題点]
--with-utf-2000 を指定した場合において、ある特定の状況(詳細は不明)で、
(非 ASCII ?)文字列に対する正規表現の matching が正常な結果を返さない場
合がある
[今後]
将来的には
文字 文字列 buffer
(a) 1 byte 1 byte 1 byte
(b) 現行 MULE 方式 現行 MULE 方式 現行 MULE 方式
(c) UCS-4 現行 MULE 方式 現行 MULE 方式
(d) UCS-4 UTF-8 UTF-8
(e) UCS-4 可動固定長方式 UTF-8
(f) UCS-4 可動固定長方式 可動固定長方式
(g) UCS-4 可動固定長方式 UCS-4
の 7 種類の方式を configure の option で選べるようにしようと思います。
(a) 〜 (d) は既に実現しているので、(e) 〜 (f) を今後作ろうということです。
;; 『可動固定長方式』というのは、Oliver さんが提案している、必要に応じて
;; 1 / 2 / 4 byte に語長を大きくする固定長表現のことです。
--
===『幾千億の分子に分かれても ========================================
決して忘れない。
この宇宙が終るまで』 守岡 知彦 (MORIOKA Tomohiko)
======================================== Email: <tomo(a)etl.go.jp> =====
;; PGP public key:
http://www.etl.go.jp/~tomo/hiko/pgp.key