なひです。

> From: UENO Katsuhiro [mailto:unnie / blue.sky.or.jp] 
> Sent: Tuesday, September 24, 2002 6:57 PM

> ある程度の完成を見るまでは parser としての基本性能 (速さと正確さ) の
> 追求のみを行うので、今のところ、Visitor パターンな低レベル
> インターフェースのみの提供となる予定です。

なひの用途にはぴったりです。

> > ちなみにCESはどうなる予定です?$KCODE依存になりますか?
> 
> $KCODE依存になります。そこのところは、pure Ruby で書いている限り
> 仕方のないことだと思ってます。
> 
> ただし、特定の CES に依存した書き方はしていませんし、今後もしない
> つもりです。現時点ですでに $KCODE の変更で扱えるようになる CES
> (EUC-JP, Shift_JIS, US-ASCII系と UTF-8) には全て対応しているはずです。

そう(現時点で全て対応と)理解しています。
xmlscan利用者的には、数値文字参照をどうしたものやらという
問題がありますが、本体としてはしったこっちゃないですね。

Rubyで$KCODE依存になると、かなり広範囲に捕まえないと
スレッドセーフにならないという問題があるため、
REXMLのように「とりあえずUTF8系を仮定」「そうじゃない
ものは可能な単位で変換する(方法を提供)」という
アプローチも、とある用途には合致するでしょう。

とはいえ、REXMLがすでにあるので、xmlscan的には
違うものを目指して欲しいと思います(NQXMLの立場は。。。)

> > SOAP4R的には、整形式でないときにエラーになってくれれば
> > 問題ありません。
> 
> その判定が、結構難しかったりします :)
> 
> pure Ruby で実用的な速さを保ったまま、どこまで整形式制約をチェック
> できるかを xmlscan で挑戦してます。全ての制約を実装できないなら、
> どの制約がなぜチェックされないのかという線引きを明確にしたいと
> 考えてます。

期待しています。