> > words で区切っておいて、区切った単語ごとに最初の文字と
> > 最後の文字を見て、引用符とか、=とかを解釈しながら、
> > 字句分解する必要がありますね。
> 
> うーん。単純に words で区切るのだと困る場合がありますね。
> <a href="index .html"> とか。

words で区切るのは単純ですけど。そこでできた、文字列リストをもう一度
パースしながらの解釈処理が必要で、それは単純じゃないと思いますが。。。

上の例も、引用符の中の空白をどうのように解釈するかを与えないといけない
のでは。.htmlの前の空白は、パスに含まれている空白なのか、typo による
空白なので、index.html と解釈すべきなのかを決めないとだめだと思います。

いずれにせよ、許容したい ill-formed な場合を形式的に定義しないとちゃんと
書きようがないと思います。

--nobsun



--
ML: haskell-jp / quickml.com
使い方: http://QuickML.com/