堀之内です。

>> > 少なくとも x86 では double も float も演算の速さ
>> > (レイテンシ, スループット) は変わりません。
>> 
>> そうですか。他のアーキテクチャではどうなんでしょうね。
>> 
>> > 一応、Pentium, Pentium Pro, 80386 :) について、資料にあたりました。
>> 
>> 御苦労さまです。
>> 
>> > まあ、最近のプロセッサでは、キャッシュに乗ってる限りは
>> > double だろうと float だろうと速さは変わらないと思います。
>> 
>> となると float な matrix の存在意義がわからないです。
>> やるとしても LAPACK の Sxxxx のサポートは
>> かなり優先順位が低くなると思いますが・・・

なるほど、たいていの場合 float の意義はもとが巨大な場合のメモリー節約
ぐらいなわけですね。ところで、聞きかじりで申し訳ありませんが、MacのG4
かなんか、1GflopsをうたっているCPUがありますが、あれは単精度での話で倍
精度ではだいぶ遅いだろうと聞いたことがあります(単精度計算専用のアクセ
ラレーターを使っているのだとか)。

堀之内 武                 horinout / kurasc.kyoto-u.ac.jp
京都大学超高層電波研究センター    611-0011 宇治市五ヶ庄