From ruby-math-admin@netlab.co.jp Thu Apr 27 12:29:14 2000 Received: from voscc.nagaokaut.ac.jp (voscc.nagaokaut.ac.jp [133.44.1.100]) by blade.nagaokaut.ac.jp (8.8.8/8.8.8/Debian/GNU) with ESMTP id MAA03104 for ; Thu, 27 Apr 2000 12:29:14 +0900 Resent-From: ruby-math-admin@netlab.co.jp Received: from hoyogw.netlab.co.jp by voscc.nagaokaut.ac.jp id MAA92569; Thu, 27 Apr 2000 12:25:10 +0900 (JST) Received: from hoyogw.netlab.co.jp (matz@localhost [127.0.0.1]) by hoyogw.netlab.co.jp (8.9.3+3.2W/3.7W/1.3) with SMTP id MAA16303 for ; Thu, 27 Apr 2000 12:25:09 +0900 Date: Thu, 03 Feb 2000 03:01:54 +0900 From: SHUDO Kazuyuki Reply-To: ruby-math@netlab.co.jp Subject: [ruby-math:00222] Re: [LAPACK] order To: ruby-math@netlab.co.jp Message-Id: <20000203030154K.shudoh@muraoka.info.waseda.ac.jp> In-Reply-To: <200002020945.SAA15504@tsuda4.kurasc.kyoto-u.ac.jp> References: <20000202183347M.takashi@localhost> <200002020945.SAA15504@tsuda4.kurasc.kyoto-u.ac.jp> X-ML-Name: ruby-math X-Mail-Count: 00222 X-MLServer: fml [fml 2.2]; post only (only members can post) X-ML-Info: If you have a question, send a mail with the body "# help" (without quotes) to the address ruby-math-ctl@netlab.co.jp; help= X-Mailer: Mew version 1.95b2 on XEmacs 21.1 (Acadia) X-Dispatcher: imput version 991007(IM132) Mime-Version: 1.0 Content-Type: Text/Plain; charset=iso-2022-jp Content-Transfer-Encoding: 7bit Precedence: bulk Resent-To: poffice@blade.nagaokaut.ac.jp Resent-Date: Thu, 27 Apr 2000 12:25:07 +0900 Resent-Message-Id: <200004271225.FMLAAA16289.ruby-math@netlab.co.jp> 首藤です。 堀之内さん wrote: > 聞きかじりで申し訳ありませんが、MacのG4かなんか、 > 1GflopsをうたっているCPUがありますが、あれは単精度での話で > 倍精度ではだいぶ遅いだろうと聞いたことがあります (以下、嘘が混じる可能性が高いです…) AMD の Athlon では浮動小数点演算のピーク性能は、 クロック周波数 x 2 flops となります。 例えば Athlon 800 MHz の場合は 1.6 Gflops です。 これはどういうからくりかと言いますと、まず 3D Now! の積和演算命令 (fmac: fused multiply and accumulate) を使います。 1命令で乗算、加算の 2演算です。2クロックあたり 1命令のスループットなので、 1クロックあたり 1演算と数えます。 これと同時に FPU を使ってクロックあたり 1演算を行えば、 合計してクロックあたり 2演算という計算になります。 3D Now! の積和演算命令は「単精度の」浮動小数点数だけを扱えます。 つまり、クロック周波数 x 2 flops というピーク性能は 単精度数の演算でのみ達成できるということになります。 G4 (PowerPC) でもこれと同じような数え方で、 500 MHz の場合 1 Gflops ということになるのだと思います。 PowerPC は積和演算命令を持ってますし。 > (単精度計算専用のアクセラレーターを使っているのだとか)。 というわけで、積和演算命令が単精度数のみを扱えるから、に一票。 PowerPC の資料が手もとにないので確実なことは言えないんですが… SHUDO Kazuyuki/首藤一幸 私をたばねないで あらせいとうの花のように shudoh@muraoka.info.waseda.ac.jp