SPECcpu2000 にみるプロセッサの性能

作成日:2001.10.28
更新日:2004.05.21

SPEC は色々なベンチマークを策定・提供している。 その中でも CPU の性能を見る SPECcpu ベンチマークは有名である。

SPEC のページから代表的なプロセッサについて SPECcpu2000 の結果を 抜き出した (同じプロセッサについて 何種類もの結果が登録されているが、 もっとも高い数値のものを 選んでいる)。
(各ベンチ毎にコンパイラオプションを最適化した Peak 値を掲載)


2002.3.7

このサイトで PowerPC G4 上で SPEC を走らせた結果が掲載されている。
ただし 個人が自分のマシン上で実行したもので ベンチマーク毎に最適化等は行われていない Base 値である。 また、 同サイトで Intel Pentium3 マシンを 計測した結果も合わせて載せておく。

2002.3.10

Intel Pentium4 2.2GMHz、 Pentium3 1.4GMHz、 AMD Athlon XP 2000+、 Sun UltraSPARC III Cu 1050MHz、 IBM POWER4 の データを追加。
あと Alpha 21264C 1001MHz の新データと 富士通の SPARC64 GPも掲載。

全データに Base 値も記載 (括弧内が base 値)。

2002.7.10

Intel Pentium4 2.53GHz、AMD Athlon XP 2100+を追加。
あと、 Intel のホームページ で公開されている Itanium2 の結果を参考値として追加。

2002.9.4

AMD Athlon XP 2600+、SPARC64 GP 810MHz、R14000(600MHz) の結果を載せる。
Itanium2 1GHz、POWER4 1300MHz に関して 新しい結果が更新されていたので修正。

HP から Alpha 21264C の 1250MHz の SPECint2000 の結果が公開
Pentium4 をかわし SPECint2000 では最高点をマークしている。 fp2000値は登録されていない。

p.s.
HP の公開している Itanium2 1GHz の結果は base 値なのにもかかわらず、 ベンチマーク毎にオプションを変えているなどおかしな点が散見される。
2002.9.14

Intel Pentium4 2.8GHz のスコアを追加。 CINT2000の最高スコアを抜き返した。

2002.10.5

グラフの横棒が長くなって見づらいので半分に縮小した。
各ベンチマーク結果の元データもリンクするように変更。

Alpha 21264C の CFP2000 スコアを追加。 僅差で Intanium2 を抜く。
あとオフィシャルなデータではないが Motorola の PowerPC 8500 (G5) が The Register のページ にあったので参考値として載せておく。 Register のページを見る限り クロックと比例して性能が伸びているので、 実測値のようには見えない。

2002.10.9

AMD Athlon XP 2800+ の結果を追加。
2002.10.12

富士通の SPARC 64V 1350MHz の結果を追加。
トップの性能に近づいたのは SPARC アーキとしては優秀?

2002.10.17

IBM から POWER4 のディスクトップ版ともいうべき PowerPC 970 が発表された。
IBM はスコアの予測値を出している (Register)。

また、 Microprocessor Formで AMD の Opteron の スコアの推定値が公開されたらしい。
両方とも、非公式値に載せる。

2002.10.27

Intel が新たに Pentium4 2.8GHz のスコアを公開した。 Pentium4 2.8 GHz のスコアは過去にも公開されていたが、 メモリシステムを PC800-40 RDRAM から PC1066-32 RDRAM に変更しての エントリである。
今回ついに int2000、fp2000 とも 1,000 の大台に載った。 特に int2000 値が 1,000 に到達したのは Pentium4 が初めてである。

また、HP の PA-RISC シリーズの PA-8700+ 搭載マシンのスコアが 公開された。 PA-8700 750MHz → PA-8700+ 875MHz と 周波数的にも性能的にも小幅な進化にとどまるが、 HP が PA-RISC を見捨てずに後続 CPU を出してくれたことが嬉しい。

2002.12.04

新しい Intel Pentium4 3.06GHzAMD Athlon XP 2800+(2000MHz)IBM POWER4+ 1450MHz が公開された。
各プロセッサとも周波数なりの性能向上を得ている。 3.06 GHz の Pentium4 は、 あらたに Hyper-threading 対応し 機能的な向上もあったのだが、 逐次の SPEC CPU2000 ではこの効果は顕れない (CINT2000 Rates、CFP2000 Rates では出るだろうけど...)。

POWER4 は 1300MHz → 1450MHz によって 富士通の SPARC64 V 1300MHz に少し差を付け返した。
すでに性能競争から脱落した MIPS、PA-RISC、 周波数が上がらない SPARC を尻目に Alpha、POWER4、SPARC64 が RISC プロセッサの最強を競っている。 3つの中でどれが最初に Itanium2 の FP スコアを抜くかが楽しみである。

それと Itanium2 1GHz のデータはすでに公開されていが、 HP の Itanium2 搭載機の結果が大量に登録された。 いくつか抜粋して掲載する。
今回登録されたデータは peak 値も公開されているのだが、 相変わらず peak 値 = base 値となっていてあやしい。

2003.01.29

Compaq と合併した HP から最後の EV7 Alpha チップとなる Alpha 21364 搭載マシンの SPEC cpu2000 スコアが公開された。
公開されたのは 1,150MHz と 1,000MHz の 2 種類。
これまでの Alpha 21264C は L2 キャッシュの容量が 16MB と大きかったが、 今回製品化された 21364 は L2 1.75MB。
そのためか Alpha 21364 1,150MHz は Alpha 21264C 1,250MHz に CINT2000 で 928 → 877 と負けている。
しかし、 CFP2000 は 1,356 → 1,482 とスコアを伸ばし、 前回まで最高速だった Itanium2 1GHz のレコード 1,427 を破って、 只今のCFP2000のトップの座に踊り出る。

また公式データではないが Athlon64 の実システムでの SPEC 値が公開された。
ドイツの技術系の雑誌 C't が Intel Compiler Ver.6 を用いて作成したバイナリで、 AMD Athlon64 1.2GHz の結果の SPEC 値を計測している。
SSE2 を使わない場合で SPECint_base2000 が 739、 SPECfp_base2000 が 674
SSE2 を使った場合で SPECint_base2000 が 755、 SPECfp_base2000 が 719 というスコアを得ている。
ただし この Athlon64 は Claw Hammer コアのようで、 AMD が自社ラボで計測し CINT2000 で 1,202、 CFP2000 で 1,170 というスコアを得た Slage Hammer コアのものとは異なるようだ。

ついでに VIA Nehemiahコアの C3 が 発表された
石のターゲットからして ベンダが SPEC CPU ベンチマークにスコアを登録する可能性は低いが、
その他の ベンチマークの結果を紹介しておく。


訂正・備考:
2003.03.07

AMD から Athlon MP 2600+ (2133MHz) のスコアが公開された。
2400+ と比較して SPECint2k が 766 → 781、 SPECfp2k が 650 → 656 と 小幅の改良に留まった。
市場には既に XP 3000+ も出回っているが、 これはスコアの登録なし。

すでに int2k、ftp2k ともに 1,000 を 越えた Pentium4 にじわじわ差を広げられているようだ。

2003.03.12

AMD の Athlon XP 3000+ (2167MHz) のスコアが公開された。
今 CPU からコアが Thoroughbred コアから Barton コアに変更になった。 それに伴いキャッシュ容量が 256K → 512K バイトにアップしている。 また、 PR レートの付け方が変わったようで、 クロック周波数は 2259MHz → 2167MHz と下がっているのに、 2800+ → 3000+ を名乗っている。

(このページの主旨からも) PR レートを名乗るにふさわしいかどうかは SPEC CPU2000 のスコアを比較すればよい。 結果は、 Athlon XP 2800+ → 3000+ (7.1% アップ) で、 INT2000 が 933 → 995 (6.6% アップ)、 FP2000 が 843 → 869 (3.1% アップ) と整数・浮動小数ともわずかにアップ。 とりあえず辛勝といったところか?

だが、 この勝利は AMD の苦心の跡だ。
コンパイラオプションに眼を向けると INT2000 では XP 2800+ で使った Intel C++ Compiler ver5.01 を ver 7.0 に バージョンアップしたり、 ベンチマークによっては わざと最適化レベルを下げたりしている (252.eon は -O2。他は -O3)。
FP2000 では、 XP 2800+ の計測では Intel Fortran 5.0.1 と Compaq Visual Fortran 6.6 を使っていたのに、 XP 3000+ では Intel Fortran 5.0 と Compaq Visual Fortran 6.5 と 先祖返りしている。
Athlon XP 3000+ のスコアが なかなか登録されなかったのも、 ベストなコンパイラオプションを探して 試行錯誤が繰り返されたからに違いない。
# でも SPECfp_base2000 値は 782 → 776 で 逆にスコアが悪くなっている。


その他、 UltraSPARC III Cu 900MHz (Sun Fire V1280)、 SPARC64 V 1350MHz (富士通 PRIMEPOWER900) のスコアを少しだけ更新。
両者は すでにより高い or 同クロックのスコアが公開されているが、 Ultra SPARC 900MHz は FP2000 が、 SPARC64 V 1350MHz は INT2000 が 少しだけよくなったのでこちらにも転載しておく。

あと POWER4+ 1450MHz (IBM pSeries 630) のスコアも 再度登録されたが、 pSeries 650 のスコアの方がよいので転載しない。
2003.04.10

非公式な測定結果だが、 Motorola が PowerPC 7455 (G4) 1.25GHz の SPECint_base2000 スコアを 公開した。
Apple マシン(おそらく PowerMac G4) に Linux 2.4.19 をインストールして計測は行っている。 コンパイラは Wind River の Diab C/C++ Compilerを使用の模様。 結果の SPECint_base2000 スコアは 500

ドイツのIT情報雑誌 C't が公開した PowerPC 7455 (G4) 1.0GHz (PowerMac G4 Dual 1GHz と GCC 2.95.2) の SPECint_base2000 スコア 307 は コンパイラが悪かったと思われる。 今回の方が G4 の実力に近かろう。
# GCC の結果は 252.eon が極端に悪くなっているが、Diab CC の結果は正常になっている。
2003.04.22

本日、AMD の Opteron がいよいよ 発表になった。
SPEC CPU2000、SPECweb@99、TPC-C、MMB2 などの各種ベンチマーク結果が ここで公開されている。

これによると Opteron 144 (1CPU モデル、L2 キャッシュ1MB、1.8GHz) の SPECint2k が 1,170、SPECfp2k が 1,219 を記録。
これまで IA-32 で最速だった Pentium4 3.06GHz の int2k が 1,130、fp2k が 1,103を瞬間最大風力的ながら追い越した!!

2003.04.29

SUN が新しい SPARC チップ UltraSPARC IIIi のスコアを公開。
IIIi が搭載されているのは Sun Fire V210 と V240 で 周波数はちょっと半端な 1002 MHz。 最高スコアを出す V210 で SPECint_2k が 555、SPECfp_2k が 841。 単体性能を追求したチップではないため性能は弱い。

また、UltraSPARC III Cu の 1200MHz のスコアも公開。
こちらは Netra 20、Blade2000、Fire 280R に搭載。 最高スコアを出す Blade2000 の 1CPU モデルでのスコアは SPECint_2k が 722、SPECfp_2k が 1,118。 富士通のチップ(SPARC64 V)に水をあけられていた Sun だが、 ここにきて盛りかえしてきたようだ。 また、 SPEC FP2000 は Blade 2000 の 2CPU モデルでも計測し、 1,344を得ている。 ただこのスコアは、 コンパイラによる自動並列化効果が含まれていると考えられるので 表には載せないことにする。

2003.05.22

AMD の Athlong XP 3200+(2200MHz)、 IBM の POWER4+ 1500/1700MHz が新たに登録された。
また富士通の SPARC64 V 1080/1100/1350MHz が登録された。 1350MHz は同じマシンでの再計測によるリベンジである。

Athlon XP 3200+ のスコアは int2k が 1,080(1,044)、 fp2k が 982(873)
Barton コアになった Athlon XP 3000+ と比較すると周波数なりの性能向上だ。

IBM の POWER4+ のスコアは eServer pSeries 690 Turbo。 int2k で 1,113(1,077)fp2k で 1,699(1,598)
いわゆる RISC 系プロセッサのなかで初めて int2k が 1,000 を越えた。
トップの Pentium4 with HT 3.0GHz の 1,2000、 次点の Opteron 144 の 1,170 にも大きく近づいた。
また、fp2k のスコア 1,699 は、 前回 1位の Alpha 21364 1150MHz の 1,482、 2位の Itanium2 1GHz の 1,427 を大きく追い越しトップに輝いた!

富士通の SPARC64 V 1350MHz はすでに PRIMEPOWER 900 での計測結果が公開されているが、 同じ匡体での4度目の挑戦が行われた模様。
毎回 コンパイラ処理系やオプションが変わってきているので、 SPEC CPU2000 の計測のために涙ぐましい努力が払われているのであろう。
しかし、 結果は int2k で 892(767)、 fp2k で 1,322(1,047)。 フロントラインからは遠のいてしまったようだ。

あと新鮮味はないが、 SUN が新しい Intel Box (Sun Fire V65x; 3.06 GHz Xeon) の fp2k スコアのみを公開した。
スコアは 1,011(1010)。 OS は Red Hat Linux 7.3 で、 コンパイラは Intel 製。

2003.06.26

Apple から IBM PowerPC 970 搭載の Power Mac G5 が発表される。
永らく SPEC CPU2000 に参加していない Apple だが、 VeriTest 社に依頼して Power Mac G5 測定を行ったようだ。
詳細は ここ
。 計測はコンパイルは C/C++ が GCC 3.3、 Fortran77/90 が NAGWare Fortran95 Compiler 4.2 を使用。
結果は int_base2000 が 800、 fp_base2000 が 840
IBM が出した 1.8GHz の 性能予測値が CINT2000 で 937、CFP2000 で 1051。 コンパイラの違いを考えると こんなものかも知れない。
VeriTest のレポートでは DELL の Dimension 8300 (Pentium4 4.0GHz x1)と Precision 650 (Xeon 3.06GHz x1) の SPEC CPU2000 スコアも測定して Power Mac G5 と比較しているが、 DELL マシン側のスコアはかなり低い。
このスコアを巡ってあちらこちらで結構火花が とびっている模様。

NAGWare Fortran95 のドキュメントを見る限り、 SSE2 や Feedback-Directed Optimazition に対応していない模様 (にも関わらず Pentium4 Configuration 中には FDO の指定があるのだが、、、)。 それと INT、FP ともに Power Mac G5 側では設定されている ONESTEP オプション (ファイル全体を一度にコンパイラに掛ける CPU2000 のオプション)が、 指定されていなかったりする。

あと今回の測定を見て一番意外だったのは、 VeriTest 社が FORTRAN コンパイラとして Abosoft ProFortran ではなく NAGWare を使用したこと。 PowerPC 970 では Abosoft ProFortran < NAGWare Fortran95 なのかも知れない。
無論、IBM XL Fotran が一番高速だろうが。。。

追記:(6/28)
NAGWare F95 は FORTRAN のソースをいったん C のソースに変換して、 そこから C コンパイラを呼び出す compiler-compiler だった。 Fortran の FDO オプション(PASSn_FFLAGS)は、 バックエンドの GCC に与える最適化オプションのようだ。
ONESTEP=yes を指定して f95 file1.f file2.f file3.f のように 複数のファイルを与えた時、 NAGWare F95 Compiler がそれらのファイルを すべてまとめて whole program optimize するかどうかは不明。
これまで Motorola の PowerPC 8500 が PPC G5 だと噂されていたが、 Apple が IBM の PowerPC 970 を G5 と認定したので PowerPC 8500 側の記載を変更する。

2003.07.01

Intel が新しい Itanium2 チップを 発表。 クロックは 1.5GHz (L3 キャッシュ 6MB)、1.4GHz (4MB)、1.3GHz (3MB)。 一番 高い 1.5GHz でも $4,226、1.3GHz は $1,338 と随分安くなった。

未登録値だが、hp rx2600 での SPEC CPU2000 のスコアが公開された。 HP-UX 上での SPECint_base2000 のスコアが 1,322、 RedHat Linux AS2.1 上での SPECint_base2000 のスコアが 2,119 と、 本当であれば CINT2000、CFP2000 とも最高値となるスコアである。 何故、int と fp で異なる OS を用いたのかは良く分からない。 TPC スコアは Windows 2003 Server のスコアを発表しているので、 対応 OS すべてに華を持たせたかったのかもしれない。

とりあえず表の末尾に追加。

2003.06.30

VeriTest 社が出した レポート は Pentium4 マシンの測定結果が妙に低いのだが、 Apple バージョンの GCC 3.3 ソースコードを読むうちに その原因と思われるものを特定した (ただし筆者が読んでいるソースコードは Build1402 で、 VeriTest 社が使ったのは Build1379)。
VeriTest 社が CPU2000 に使ったコンパイラオプションは以下の表の通りだが
PoewrPC G5 Pentium4
CXXOPTIMIZE = -fast
COPTIMIZE = -fast
FOPTIMIZE = -O3 -Wc,-fastf
CXXOPTIMIZE = -O3 -march=pentium4 -mfpmath=sse
COPTIMIZE = -O3 -march=pentium4 -mfpmath=sse
FOPTIMIZE = -O3 -Wc,-march=pentium4,-mfpmath=sse
このうち Apple バージョン専用のオプション -fast は、 アーキテクチャ(PowerPC970)と最適化レベル(-O3)を同時に指定するのだが、 それ以外に Relaxed IEEE math operation (-ffast-math) (*1) と Loop unrolling (-funroll-loops) を余分につけてしまう。 VeriTest 社のレポートからは、前者がつくことは伺えるのだが、 後者がつくことは分からない。
だがループアンローリングは AMD が行った Opteron 144 の GCC の測定のコンパイルオプション (123 -funroll-all-loops-funroll-loops と同じ) を見ても分かるように、 SPEC CPU の測定では必ず有効にすべきオプションである (-ffast-math は付けたり 付けなかったりしている)。

近日中に Pentium4 マシンで、 VeriTest のオプションそのままと、 -ffast-math-funroll-loops を 足した場合の SPECint_base2000 の測定をしてみるつもり。
(*1)
浮動小数点演算は丸め誤差が生じるため、 数学的な意味が等しい式変形を行った場合でも 結果が一致しない場合がある (例えば (A + B) * C == A * C + B * C が成立しないことがある)。 -ffast-math は正確さが多少損なわれてもいいので、 高速化を行うオプション。
追記:(7/7)
先週末に NAGWare Fortran95 の トライアルラインセンスを申し込んだ。

(7/10)
米NAGWare に送ったトライアルライセンスの申し込みの断わりが日本法人からくる。
日本在住の人間は日本法人からトライアルライセンスを取得する必要があるようだ。
日本法人からトライアルライセンスを取得するには ベンチマーク公開不可 という規約に従う必要がある。
公開できないデータを取るのは面白くないので トライアルライセンスの取得は断念。
とりあえず FORTRAN 以外の部分を計測することにする。

2003.07.04

www.spec.org に新しいスコアが各種 登録された。
新しく登録されたスコアの中には Pentium4 3.2GHz、Itanium2 1.3/1.5GHz のスコアがある。

Pentium4 のスコアは DELL の登録したもので、 同時に 2.26GHz 〜 3.2GHz のスコアも登録された。 最速の 3.2GHz (DDR4 800MHz system bus) で SPECint2000 が 1,249、fp2000 が 1,285。 周波数が上がった以上にメモリ帯域幅の増大がスコアアップに繋がっているようだ。 一番弱い 2.26GHz (533MHz system bus) マシンは int2k 904、fp2k 965。 これがエントリマシンとは恐ろしい。

Itanium2 1.5GHz は、 7/1 に Intel が hp マシンのスコアを公開してしまったが、 それよりも先に SGI が登録を済ませてしまったようだ。 1.5GHz が ink2k 1,077、fp2k 2,055。 1.3GHz が int2k 875、fp2k 1,783。 計測を行った OS は SGI 独自の Linux ディストロの模様。 浮動小数点は初の 2,000 越え。おめでとう。
ただ 7/1 に公開された hp rx2600 の、 int2k 1,322、fp2k 2,119 という値よりも 落ちている部分が気にかかる。
SGI はItanium 系プロセッサとしては初めて、 base 値とは異なる peak 値の公開した。 Itanium 陣営も最適化オプションを調整する余裕が出てきたのか?

それと新しい CPU ではないが、 富士通 SPARC64 V 1350MHz と SUN UltraSPARC III Cu 1050MHz マシンのスコアが公開された。 SPARC 64 V は PRIMEPOWER650 で int2k が 905、 fp2k が 1,340 で、 少しだけ改善。 UltraSPARC III Cu 1050MHz は過去のスコアよりも悪いので表には加えない。
しかし、SPARC 系は fp2k の 179.art だけが、 10,000 を越えていて異様な感じがする。。。

2003.07.29

HP の Itanium2 サーバー Integrity Server rx2600 (2-way) と rx5670(4-way) の 新しいスコアが登録された。
rx2600 は CINT2000 1,322CFP2000 2,119 で CINT2000、CFP2000 共にレコードを塗り替えた (rx5670 は CINT2000 1,312、 CFP2000 2,108)。

CFP2000 の方は Itanium2 の SGI Altix 3000 が 2,055 をマークしていたので それほど感慨はない。 しかし、CINT2000 の方は Altix 3000 のスコア 1,077 (プロセッサ種類別で前回 5位)から、 Pentium4 3.2GHz の 1,249、Opteron 144 の 1,170、POWER4+ の 1,113 などを ゴボウ抜きにしている。
同じプロセッサでありながら CINT2000 の性能が急速に改善したのは、 コンパイラと OS を切り替えたことが原因だと思われる。
HP は今回 初めて IA-64/HP-UX 11i 上で動く謹製コンパイラ HP C/ANSI C Compiler / HP aC++ Compiler を使用した。 OS/ライブラリの影響も考えられるが HP C/aC++ Coompiler は Intel C/C++ Compiler v7.1 以上に 高速な IA-64 バイナリを生成すると思われる。

2003.08.04

3.06GHz Intel Xeon と 1.0GHz Pentium-M のスコアが登録された。
3.06GHz Xeon は 1MB L3 キャッシュのついたバージョンが CINT2000 1,243、CFP2000 1,152。 512KB の L2 キャッシュのみのバージョンは CINT2000 1,067、CFP2000 1,044。 同系のプロセッサでは、 Pentium4 w/HT 3.2 GHz の方が僅差で負けている。
Pentium4 / Xeon / Xeon MP でキャッシュサイズの違いがあったが、 キャッシュバリエーションが増えすぎて 三者の違いは愛昧になりつつある (値段だけは極端に違うが。。。)。

Pentium-M の方は、HP がブレードサーバー ProLiant BL10e G2 のもの。
SPEC CPU2000 スコアには登場しないだろうと思っていた Pentium-M のスコアであり興味深いデータだ。 結果は CINT2000 687、CFP2000 552。 1.0 GHz の Pentium-M が Pentium3 1.4GHz 並み性能を出しているので IPC(Instruction Per Cycle) が高さが実証される。 しかし、スコアの絶対値としては上位陣とかなり差がついた結果だ。

2003.09.24

数週間前から噂になっていた AMD の Athlon64 系 CPU の SPEC CPU2000 スコアが公開された。
CPU としては Athlon 64 FX-51 (2,200MHz)Athlon 64 3200+ (2,000MHz) の 2 つ。 キャッシュは双方ともに L1 が 64KB(I) + 64KB(D)、L2 が 1MB(I+D)。

Athlon 64 FX-51 は同じ構成のマシンを IA-32 版の Windows XP 上で Intel C/C++/Fortran Compiler と Compaq Visual Fortran (DVF) を 用いてコンパイルしたスコアと、 AMD64 にネイティブに対応した SuSE Linux 9.0 Professional for AMD 64 上で gcc33 (のカスタム) と PGI Fortran 5.0-2 でコンパイルしたスコアの 2 通りが公開されている。
Windows XP のスコアは CINT2000 が 1,447 で Itanium2 1.5GHz の 1,322 を抜いてトップに踊り出た。 CFP2000 は 1,423 で IA-32 系の中では最強。 とはいえ 2,000 台を越えて独走している Itanium2 には大きく水をあけられている。
一方、 SuSE Linux でのスコアは CINT2000 が 1,395、 CFP2000 が 1,378 と Windows XP のスコアにわずかに敗けている。 とはいえ LP32 から LP64 になってこの性能低下で済むのだから GCC の AMD64 最適化はがんばっているようだ。 個別のベンチマークでみると CINT では 181.mcf、186.crafty、252.eon、256.bzip2、CFP では 168.wupwise、172.mgrid、177.mesa、178.galgel、183.equake、191.fma3d は SuSE Linux のうほうが性能が高い。

2003.10.28

SPEC CPU2000 のスコアが大量に登録された。
今回注目株は Intel Pentium4 with HT Technology Extreme Edition 3.2GHz。 CINT2000 が 1,620、CFP2000 が 1,494
これまで CINT2000 の 1位だった AMD Athlon 64 FX-51 からトップの座を奪い返した。
また、面白いことに Intel は CINT2000 のテストを Intel C/C++ Compiler 7.1 と 8.0 の両方でやっている。 7.1 → 8.0 では 181.mcf、252.eon、256.bzip2 がかなり良くなっている。

AMD Opteron 146 (2.0GHz) のスコアも公開された。 Athlon 64 FX-51 (2.2GHz) と同じく 32-bit Windows 系と 64-bit Linux 系の 両方のスコアが公開されている。 傾向は Athlon 64 FX-51 とほどんど同じだが、 周波数分だけスコアは負けている。

その他、 クロックを微妙に上げたりして新装開店した CPU も表にまとめた。
CPUClock
MHz
Cache & Memory Machine & OSCINT2000CFP2000
Intel Pentium4 with HT
Extreme Edition
3,200 L2 512KB(I+D) on chip
L3 2MB(I+D) on chip
PC3200 (800MHz system bus)
Intel D875PBZ M.B.
Windows XP SP1a
1,620 (1,583)
ICC 8.0
1,509 (1,475)
ICC 7.1
1,494 (1,475)
Intel Xeon3,200 L2 512KB(I+D) on chip
L3 1MB(I+D) on chip
PC2100 (533MHz system bus)
DELL Precision Workstation650
Windows XP SP1a
1,262 (1,170) 1,300 (1,291)
AMD Opteron 1462,000 L1 64KB(I)+64KB(D)
L2 1024KB(I+D) on chip
PC3200
ASUS SK8N M.B.
Windows XP SP1a (32-bit)
1,335 (1,271) 1,339 (1,250)
AMD Opteron 1462,000 L1 64KB(I)+64KB(D)
L2 1024KB(I+D) on chip
PC3200
ASUS SK8N M.B.
SuSE Linux ES for AMD64
1,262 (1,170) 1,300 (1,291)
IBM POWER4+1,700 L1 64KB(I)+32KB(D)
L2 1536KB(I+D) on chip
L3 128MB per MCM
pSeries 655
SLES8
-,--- (1,031) -,--- (1,401)
Sun Ultra SPARC IIIi1,280 32KB(I)+64KB(D) on chip
L2 1MB(I+D) off chip
Sun Fire V250
Solaris9
702 (612) 1,054 (954)
Sun Ultra SPARC III Cu1,200 32KB(I)+64KB(D) on chip
L2 8MB(I+D) off chip
Sun Fire V880
Solaris9
700 (625) 1,082 (923)

p.s.
今日はこのページの 2 周年みたいだ。


2003.12.16

今月・先月ともにあまり目新しい動きはないが、 AMD の Opteron は地道に周波数をあげて Opteron 148 では CINT2000 で 1,477(Windows XP 32-bit)、 CFP2000 で 1,514(SuSE Linux 9.0 64-bit) を達成。 int は Athlon 64 FX-51 と同点の 2 位。fp は Itanium2 1.5GHz、POWER4+ 1.7GHz に続く 3 位。
AMD は今回も Opteron 148 の同一マシンで、 Windows XP 32-bit (コンパイラは ICC 7.0 / IFC 7.0 & CVF 6.6) と SuSE Linux 9.0 (コンパイラは optimized gcc 3.3.1 / PGI Fortran 5.1-0) の両方の OS でデータを測定している。 そして驚くべきことに fp は Linux (AMD64) での測定が Windows XP (IA-32) での測定をわずかながら上回った。 PGI の AMD-64 向け最適化はかなりがんばっているようだ。

また、HP の 1.3 GHz Itanium2 マシン(HP Integrity Server rx2600) は CINT2000 で 1,073 (HP-UX 11i)、 CFP2000 で 1,814 (Red Hat Linux AS 2.1) が出ている。 他社の 1.5GHz Itanium2 と同じぐらいの性能が出ている (int と fp で同じ構成・同じ OS で採取したデータがないので、表には載せない)。


2004.01.28

1/19 の日記 にも書いたが、 PathScale という会社が AMD64 / Linux 用の C / C++ / Fortran コンパイラを開発している。 まだベータだが SPEC CPU2000 を実行して計測ができるところまでは完成していて、 Opteron 248 2.2GHz のシステムで CINT2000 で 1,346CFP2000 で 1,631 とのこと。 fp の 1,631 は AMD64 システムとしては最速。 PGI の Fortran コンパイラの強力な対抗馬が現れた。

またあまりデータの出てこない Pentium-M プロセッサーの SPEC 値を、 手持ちの ThinkPad T40 (2373) を使って 計測してみた(1/28の日記)。 ノートにインストールした Windows XP 上での計測だが、 base 値で int_base2000 が 1,008fp_base2000 が 740 が得られた。 使用したコンパイラは ICC/IFC 8.0。 int だけだと 1.5GHz の Pentium-M は 2.8GHz の Pentium4 に 匹敵していることが分かる。

今回から www.spec.org 以外から入手したデータも 灰色の網掛をした上で同じ表の中に記載することに変更。


2004.03.25

IBM PowerPC 970 系 の非公式な計測結果を 何点が追加した。


2004.05.06

AMD64 用の C/C++/FORTRAN コンパイラを作っている PathScale が PathScale EKO Compiler Suite を使った結果を SPEC に正式に登録した。 これまで SPEC CPU2000 はプロセッサメーカーかハードウェアメーカーしか登録していなかったので、 「純粋なコンパイラ屋」が登録して来たのは初めてのことではないだろうか?

スコアは 2.2GHz Opteron / SuSE Linux 9.0 for AMD64 上で SPECint2000 が 1,452 SPECfp2000 が 1,691 となる。 データのある AMD64 系では最速だ。
他のアーキテクチャと比較すると、 CINT は Pentium4 with HT Extreme Edition 3.4GHz の 1,705 に続く 2 位。
CFP は Itanium2 1.5GHz の 2,161POWER4+ 1700MHz の 1,776 に続く 3 位。 P4 w/HT EE 3.4GHz の 1,556 に僅かながら勝っている。


2004.05.21

Opteron 150 (2400MHz) の SPEC CPU2000 スコアが登録。
今回も 64-bit Linux (SuSE Linux 8.0) と 32-bit Windows (Windows XP) の両方のスコアがのる。

CINT2000 は

CFP2000 が

CFP2000 の Linux 環境の測定は PGI Fortran の代わりに PathScale EKO Compiler Suite を使うと、 もっとスコアが伸びるかもしれない。

今回の計測で特に面白いのは、 32-bit Windows 環境で Intel C++/Fortran Compiler に加えて Windows 版の PGI Fortran 5.1 を使用している点。 PGI を使ったのは 168.wupwise (F77)、172.mgrid (F77)、178.pgf90 (F90)、200.sxtrack (F77)、 IFC を使ったのは 171.swim (F77)、187.facerec (F90)、189.lucas (F90)、191.fma3d (F90)、201.apsi (F77) でありベンチマーク毎にどちらが速いかは異なるようだ (括弧内は Fortran の仕様)。
SPECfp_base2000 の計測には PGI 側を使用している。
過去には AMD に特化したコンパイラを作ってもらえず Intel コンパイラを泣く泣く使っていた時代もあったが、 そういう状況からは脱却しつつあるようだ。


2004.06.24

富士通から 1890MHz SPARC64 V を搭載した PRIMEPOWER 650/900 の SPEC CPU2000 スコアが公開された。
1350MHz から 1890MHz へのクロックアップで CINT2000 で 1345(1174)、 CFP2000 で 1803(1510) というスコアを叩き出した。
(向こうはそう思っていないが) SPARC64 V のライバルだった 1700MHz POWER4+ を CINT2000、CFP2000 の両方で抜いたことになる。
# もっともスコアが公開されていないが POWER5 があるので IBM が負けたわけではないが、、、

各アーキテクチャーの CINT2000 スコアの TOP5 を載せると

  1. Pentium4 with HT Extreme Edition (3.4GHz)
  2. Opteron 150 (2.4GHz)
  3. Itanium2 (1.5GHz)
  4. SPARC64V (1.89GHz)
  5. POWER4+ (1.7GHz)

CFP2000 スコアの TOP5 を載せると

  1. Itanium2 (1.5GHz)
  2. SPARC64V (1.89GHz)
  3. POWER4+ (1.7GHz)
  4. Opteron 248 (2.2GHz)
  5. Pentium4 with HT Extreme Edition (3.4GHz)

Alpha は浮動小数点演算能力で TOP5 に入っていたのだが、 SPARC64V の追加で追い出されてしまった。南無三。


2004.07.20

AMD から Athlon64 FX-53 (2.4GHz) のスコアと、 DELL から Intel Pentium M 755 (2.0GHz) のスコアが公開される。

Athlon64 FX-53 は CINT2000 が 1700(1601) で、 CFP2000 が 1597(1504)
CINT2000 は Operon 1500 よりもスコアが高くなり、 Pentium4 with HT EE に続き 2 位。

Pentium M 755 は CINT2000 が 1541(1528) で、 CFP2000 が 1088(1087)
整数系のスコアは Itanium2 よりも高くなり、 Intel の CPU の中では Pentium4 系 > Pentium M 系 > Itanium2 系の順位。


2004.08.06

IBM POWER5 1900MHz、1650MHz の fp スコアが登録される。
1900MHz は CFP2000 が 2702 となり、 これまでトップだった Itanium2 の 2161 を大きく上回ることに。


2004.08.13

DEC → Compaq → Hewlett-Packard と奇妙な運命をたどった Alpha 21x64 Chip だが まだ新しい製品が発売されている。
Alpha21364 搭載の最新マシン AlphaServer GS1280 7/1300 で 周波数は 1300MHz に達した。
SPECcpu2000 の登録スコアは int2000 で 994、 fp2000 で 1,684
fp は Pentium4 系を越え、POWER5、Itanium2、SPARC64 V、Opteron に続く 5 位。


2004.09.01

先月のうちに IBM POWER5 1900MHz、1650MHz の int スコアが登録されていた。
fp は先月の頭に登録されて Itanium2 を越えてトップに踊り出たが、 int は遅れての発表。
結果は SPECint2000 で 1,452。 SMT は当然オフにして計測。
他のアーキテクチャーと比較すると、 1,700 台の Pentium4 系や Athlon64、1,541 ポイントの Petnium M 755 (2.0GHz) には一歩及ばず。 とはいえ 1,404 ポイント の Itanium2 1500MHz、1,345 ポイントの SPARC64V 1890MHz は凌駕。


2004.10.26

AMD から Athlon64 FX-55 (2.6GHz) のスコアが公開される。
SPECint2000 が 1,854 となり、 Petnium4 w/HT EE 3.4GHzを越えて全アーキテクチャー最速に踊りです。
SPECfp2000 は 1,782 で、 Itanium2、POWER5、SPARC64V が上にいるが IA-32 系としては最速。

その他、めぼしいところでは Supermicro の Prescott コアの Xeon 3.6GHz のスコアが公開された。
ただ スコアは int2000 が 1,481、 fp2000 が 1,375 と振るわず。 システムバスが 533MHz → 800MHz に向上したものの L3 キャッシュがないのが響いたのか、 ベンチマーク馴れしていない Supermicro の計測のためなのかは不明。


2004.11.20

新しい Itanium2 チップ(コードネーム:Madison) を搭載したサーバーが各社から発表され、 SPECcpu2000 スコアも公開された。 数社が発表しているうち一番高速な HP の rx4640 は、 int2000 が 1,590fp2000 が 2,712。 fp は久しぶりに一位に返り咲き。 int は IA-32/AMD64 勢に続き 3位に浮上している。 新チップは製造プロセスを 0.18μメートルから 0.13μメートルに変更し、 オンチップのキャッシュを 9MB に拡張したもの。

その他、AMD Opteron 250 (2.4GHz) と Intel Xeon 3.6GHz のスコアが加わっているが、 順位等に変動はなし。


2004.12.29

IBM が eServer BladeCenter JS20 のスコアを公開してきた。 JS20 は 2.2GHz の PowerPC 970 を搭載したブレードサーバー。 Apple が VeriTest に依頼して計測した PowerMac G5 (PowerPC970 2.0GHz) の 計測結果 は 一般には公開されていたが spec に登録はされなかった。 これが正式登録された最初の PowerPC 970 の SPEC cpu スコアになる。

JS20 の結果は、OS は AIX で、コンパイラは本家 IBM XL C/C++ V7.0 と XL Fortran V9.1 を使って計測。 PowerPC の真骨頂が得られる構成だ。 しかし、 結果は int2000 が 1,040、 fp2000 が 1,241。 VeriTest の計測結果 (int_base2000 で 800、fp_base2000 で 840) と 比較すると周波数向上分以上の結果を得られているが、 インフレーションしつつある他の CPU アーキテクチャーには一歩譲ってしまう。 やはりキャッシュが L2 で 512KB までしか搭載していないのが

その他、 新しい CPU としては Intel の Pentium4 w/HTT Extreme Extreme Edition の 3.46GHz、3.80GHz が公開された。 3.46GHz が int2000 が 1,772、 fp2000 が 1,724。 3.80GHz が int2000 が 1,671、 fp2000 が 1,842。 fp2000 としては Itanium2、POWER5 に続き 3 位に浮上。


TOP    掲示板    戻る
Written by NAKAMURA Minoru, Email: nminoru atmark nminoru dot jp, Twitter:@nminoru_jp