京速計算機とか長崎のアレとかに思うこと
昨日ビスコさんからコメントもらったこともあって、またスパコン周りについてちょっと書こうと思います。
京速計算機に関しては、「凍結されなくて良かったね」、という気持ちと、「やっぱ高ぇよ」って気持ちと両方あります。京速の予算を東大とか東工大に少しでも回してもらえれば、そっちの方が効率いいのかもなぁ、とか思います。TSUBAME の初期導入費は、(当時の)地球シミュレータの年間維持費と同じくらいらしいですからね。
で、昨日書いた、長崎のアレに関しては、正直なところ、「まだ良く分からん」というのが僕の評価です。TOP500 に載せてないし、構成もちゃんとした資料みたいなのがないから良くわかんない。だからあんまり騒がないほうが良いのではないか、と思います。少なくとも、昨日書いたように、コスト面に関してはかなり疑問です。また、そもそも、「あの構成、あの環境で、数十時間落ちず、落とさずに稼動できるんだろーか?」というレベルから疑問だったりします。
あと、「これからのスパコンは、GPU だ」というのは、半分本当で半分嘘だと思います。GPU を使うと FPU がいっぱいあるから、LINPACK の性能は上げやすい(少なくとも理論値はすごく上がる)。でも、実行効率上げるのが大変みたいです。詳しくは知りませんが、バッドノウハウに近いものが沢山必要みたいな感じに思えます。
あと、「専用品は駄目、汎用サーバを横に並べればいいでしょ?」というのは、8割本当で、2割嘘だと思います。確かに Intel や AMD の CPU を使ったサーバを横に並べた方が安価に構築できるっていうのはありますね。
でも、IA サーバ1000台並べて LINPACK を流して、20時間後くらいに結果が出るとして、完走率はどのくらいなんでしょうね?PFlops 狙って10万台とかサーバ並べたら、LINPACK 流して完走するのにどのくらい時間がかかって、どのくらいの完走率なんでしょうか?
それがきついから、GPU を使ってみたり、Venus みたいに FPU がいっぱいついてるスパコン専用 CPU を作ってみたり、ベクトル型にしてみたり、各社いろいろ工夫しているんじゃないのかなぁ。
結論を出すつもりもないので、あんまりまとまっていませんが、こんな感じで。