最近の拡張(Xeonプロセッサ)と問題点

2002年秋から2003年春にかけて、Pentium IIIと同じく デユアル・プロセッサ構成
 (1枚のマザーボードに2個のcpu搭載)が可能である
Xeonプロセッサ(2.4GHz)
 x 2cpu
のユニットを追加しました。

○ Xeonプロセッサには、メモリー待ちで待機中のプロセッサをタイムシェアリング的
 に有効利用する
hyperthreadingテクノロジー が組み込まれています。
   しかしながら、筆者たちが用いる「等分割タスクを生成 -- MPI通信でタスク間で
 データ交換、同時演算」タイプの、同期実行を必要とする並列化プログラムでは、
 性能はかえって低下します。これは、等分割された複数(2個)のタスクが物理的に
 1個のプロセッサを共有するため、
並列化やMPI通信のオーバーヘッドによるロス
 のほうが大きいためと思われます。
  一方、すべての物理プロセッサを使い切っていない場合でも、複数のタスクが同じ
 プロセッサ上にのることがあり、これも同期実行型のジョブで hyperthreading機能が
 好ましくない点です (CPU0とCPU2が同一プロセッサ上の論理プロセッサ)。

○ BIOSで
hyperthreading機能オフにしたところ、同期実行型ジョブの実行速度
 が向上しました。Pentium III(1GHz) x 2cpuに比べ、Xeon(2.4GHz) x 2cpu では、
 最大で 
2.2倍の演算性能(Wallclock timeで)が得られました。
   ただし、この性能向上はかなりジョブの性格(サイズ)によります。これは、CPUと
 メインメモリ間のデータ転送バンド幅が原因と思われます。
 
参考: Pentium 4の導入と性能 (English)

● PCクラスターの最大の利点は、高い性能と低コストにあります。初期投資額と
 メインテナンスの費用は同程度の総合性能をもつRISCマシンと比べても数分の1、
 スーパーコンピュータとでは10から100倍の価格差になります。
  しかしながら、一部のハードウェア(主としてHDD)の耐久性にやや問題があります。
 超長時間のプログラムを実行する時には、バックアップ用のRAIDを採用する、
 リスタート用に中間データを随時書き出す、などして積極的にエラーを回避する策
 が必要でしょう。
  また、排熱用ファンの静音対策が考慮されていないことが多く(特に自作マシン)、
 マシンの冷却もある程度必要なことから、居室に設置する場合は注意したほうが
 よいでしょう。


● コストフリーのUNIX OSである
Linuxは、その安定性と軽快な動作、機能の豊かさ、
 カスタマイズしやすさから、PCクラスター構築を支える大いなる味方です。 
  しかし、頻繁なバージョンアップを繰り返す製品では、アップにより設定ファイルの
 構成が変更されたり、新たなバグの発生、以前のパッチの当て忘れ(?)が見られ
 ます。安定版のLinux OSを導入したら、そのOSを、パッチなどを当てつつ大事に
 使うことが大切です。  

   
Bug: Scalapack on PGI compilers & Red Hat Linux 7.3


● 今後は、PCプロセッサ演算の32ビットから
64ビットへの移行、メインメモリとCPU間
 のデータ転送バンド幅の高速化と複線化、それらをフルに活用したFortran/C などの
 アプリケーションの出現が楽しみです。

   
最近の拡張: Pentium 4 and its performance


 分子動力学の手法/PCクラスターへ


May 2003