JUMP-1 のデザイン

コンセプト

Silicon Graphics 社の Origin シリーズに代表されるような超並列計算機が、近い将来のスー パーコンピュータの構成の有力な候補であると考えられています。こ れらは、専用の特別な演算ユニットを使うのではなく、汎用のマイク ロプロセッサを数多く結合して、並列に処理を行うことで高い計算能 力を実現することを目指しています。また、プロセッサ数を増やすこ とにより計算能力を拡張することのできるスケーラビリティを持たせ ることに配慮されています。

JUMP-1 では、容易にプログラムの開発を行うことのできる共有メモ リ型のメモリモデルを用いています。メモリはシステム内に分散する 分散共有メモリで、物理的に近いところにあるプロセッサからは高速 にアクセスができ、遠いところにあるプロセッサからはすこし低速に なりますがネットワークを介してアクセスすることができます。

超並列計算機における分散共有メモリは、プロセッサ数が増加した場 合の性能に問題が指摘されており、JUMP-1 では数多くの新基軸によ り、数千プロセッサから一万プロセッサを超える規模での、効率のよ い分散共有メモリの実現を目指しています。数千から数万のプロセッ サと、効率のよい分散共有メモリを持つ計算機は、様々な大規模計算 において非常に強力なツールとなることでしょう。

現在の JUMP-1

現在 JUMP-1 のハードウェアは完成しており、天野研究室には 16 プロセッサのシステムが設置されています。また、京都大 学には 64 プロセッサのシステムが設置され、稼働しています。 写真は 16 プロセッサのシステムで、左側に見えるディスプレ イがメンテナンスコントローラの PC で、奥には入出力サブシ ステムを構成するワークステーションが設置されています。

ハードウェアの完成後は、システムソフトウェアの開発と性能 評価が行われており、当研究室ではクラスタ間結合網のマルチ キャスト機構の性能評価や、並列入出力機構の性能評価などを 行っています。分散共有メモリを実現するためのソフトウェア は京都大学のほうで作業が進行しており、行列演算などで性能 評価を行っています。

現在の開発環境では、 SEDグルー プで開発された pot という汎用モニタを用いて、メンテ ナンスバスインターフェイス (MBIF) や並列入出力機構 STAFF-Link からプログラムをロードするという形態を取って います。要素プロセッサは SuperSPARC+ ですので、プログラ ムの開発には gcc を使用することができます。MBP-light の プログラムについては、既にアセンブラが開発されています。

JUMP-1 の概要

全体像

JUMP-1 の要素プロセッサは SuperSPARC+ で、一枚のクラスタボードに 4プロセッサが搭載されています。クラスタボードにはその他に 16MB のメモリや、メモリや入出力の制御を行う専用プロセッサ MBP-light が載っています。クラスタ間は RDT (Recursive Diagonal Torus) と呼 ばれる結合網で接続しています。

クラスタボードの構成

左に示すのが JUMP-1 のクラスタボードです。クラスタボー ドには、要素プロセッサ SuperSPARC+とL2 キャッシュコン トローラ、クラスタバスチップ、MBIF、STAFF-Link I/F、 MBP-light、メモリなどが搭載されています。

SuperSPARC+ は L2 キャッシュコントローラを介して 64bit 幅のクラスタバスに接続され、クラスタバスに流され た要求は MBP-light によって処理されます。MBP-light は メモリや STAFF-Link, MBIF, RDT ルータチップなどをソフ トウェアによって制御するとともに、様々な通信処理を自動 化するためのハードウェアも内蔵しています。

クラスタ間結合網

クラスタ間で通信を行うための結合網として、JUMP-1 では RDT を採用しています。分散共有メモリを管理するためには、 通常の一対一の通信に加え、複数の宛先に向けて同じメッセー ジを同時に送るマルチキャスト通信が効率良く行えることが 重要になってきます。

また、ノード数の大きな超並列計算機においては、ネットワー クの直径を小さくすることも重要です。RDT は右図のように トーラス型ネットワークを階層的に重ねた構成となっており、 シンプルな構成でありながら、複数の階層を用いた効率のよ いマルチキャスト通信を実現するとともに、多くのノードが 存在する場合にも直径を小さく保つことができます。

JUMP-1 の実装

MBP-light (MBP=Memory Based Processor)

MBP-light は 4 段パイプラインの 16bit RISC コアを持つ ASIC で、 クラスタバスやクラスタ間結合網 RDT を流れるパケットを処理し、 クラスタ上のメモリへのアクセスを制御したり、分散共有メモリの管 理を行ったりします。その他に、MBIF (Maintenance Bus InterFace) 経由で MBP-light にアクセスすることができ、MBIF に 接続した PC から各クラスタをリセットしたり、ブートストラップコー ドをメモリ上に転送したりすることができるようになっています。ま た、JUMP-1 の入出力機構である STAFF-Link も MBP-light が制御し ます。

MBP-light チップ概要
352pins TBGA / 0.4μm embedded array
Random Logic 106,905 gate
Internal Memory 44,848 bit

RDT (Recursive Diagonal Torus)

RDT を実現するためのルータチップは当研究室で開発され、ネットワー クを直接ドライブする能力を確保するために、一部 ECL ロジックを使 用しています。RDT ルータは、1チップあたり 18 ビットの転送幅を持っ ており、ビットスライスに 2チップを使用することで 36 ビット幅の転 送を行っています。RDT ルータチップは、MBP-light によって制御され ます。

RDT ルータチップ概要
299pinCMOS SOG, 0.5μm
125k gates, ECL device
Bi-CMOS gate 0.11ns typ.
CMOS gate 0.06ns typ.

JUMP-1 Group
Last modified: Mon Oct 15 14:18:09 JST 2001