マルチコア用プロセッサの並列コンパイラの研究へ 日本SGI が早稲田大学にミッドレンジサーバ「Altix 450」を納入 省スペース・省電力の高性能コンピュータでソフト開発を期間短縮
CPUを高密度化・高集積化し、クロック・スピードを上げる従来のコンピュータ開発手法が限界を迎え、電力の大量消費、そして地球環境の破壊が懸念されている。
そこで急浮上しているのがマルチコア技術だ。早稲田大学 理工学術院 基幹理工学部 情報理工学科では、最適化したマルチコア・プロセッサと自動並列化コンパイラで消費電力を抑え、
コンピュータの処理速度を向上し、さらには、ソフト開発期間の短縮を図る研究を行っている。
この研究/開発のために導入されているのが「SGI(R) Altix(R) 450」の特別モデルである。
さらには、早稲田大学が採択されたグローバルCOEプログラム「アンビエントSoC教育研究の国際拠点」の一環として52コアのラックマウント型のAltix 450を増強、ますます研究を加速している。
導入の背景
自動並列化でソフト開発時間を短縮
自動並列化でソフト開発時間を短縮
笠原研究室のマルチコア用自動並列コンパイラは、経済産業省および新エネルギー・産業技術総合開発機構(NEDO)が中心となって 2000年から産学連携で開始した「ミレニアムプロジェクトIT21」の中で、
基本技術が開発された「OSCARマルチグレインコンパイラ技術」をベースとしている。
8から数十プロセッサからなる共有メモリ型サーバにおいて商用コンパイラに比べて平均2から4.5倍の高速処理性能が得られることが確認されている。
同コンパイラが生成する並列化プログラムは標準規格であるOpenMPに準拠しており、どのメーカのサーバ上でも並列プログラムを高速に処理することが可能となっている。
また、NEDO「リアルタイム情報家電用マルチコア」プロジェクトで開発されているマルチコアAPIを用いた並列プログラムをOSCARコンパイラが自動生成することにより、
APIをサポートする各社のマルチコア上で、従来数週間単位を要していたアプリケーションの並列化を、数時間単位で行うことを可能としている。
導入の目的
情報家電分野も視野に、最適なプロセッサの開発を目指して
同コンパイラはこのようにスーパーコンピュータからPC、さらには情報家電、自動車など、共有メモリ型マルチコアプロセッサを搭載する多くのシステムで稼働可能であるが、
同研究室は特に将来の日本の産業を支えると見られる情報家電や自動車分野で普及に取り組んでいく考えだ。特に情報家電は短期間での並列プログラム開発が必須条件となり、
OSCARマルチグレインコンパイラがソフトウェア開発期間の短縮にその威力を発揮すると期待されている。
このコンパイラの構成が正しいかどうかをシミュレーションし、アーキテクチャを評価する、すなわちOSCARアーキテクチャの性能評価用として、Altix450が導入された。
選定理由
開発環境の条件は、プロセッサ数が多く、静かで発熱が少なく、コンパクトであること
「コンパイラの最適化技術を評価するためには、できるだけ多くのプロセッサを搭載したグローバル・アドレス空間のマシンが必要です。
しかも、大学の研究室に置けるようなコンパクトなマシンが欲しかったのですが、日本SGIは、Altix 450サーバをベースに我々の要望に合せてくださいました。
われわれは昔から分散共有メモリを使っていましたが、日本SGIのcc-NUMAアーキテクチャとわれわれのOSCARコンパイラは相性が良いし、将来のスーパーコンピュータへの適用も考えAltixを選定しました」
(笠原教授)。
「Altixサーバは使い勝手がよくて、満足しています。Altixはグローバル・アドレス空間を備えているため並列化がやりやすい。
私は分散共有メモリの最適化が将来のコンピュータの性能を決めると思っていますが、cc-NUMAのマシンはその実験のために、とてもよいものとなっています」と笠原教授は高い評価をしている。
早大GCOE「アンビエントSoCの教育研究の国際拠点」の一環として、研究をさらに加速
さて、早稲田大学は2007年度から文部科学省が実施する「グローバルCOEプログラム」において、情報・電気・電子分野における「アンビエントSoC教育研究の国際拠点」
(拠点リーダー 後藤 敏 教授:早稲田大学大学院情報生産システム研究科)として選ばれている。
この一環として、2007年12月には、研究室のニーズに合わせて日本で独自にアレンジを施した16コア構成Altix 450サーバをデスクサイド形にアレンジした "特注品"を導入。
まさに研究者の「デスクサイド」でマルチコア用プロセッサの並列コンパイラの研究に活用している。続いて2008年3月には、28コア構成によるラックマウント型のAltix 450を追加導入。
こちらは、共用マシンとして新設となった大久保キャンパス63号館のマシンルームに導入、この6月の増強により、合計52Coreとなる。
本システムは、このプログラムの一環として導入されたもので、このように、研究の発展に合わせて段階的、継続的にシステムを増強していく予定だ。
注釈:
- OSCARはOptimally Scheduled Advanced Multiprocessorの略。早稲田大学が1986年から研究しているソフトウェア協調型マルチプロセッサ・アーキテクチャ
- cc-NUMAは、プロセッサそれぞれローカルメモリを持つ分散共有メモリ型アーキテクチャのこと。すべてのメモリで論理的に共有メモリを構成し、自動並列化に適している。米スタンフォード大学で開発され たアーキテクチャで、SGI はこれを採用したシステムを商用化した
- SoCは、Sensor, Software and Service on Chipの略。ナノテクノロジー(NT)を駆使した新材料と革新的デバイス、高度な新情報サービスを創出する情報通信基盤ソフトウェア(IT)、および、誰でもが安 全に、快適で使い易い情報環境を提供するアンビエント技術(AT)など、 これらの技術を統合化しチップ上に実現することを目指している。
早稲田大学 理工学術院 基幹理工学部 情報理工学科
〒169-8555 東京都新宿区大久保3-4-1
http://www.sci.waseda.ac.jp/global/faculty/nucleus/index04.html
研究内容: 並列計算機アーキテクチャ、並列ソフトウェア及び計算機応用
- 1. 次世代マルチプロセッサアーキテクチャ:マイクロプロセッサ(シングルチップマルチプロセッサ)、スーパーコンピュータ
- 2. 通常の逐次プログラムを自動的に並列化するマルチグレイン自動並列化コンパイラ
- 3. 複数プロセッサを効率よく同時動作させるためのマルチプロセッサ・スケジューリング・アルゴリズム
- 4. 各種科学技術計算の並列処理(LSI・CAD用電子回路シミュレータ、電力系統解析、航空機設計用空気流体力学、ロボット開発用CADシステム)
- 5. ネットワーク接続された異機種スーパーコンピュータを自動的に利用し処理時間の最小化を目指すメタスケジューリング
本記事の内容および使用写真は、関係者、所有者の承認を得て編集、公開をしています。 日本SGI 株式会社Webサイトのご利用条件をご覧下さい。

