This is the top of the page.
Displaying present location in the site.
  1. ホーム
  2. ソリューション・サービス
  3. HPCソリューション
  4. SXシリーズ
  5. SX-ACE
  6. ソフトウェア
  7. オペレーティングシステム(SUPER-UX)
Main content starts here.

SX-ACE

ベクトルスーパーコンピュータ

オペレーティングシステム(SUPER-UX)

UNIX標準規格のサポート

UNIX標準プロトコルのTCP/IP、DNS、SNMPなどのサポート、システムコールのPOSIX準拠(2008Edition一部準拠)など、高いポータビリティと操作性を持つ利用環境を提供します。

より強力なリソース活用・管理機能

マルチノードサポート

数百ノードにわたる大規模マルチノードシステムにおいて、シングルシステムイメージを実現し、より快適な利用環境を提供します。

大規模システム・大容量データに対応したデータ処理基盤

分散・並列ファイルシステムNEC Scalable Technology File Systemのサポート

HPCシステムの大規模化やデータの大容量化に対応できるよう、データのみならず、メタデータも複数のIOサーバへ一様に分散配置し、負荷分散とスケールアウトを実現する分散・並列ファイルシステムNEC Scalable Technology File System (ScaTeFS)をサポート。
システム全体のスループットが向上し、巨大ファイルへの並列I/Oが実行可能です。
また、クライアントとIOサーバ間の通信量を削減するために、データおよびメタデータのキャッシュ機構を有しており、小さいファイルのアクセス性能およびファイルのオープンや属性取得処理などのメタデータアクセス性能も飛躍的に向上しています。

さらに、大規模ネットワーク構成において輻輳緩和や帯域保障とプライオリティ制御を実現する先進プロトコルDCB(Data Center Bridging)に対応しています。
高負荷時においても、輻輳緩和によりI/O性能低下を防ぎ、帯域保障とプライオリティ制御により重要なデータの遅延を防ぐことで、ファイルシステム全体のパフォーマンスを向上することができます。

一方、運用継続性を向上するため、IOサーバ障害時のフェイルオーバーやパス障害時のパスフェイルオーバーに対応し、システムダウンにつながる単一障害点を排除しています。システム性能を拡張するIOサーバ/ストレージの追加も、運用中に実施できます。

分散・並列ファイルシステム:NEC Scalable Technology File System(ScaTeFS)のサポート

強力なジョブ管理機能/ジョブスケジューリング機能

NQSII

NQSⅡ(Network Queuing SystemⅡ)は、シングルノードシステムから大規模クラスタシステムまでをシームレスにサポートするジョブ管理システムです。
クライアント機能、ジョブ実行機能および運用管理機能を物理的に分離し、運用管理の中核であるバッチサーバを中心として各コンポーネントをTCP/IP接続する構造を採用したことにより、非常にフレキシブルな運用構成とダイナミックな構成変更を可能としています。また異機種混成のクラスタ環境では、HWやOSの差異をNQSⅡが吸収するため、エンドユーザはジョブ実行環境の違いを意識すること無く、統一されたユーザインタフェースによるオペレーションが可能です。

NQSIIでは、ジョブの実行状況に応じて稼働ノードを最適に制御する省電力運用機能や、複数のジョブで構成されるシミュレーションを効率よく実行するワークフロー機能をサポートします。
また障害発生時においては、自動障害リカバリ機能によって運用を継続させ、オペレータの運用負担を軽減します。

NQSIIの概念図

JobManipulator

JobManipulatorは、計画的なリソース管理機能によってシステム稼働率の最大化を実現する高機能ジョブスケジューラです。
利用者が宣言するジョブの実行予定時間(ELAPS時間)と必要リソース量(CPU、メモリなど)を元にジョブ実行に必要な計算リソースを計画的に割り当て、占有利用を可能にするバックフィル・スケジューリングを提供します。

さらにJobManipulatorでは、スケジューリングプライオリティにユーザ毎、およびグループ毎に設定されたシェア配分とリソース使用実績により、公平なジョブの優先度制御を実現するフェアシェアスケジューリング機能をサポートしています。
計算リソースの予約機能では、一般リクエストが使用することのできない計算リソースを予約することができます。
この機能により予約した計算リソースを使用して、保守期間の設定および、特権ユーザのリクエストを確実に実行することが可能です。

多彩な分散ネットワーク機能

NFS

ネットワーク内での異なるOS環境下でも、透過的なリモートファイルアクセスが可能であり、クライアント/サーバモデルによるリモートマウント方式を採用した分散ファイルシステムNFSを提供します。

柔軟で快適な運用管理機能

チェックポイント/リスタート機能

実行中のプログラムを任意の時点で中断させ、後に再開させることができます。
これにより、緊急ジョブの最優先実行や長時間ジョブの分割実行など、柔軟な運用が可能です。
マルチノードシステムではNQSIIにより、マルチノードMPIプログラムのチェックポイント/リスタート機能および実行中のジョブを他の資源の空いているノードへ移すマイグレーション機能が利用できます。

運用管理機能

ネットワーク上のワークステーションから、SXシリーズの運転制御、構成制御、障害監視など、SXシリーズのシステム管理を一元的に行うことが出来ます。

自動運転機能

施設の運用管理や環境監視装置と連動することで、システム電源の投入・切断や環境異常の際の自動停止を行うことができます。

  • *NQS: NASA Ames Research CenterのためにSterling Softwareが開発したNetwork Queuing Systemです。
  • *NFS: 米国Sun Microsystems社の登録商標です。

ページの先頭へ戻る