自動化解決方案

PBS Pro 排程管理系統

PBS Professional 是一款快速、強大的工作負載管理器,能夠提高生產力、最佳化資源利用率和效率,以及簡化 HPC 集群、雲和超級電腦的管理。PBS Professional 能夠自動執行作業調度、管理、監視和報告任務,十分可靠,非常適用於複雜 Top500 系統和小型集群。

查看其他資料

PBS Pro 產品簡介 | HPC 工作排程管理系統

 

行業領先的工作負載管理器

對於複雜 全球Top500 系統和小型集群使用者來說,PBS Professional 是值得信賴的解決方案。


高速吞吐

PBS Professional 已針對 50,000 多個節點進行了測試,其可擴展,能夠支持數百萬個內核,可快速分配作業且延遲極小,每天可以支援 1,000,000 多個作業。


無與倫比的安全性

PBS Professional 是唯一一款獲得 EAL3+ 認證的工作負載管理器,也是唯一一款與紅帽 SELinux“跨域安全性”(或“MLS”—多級安全)技術*相集成的負載管理產品

 

利用 PBS Professional 進行雲爆發

 

PBS Professional 特色

 

功能強大、策略驅動的 HPC 工作調度

PBS Professional 可加快作業執行速度,並可根據種類繁多、分佈廣泛的資源確定最佳作業分配方案。可以輕鬆做出明智的決策,將分散式多供應商計算資產作為單一統一系統進行管理。 


快速、可靠地啟動大量 MPI 作業

PBS Professional 經過了數萬 MPI 層測試,可以最大程度地減少由故障節點引起的延遲。


支援 Linux 控制組(Cgroups)

使用控制組消除資源爭用問題,使作業運行更快,即便在同一個 OS內的計算亦不相互干擾。


網路拓撲感知調度

PBS Professional 可以對所有 HPC 網路拓撲的任務分配進行優化(包括在 Infiniband、GigE 上創建的拓撲以及供應商專有技術),提高應用程式性能,並能減少網路爭用。


GPU 調度

它支持高級 GPU 調度以及使作業能夠在節點上單獨分配各個 GPU,因此,您可以在多個作業(其中每個作業都需要有自己的 GPU)之間共用單一節點。


企業級可靠性支援

採用高度冗余、無單點故障的自動容錯移轉架構,即使在出現伺服器故障、網路故障甚至 PBS 幕後程式崩潰的情況下,也永遠不會發生作業丟失的現象,可保證作業繼續運行。

 

 

想了解更多資訊,或有任何相關需求,歡迎與我們聯繫

  • 電話:02-2500-6210
  • 郵件:info@aisol.com.tw 

PBS Access 作業提交門戶 | 產品介紹

面向研究人員和工程師的 HPC 作業提交門戶

工程師、科學家和研究人員可以輕鬆訪問提供 HPC 訪問權限的門戶(無需 IT 專業知識)來運行求解器、查看進度、管理數據,並通過 Web 和桌面使用 3D 遠程可視化。

 

 

         
借助具有智能、簡化界面的強大 GUI,簡化作業檔案提交和管理。      通過 PBS 應用服務 (PAS) 輕鬆定義和配置應用程序以提交工作      直接從安全的 Web 門戶管理 3D 遠程可視化會話和數據。

 

Access 如何遠端提交作業,並觀看求解結果:

 

Access 優勢與特色:

  • 新手到專家:簡單而強大的工具,使新手到專家皆容易上手
  • 相同UX(用戶體驗):從桌面和網頁都具有相同的用戶體驗
  • 安全性:獲取 HPC 資源時將受到安全保護
  • End-to-end:使用端到端的方式進行提交、監控進度、引導、修復和重新運行作業
  • 協作性:共享 3D 分析
  • 3D 遠程可視化
  • 節省時間:借助功能強大的 GUI 和智能、簡化的界面,簡化作業提交和管理
  • 提高工作效率:將更多時間花在工作上,而不是 IT 工作上
  • 提高投資回報率:整合對應用程序的訪問並優化許可證可用性
  • 減少錯誤並提高一致性:將貴公司的最佳實踐知識直接嵌入用於提交工作的應用程序定義中

 

想了解更多資訊,或有任何相關需求,歡迎與我們聯繫

  • 電話:02-2500-6210
  • 郵件:info@aisol.com.tw 

PBS Control 系統資源監管 | 產品介紹

Control 使您輕鬆管理、監控、分析和模擬 HPC 叢集的平台。

Control 是一款易於使用的 Web 應用程序,用於監控和管理高性能計算 (HPC) 集群上的作業和節點,具有高級分析功能,可支持數據驅動的規劃和決策制定。

 

 

              
設計一個 HPC 模型,以便 HPC 集群可以突增到公共雲和私有雲,在需要時準確地增加容量。      在雲中部署 HPC 模型。通過更新 HPC 詳細信息來管理雲爆發。      監控和管理 HPC 集群的節點和作業。利用子選項以便於查看監控內容。      配置預設 WLM 服務器和安全設置並管理隊列、資源預設值和限制。

 

         
易於使用的作業會計和報告解決方案,具有高級分析功能,可支援數據驅動的規劃和決策。      運行模擬以執行假設分析並確定擴展 HPC 資源的最有效方式。      根據計算、存儲、預算和限制要求分配資源;平衡複雜的利益相關者邏輯。

 

Control 如何分析和模擬 HPC 工作負載,來實現智慧的資源擴展

 

Control 優勢與特色:

  • 單一管理平台:配置、部署、監控、爆發、管理、故障排除、模擬、分析和調整手
  • 即時監控:簡化故障排除和維護
  • 報告和分析:由 Altair SmartSight™ 提供支持
  • 工作負載模擬器:模擬和優化基礎設施規模
  • 多雲爆發:突發到任何雲,以實現峰值負載
  • 現代 UX :拖放式的簡單化操作

 

想了解更多資訊,或有任何相關需求,歡迎與我們聯繫

  • 電話:02-2500-6210
  • 郵件:info@aisol.com.tw