產(chǎn)品--自主研發(fā)
應(yīng)對(duì)大量計(jì)算,提高計(jì)算性能,降低計(jì)算能耗,簡便部署,統(tǒng)一管理
RJMS作業(yè)調(diào)度管理系統(tǒng)
產(chǎn)品概述
RJMS作業(yè)調(diào)度管理系統(tǒng)負(fù)責(zé)計(jì)算資源統(tǒng)一管理和作業(yè)調(diào)度,幫助用戶合理使用計(jì)算資源。它提供靈活多樣的調(diào)度策略、穩(wěn)定可靠的計(jì)算服務(wù)、簡潔易用的可視化界面,不僅支持大規(guī)模異構(gòu)集群的作業(yè)調(diào)度,還可以對(duì)多個(gè)集群實(shí)現(xiàn)統(tǒng)一管理。RJMS可大幅度提高集群的計(jì)算性能,加速數(shù)據(jù)分析處理進(jìn)程。
產(chǎn)品優(yōu)勢(shì)
-
穩(wěn)定
RJMS已運(yùn)行18年 -
強(qiáng)大
可管理超過20,000 CPU 核心的超大規(guī)模計(jì)算集群 -
靈活
策略實(shí)時(shí)調(diào)整 -
專業(yè)
資深研發(fā)團(tuán)隊(duì)
業(yè)務(wù)挑戰(zhàn)
一個(gè)大型計(jì)算集群系統(tǒng)需要支持上千個(gè)用戶同時(shí)操作,以及上萬個(gè)作業(yè)同時(shí)運(yùn)行。這對(duì)計(jì)算集群的穩(wěn)定性、可靠性提出極其苛刻的要求。
RJMS根據(jù)集群運(yùn)行情況實(shí)時(shí)調(diào)整作業(yè)調(diào)度策略,并對(duì)每個(gè)作業(yè)進(jìn)程實(shí)時(shí)監(jiān)視,保證集群高效穩(wěn)定運(yùn)行。RJMS提供基于Web頁面的系統(tǒng)管理圖形界面,幫助管理員隨時(shí)隨地了解運(yùn)行狀態(tài),修改調(diào)度策略,增強(qiáng)了計(jì)算集群的可用性。RJMS提供細(xì)粒度的隊(duì)列管理功能,將異構(gòu)資源劃分成隊(duì)列實(shí)現(xiàn)資源管理調(diào)度,保證系統(tǒng)對(duì)不同體系結(jié)構(gòu)資源的支持性。
產(chǎn)品功能
· 調(diào)度策略
提供多個(gè)隊(duì)列的個(gè)性化配置,支持GPU計(jì)算加速調(diào)度
支持“多級(jí)搶占”、“預(yù)約回填”、“動(dòng)態(tài)作業(yè)優(yōu)先級(jí)”、“節(jié)點(diǎn)獨(dú)占”等多種調(diào)度策略
· 計(jì)算服務(wù)
計(jì)算節(jié)點(diǎn)自檢功能,實(shí)時(shí)故障點(diǎn)排隊(duì)。
對(duì)作業(yè)異常行為快速響應(yīng)并提供多種容錯(cuò)處理方案。
· 計(jì)費(fèi)管理
支持CPU核*時(shí)、GPU個(gè)*時(shí)、內(nèi)存GB*時(shí)維度進(jìn)行作業(yè)計(jì)費(fèi)。
· 統(tǒng)一管理
支持多個(gè)集群系統(tǒng)統(tǒng)一管理
支持異構(gòu)集群統(tǒng)一管理
· 可視化界面
提供腳本、命令行、Web界面等多種用戶交互方式。
提供方便的工具對(duì)用戶、隊(duì)列、節(jié)點(diǎn)等屬性和權(quán)限進(jìn)行設(shè)置。
提供豐富的作業(yè)運(yùn)行統(tǒng)計(jì)分析報(bào)表。
應(yīng)用場(chǎng)景
動(dòng)漫渲染 | 圖像處理、高清視頻、三維渲染 |
石油勘探 | 地震資料處理、地震資料解釋、油藏模擬 |
氣象環(huán)境 | 中尺度、中長期預(yù)報(bào)、海洋、環(huán)境預(yù)報(bào) |
生命科學(xué) | 序列對(duì)比、分子對(duì)接、份子動(dòng)力學(xué) |
物理化學(xué) | 量子力學(xué)、分子力學(xué)、蒙特卡羅分析 |
CAE仿真 | 結(jié)構(gòu)分析、流體分析、電磁場(chǎng)分析 |