亚洲韩日午夜视频,欧美日韩在线精品一区二区三区,韩国超清无码一区二区三区,亚洲国产成人影院播放,久草新在线,在线看片AV色

您好,歡迎來到思海網(wǎng)絡(luò),我們將竭誠為您提供優(yōu)質(zhì)的服務(wù)! 誠征網(wǎng)絡(luò)推廣 | 網(wǎng)站備案 | 幫助中心 | 軟件下載 | 購買流程 | 付款方式 | 聯(lián)系我們 [ 會員登錄/注冊 ]
促銷推廣
客服中心
業(yè)務(wù)咨詢
有事點擊這里…  531199185
有事點擊這里…  61352289
點擊這里給我發(fā)消息  81721488
有事點擊這里…  376585780
有事點擊這里…  872642803
有事點擊這里…  459248018
有事點擊這里…  61352288
有事點擊這里…  380791050
技術(shù)支持
有事點擊這里…  714236853
有事點擊這里…  719304487
有事點擊這里…  1208894568
有事點擊這里…  61352289
在線客服
有事點擊這里…  531199185
有事點擊這里…  61352288
有事點擊這里…  983054746
有事點擊這里…  893984210
當(dāng)前位置:首頁 >> 技術(shù)文章 >> 文章瀏覽
技術(shù)文章

Linux系統(tǒng)上安裝slurm來監(jiān)控網(wǎng)絡(luò)帶寬和控制節(jié)點

添加時間:2016-2-25 2:54:27  添加: 思海網(wǎng)絡(luò) 
SLURM 是一個類似 Sun Grid Engine (SGE) 的開源分布式資源管理軟件,用于超級計算機(jī)和大型計算節(jié)點集群,可高度伸縮和容錯。SUN 被賣給 Oracle 后,好用的 SGE 變成 Oracle Grid Engine 并且從 6.2u6 版本開始成為商業(yè)軟件了(可以免費使用90天),所以我們不得不另尋其他的開源替代方案,SLURM 是上次在德班高性能會議的時候一位陌生人介紹的,聽上去不錯。
SLURM 通過一對冗余集群控制節(jié)點(冗余是可選的)來管理集群計算節(jié)點,是由一個名為 slurmctld 的管理守護(hù)程序?qū)崿F(xiàn)的,slurmctld 提供了對計算資源的監(jiān)視、分配和管理,并將進(jìn)入的作業(yè)序列映射和分發(fā)到各個計算節(jié)點上。每個計算節(jié)點也有一個守護(hù)程序 slurmd,slurmd 管理在其上運行的節(jié)點,監(jiān)視節(jié)點上運行的任務(wù)、接受來自控制節(jié)點的請求和工作、將工作映射到節(jié)點內(nèi)部等等。圖示如下:


監(jiān)控帶寬

代碼如下:
$ apt-get install slurm

它會用字符來顯示文本圖形。
例如:


代碼如下:
$ slurm -i <interface>
$ slurm -i eth1





選項
按 l 顯示 lx/tx 指示燈.
按 c 切換到經(jīng)典模式.
按 r 刷新屏幕.
按 q 退出.

控制節(jié)點
在控制節(jié)點和計算結(jié)點分別安裝 slurm 包,這個包里面既含有控制節(jié)點需要的 slurmctld 也含有計算結(jié)點需要的 slurmd:


代碼如下:
# apt-get install slurm-llnl

控制節(jié)點和計算結(jié)點之間需要通信,通信就需要認(rèn)證,slurm 支持兩種認(rèn)證方式:Brent Chun’s 的 authd 和 LLNL 的 MUNGE,MUNGE 是專為高性能集群計算打造的,這里我們選用 MUNGE,生成 key 后啟動 munge 認(rèn)證服務(wù):

代碼如下:
# /usr/sbin/create-munge-key
Generating a pseudo-random key using /dev/urandom completed.
# /etc/init.d/munge start

使用 SLURM Version 2.3 Configuration Tool 在線配置工具生成配置文件,然后把配置文件拷貝控制節(jié)點以及各個計算結(jié)點的 /etc/slurm-llnl/slurm.conf(是的,控制節(jié)點和計算結(jié)點使用同一個配置文件)。
有了配置文件和啟動了 munge 服務(wù)后就可以在控制節(jié)點啟動 slurmctld 服務(wù)了:


代碼如下:
# /etc/init.d/slurm-llnl start
* Starting slurm central management daemon slurmctld [ OK ]

把控制節(jié)點生成的 munge.key 拷貝到各個計算結(jié)點:


代碼如下:
# scp /etc/munge/munge.key ubuntu@slurm01:/etc/munge/

登陸計算節(jié)點后啟動 munge 服務(wù)(注意需要改變 munge.key 的 owner 和 group 為 munge,否則會啟動失敗)和 slurmd 服務(wù):


代碼如下:
# ssh ubuntu@slurm01
# chown munge:munge munge.key
# /etc/init.d/munge start
* Starting MUNGE munged [ OK ]
# slurmd

在控制節(jié)點上(slurm00)測試一下是否順利連接到計算結(jié)點(slurm01),并且簡單運行一個程序 /bin/hostname 看看效果吧:

代碼如下:
# sinfo
PARTITION AVAIL TIMELIMIT NODES STATE NODELIST
debug* up infinite 1 idle slurm01
# srun -N1 /bin/hostname
slurm01

關(guān)鍵字:Linux、系統(tǒng)、slurm、網(wǎng)絡(luò)帶寬
分享到:

頂部 】 【 關(guān)閉
版權(quán)所有:佛山思海電腦網(wǎng)絡(luò)有限公司 ©1998-2024 All Rights Reserved.
聯(lián)系電話:(0757)22630313、22633833
中華人民共和國增值電信業(yè)務(wù)經(jīng)營許可證: 粵B1.B2-20030321 備案號:粵B2-20030321-1
網(wǎng)站公安備案編號:44060602000007 交互式欄目專項備案編號:200303DD003  
察察 工商 網(wǎng)安 舉報有獎  警警  手機(jī)打開網(wǎng)站