東京に来たら、サーバーが落ちる。まぁ、良くあることなんですが...
sakura側に設定していた MatterMost が落ちてる
ってのが発端。「Cloud じゃないんですか」すみません。どたんばで選択肢あったんだけど、
42TB容量(RAID5 22TB)とCPU性能で、Cloud じゃないレンサバ Dell PowerEdge R720
ってことに。いや、もともとバックアップと停電用なので。昔は
学生の Cloud 演習用
のつもりだったんですが、だいぶ様相が違うのと
学生の演習用なら AWS/GCP/Alibaba でいいだろ
ってことでそれはなくなって。いや、確かに Single なのはだめだよね。でも、もともとバックアップのつもりだから。
なので、
sakura側は多重化されてないんです。すみません。
そこにサービス上げたのを放置してたのはまずかったかな。でも、オンプレ側にもすぐ上げられるでしょ。
と思ってたが、Podman base だと結構てこずるらしい。
オンプレのPodman/MatterMost は学生に任せて
で、Sakura 側を見るわけですが
Ubuntsu 20 な root の Hardware RAID1 の片方のHDDが死んでて、
local medica を選択すると、Grubにいけて、Recovery mode には入れる
ここで、ググったら「grubの再設定でいける」とあったんですが、それを実行する勇気はなく。
ここで support に連絡。rootなRAID1だけでなくて、42TBの方も故障予告が2台。5年使ってるからな。
で、RAID1 交換 rebuildで終了。と誰もが思うわけですが...
何やっても grub に入らないモードに
仮想コンソールの remote media からも上がらない
iDRAC recovery mode, please update iDRAC
くそう。いや、身に覚えはあるんですけどね。去年 install した時に iDARC の update 失敗を放置してた。
でも立ち上がって良しだったんですが、おそらく、RAID関連で iDRAC 必須なんだろうな。
こっちからはどうしようもないので、再度、support に連絡
iDRAC update できません
なので、Hardware 交換で
そう来ますか。いや、僕も旧サーバの iDRAC update では泣いてたので理解できます。
Hardware 交換で無事 boot (RAID1修復は終わってた)なんですが、
42TB が mount できない
え〜 まだ続くの? と思ったが、学生が
sdb1 ではなくて sdc1 に
おっと、なんか割り込んだか。それで立ち上がりました。結局、修復に一週間か〜
いや、でもオンプレな MatterMost は、まだたち上がってないのか。ごめん、まだ、しばらく手伝えないです。がんばれ〜
No comments:
Post a Comment