Friday 6 August 2021

Sukara 側 5年目のサーバ

東京に来たら、サーバーが落ちる。まぁ、良くあることなんですが...

  sakura側に設定していた MatterMost が落ちてる

ってのが発端。「Cloud じゃないんですか」すみません。どたんばで選択肢あったんだけど、

  42TB容量(RAID5 22TB)とCPU性能で、Cloud じゃないレンサバ Dell PowerEdge R720

ってことに。いや、もともとバックアップと停電用なので。昔は

  学生の Cloud 演習用

のつもりだったんですが、だいぶ様相が違うのと

  学生の演習用なら AWS/GCP/Alibaba でいいだろ

ってことでそれはなくなって。いや、確かに Single なのはだめだよね。でも、もともとバックアップのつもりだから。

なので、

  sakura側は多重化されてないんです。すみません。

そこにサービス上げたのを放置してたのはまずかったかな。でも、オンプレ側にもすぐ上げられるでしょ。

と思ってたが、Podman base だと結構てこずるらしい。

  オンプレのPodman/MatterMost は学生に任せて

で、Sakura 側を見るわけですが

  Ubuntsu 20 な root の Hardware RAID1 の片方のHDDが死んでて、
  local medica を選択すると、Grubにいけて、Recovery mode には入れる

ここで、ググったら「grubの再設定でいける」とあったんですが、それを実行する勇気はなく。

ここで support に連絡。rootなRAID1だけでなくて、42TBの方も故障予告が2台。5年使ってるからな。

で、RAID1 交換 rebuildで終了。と誰もが思うわけですが...

  何やっても grub に入らないモードに
  仮想コンソールの remote media からも上がらない
  iDRAC recovery mode, please update iDRAC

くそう。いや、身に覚えはあるんですけどね。去年 install した時に iDARC の update 失敗を放置してた。

でも立ち上がって良しだったんですが、おそらく、RAID関連で iDRAC 必須なんだろうな。

こっちからはどうしようもないので、再度、support に連絡

  iDRAC update できません
  なので、Hardware 交換で

そう来ますか。いや、僕も旧サーバの iDRAC update では泣いてたので理解できます。

Hardware 交換で無事 boot (RAID1修復は終わってた)なんですが、

  42TB が mount できない

え〜 まだ続くの? と思ったが、学生が

  sdb1 ではなくて sdc1 に

おっと、なんか割り込んだか。それで立ち上がりました。結局、修復に一週間か〜

いや、でもオンプレな MatterMost は、まだたち上がってないのか。ごめん、まだ、しばらく手伝えないです。がんばれ〜

No comments: