2025年1月初旬からRaspberry Pi5を用いて、WordPressのサーバ運用を始めて、約1.5か月何の問題もなく順調に動いていたのですが、2025年2月24日ついにサーバ障害が発生しました。
現象は、サーバが起動しようとしてSSDが認識できず、再起動を繰り返していたようです。
障害の状況と切り分け
そんなに負荷が高くないのに、ケースのファンが回ることが増え「おかしいな」とおもっていたところ、ついにブログが反応しなくなりました。
- ブログが表示されない
- SSH(Teraterm)がつながらない
- モニターをつないでも表示されない
- 定期的にファンが回る
よく見ると、Raspberry Pi5が起動しようとしてSSDが認識できなくて、再起動を繰り返していました。
ファンが定期的に回っているのは、OSが起動するまでの間ファンを回しているためです。そのため再起動するたびにファンが回ります。
正常であれば、起動した後OS側からファンの停止・起動の指示が出ますのでファンは一旦とまります。
トラブルが発生したときは、末端のハードからRaspberry Pi5に向かって、発生箇所の切り分けを行います。
SSDの不具合か確認
起動すればいろいろ確認できるのですが、起動しないのでArgon NEO 5 M.2 NVMe PCIeケースに入っているSSDを外しました。
USBのケースにSSDを入れ替えて、ノートパソコンでRaspberry Pi OSを直接書き直しして、Rapsberry Pi5に接続してUSBブートで起動したところ普通に起動しました。
Raspberry Pi OSの書き込みは下記の記事を参照ください。
その時のSSDの性能をhdparm で調べると

335.58MB/secと、USBで接続しているSSDとしては問題はありません。また/var/log/syslogを見ても障害は出ていません。
性能測定の方法は下記の記事を参照ください。
障害の状況確認
前章で再セットアップしたSSDをArgon NEO 5 M.2 NVMe PCIeケースに戻して、Raspberry Pi5を起動しました。
何回か再起動した後無事起動しました。ただ、動きがとても遅くなる瞬間があり、hdparm のコマンドでSSDの性能を調べると

左のTeratermには、hdparmでSSDの性能を、右のTeratermにその時の/var/log/syslogを表示してます。
SSDは67.06kB/secと全然性能が出ていません。
syslogには、
nvme nvme0: I/O tag 940 (53ac) opcode 0x1 (I/O Cmd) QID 3 timeout, aborting req_op:WRITE(1) size:8192
とか
nvme nvme0: Abort status: 0x0
のエラーが頻繁に出力されています。
SSDに書き込みをする時にtimeoutが発生したり、恐らくなのですが、読み込みでエラーが出ています。
性能測定の方法は下記の記事を参照ください。
PCIケーブルに問題がないか調査
SSDに問題がなさそうなので、Raspberry Pi5とSSDを接続するPCIケーブルに問題ないか調査を行いました。
まず、PCIケーブルのコネクタへの差し込みが甘く、不安定となっていないか一度外して、再度ケーブルを差し込んで動作確認をしましたが、遅さやエラーログへのエラー出力とトラブルの解消にはなりませでした。
次に、Argon NEO 5 M.2 NVMe PCIeケースに付属の予備のPCIケーブルに交換して検証をしましたが、遅さやエラーログへのエラー出力とトラブルの解消にはなりませでした。
Argon NEO 5 M.2 NVMe PCIeケースの調査
ここまでくると、Argon NEO 5 M.2 NVMe PCIeケースのPCIボードに問題があると考えられます。
調査のためには、正常に動作するArgon NEO 5 M.2 NVMe PCIeケースが必要となりますが流石に2台は持っていないので販売元のGeeekPi-JPに交換の依頼を出します。

上記問い合わせと合わせ、このページのURLをPDFに記入してお送りしたところ、
「こんにちは、添付ファイルのリンクアドレス mygeekpi.comは当社の公式ウェブサイトですか?」と返事があったまま、この後の問いかけには返事がありません。
当初GeeekPiに関係のある会社と勝手に解釈していたのですが間違っていたようです。

GeeekPi-JPからの回答は、画面の左側です。
長い時間をかけて、のらりくらり、Amazonに通報のたびに回答がありました。
最後は、Argon Oneのテクニカルサポートにお問い合わせくださいとのことでした。
もうここで購入することはありません。
新しいArgon NEO 5 M.2 NVMe PCIeケースで調査
AliexpressでPCIeケースだけ購入して動作確認をしたところ、問題なく動くようになりました。(2025/4/8)
この障害の間、USBケースにSSDを入れて、USBでブートしてRaspberry Pi5で本ブログを動かし、新しいハードが来て試している間は、Raspberry Pi4で本ブログを動かしています。
予備のRaspberry Piがあるのは頼もしい限りです。