ラージビッグバナー(970x90)

Linux

【CentOS】BUG: soft lockup - CPU# のメッセージ

更新日:

ビッグバナー(piglog)728px

ZabbixでIO系のエラーが頻発していたので確認したところ、kernel: BUG: soft lockup - CPU#x というエラーがでていたので対処した時のメモです。

環境

  • ESXi 6.0
  • CentOS 7.2

エラーなど

/var/log/messages を確認したところ、以下のエラーが出力されていた。

発生が夜中だったので特に何も影響はなかったが、Zabbixで監視状態をみるとIO系のエラーが頻発していた。ただ、数分で収まり元に戻っていた。

調べてみると、VMwareのKB「SMP 対応の仮想マシンで実行中の Linux カーネルからソフト ロックアップ メッセージが出力される (2094326)」に以下の記載があった。

 Linux カーネルがソフト ロックアップ用のウォッチドッグ スレッドを用意しており、このウォッチドッグ スレッドが 10 秒間以上スケジュールされない場合は、ソフト ロックアップ メッセージが出力されます。

対応策として、以下のように記載があるが気持ち悪いので対処したい。。。

ソフト ロックアップ メッセージが出力されても、カーネル パニックが発生したわけではないため、無視しても問題ありません。

上記VMのページにはソフトロックアップのしきい値を変更する方法が紹介されているが、これって根本解決になってなくないか?と思い探してみると「BUG: soft lockup - CPU# で止まってしまう」で有識者と思われる方が解説していた。

VM環境でオーバーコミットしているような場合だと、VMが実CPUを常にとれているわけではない(ほかのVMが忙しい場合には当然暇なVMにはリソースは割り当てられない。)リソースプールで制御している場合は別だが。

確かに、メッセージが出ていた環境はまぁまぁなオーバーコミット具合いだった。経験上、メモリはある程度のオーバーヘッドでパフォーマンスの違いが見えやすいからオーバーコミットに対して少し神経質になるけど、CPUはすべてのVMが忙しく動いているわけではない(ことが多い)のでそこまで厳しく計算をしない(ことが多い、わたしは)。

対処

参考にさせてもらって、というかそのままだが、以下のように設定変更後にVMの再起動を行いました。

以上です。

↓↓↓ 持っていると便利な一冊。

レクタングル (大)

レクタングル (大)

リンクユニット(レスポンシブ)

-Linux
-, ,

Copyright© ぴぐろぐ , 2018 All Rights Reserved.