月刊あんどりゅーくん(5月号)


1.2 Corosync 1.3.1

メンテナンスリリースなのでバグフィックスがメインです。
機能追加などはありませんが、PPCとARMへの対応が取り込まれました。
最新版はこちらからダウンロードすることができます。

えーとまあ失礼な話ではあるんですけど、Corosyncってやっぱまだ不安定だよねー
急にノード停止とかするよねーというイメージがあるので、今回のリリースノートでは
「crash」「assert」という単語をピックアップしてみました。

・Provide better checking of the message type
メッセージタイプのチェックを強化

例えば、2ノードでクラスタを構成していて、かたっぽのノードには暗号化の設定をしていました、
で、もうかたっぽには暗号化の設定をしていませんでした、とかいう場合。
リリースノートからはどっちのノードか(もしかしたらどっちも?)っていうのが読み取れなかったんですが
上記の設定は「would cause a crash」だったそうです。今回の修正でそれはなおったということですね。

・Don’t assert when ring id file is less then 8 bytes
リングIDファイルのサイズが8バイト以下だった場合の処理を修正

フェンス実行時やファイルシステムが破損している場合、リングIDファイルが8バイト以下になってしまうことがあるらしいんですが
この場合「totemsrp would assert」します。
今回の修正で、リングIDファイルが8バイトより小さい場合、リングIDを再読み込みして正しいファイルを再作成するようになったようです。

・Handle delayed multicast packets that occur with switches
マルチキャストパケットの遅延を抑止

これは「crash」も「assert」もしてないですが、「improves performance」ということなので抜粋してみました。
ある特定のスイッチを使用した環境では、マルチキャストパケットの遅延が発生するという事象があるようなのですが
miss_count_const というパラメータを新規に追加することによって、この問題に対応しました。
Corosync は送受信失敗回数をカウントし、失敗回数が miss_count_const に到達した段階ではじめて
対象メッセージを再送信リストに登録します。
この修正によって、パフォーマンスの改善とともに不要なログメッセージの出力を抑止することが可能となりました。

リリースノートの全文はこちらを確認してください。

Pages: 1 2 3 4 5 6

Comments are closed.