2024年12月05日(木) - 22:30 | カテゴリ:
Linux
筆者が古くから運用している自鯖システムの中でも歴史の長い物がDNSとメールとなる。
サーバを作り直すタイミングでシステム全体をリビルドする事はあったものの、
ゲートウェイは2台以上でフルアクティブ化して、MDAはアクティブ・スタンバイを基本としている。
また、ns-lab BBのメールはこれらのメールゲートウェイを経由して送受信する様に構成しており、
基本的に限られたIPアドレスからのみ他ドメインへ送付する様に構成している。
筆者の様な極小自鯖でもメールアドレス詐称をする輩はいるもので、
ちょくちょくとDMARCレポートに引っ掛かっているが、
連日となると相手にするのも大変なのでSPFをsoftfailからhardfailに変更してみた。
softfailにしていた理由を書くと自鯖を運用しだした頃はサーバ構成もバラバラで、
メール配送経路も統一出来ておらずsoftfailにしないとGmailに弾かれる問題があった。
時は流れーーー
今はセキュリティ強化も叫ばれる時代で対策をしないとGmailに弾かれる時代になったうえ、
前述の通り自鯖のメール配送経路も統一する事が出来たので今回を機に思い切って変更した。

現在のns-lab BBメールゲートウェイは、受信サーバが4台・送信サーバも4台で構成している。
メール関連の機能を色々と実装しているので、
管理都合でどうしても4台が限界になって来る事もあり4台を1セットに作る様にしている。

SPFレコードは、includeを使って外部参照する構成は維持しつつ判定をhardfailに変更した。
以前はSPFレコードにIPアドレスを直接書いていたのだが、
管理が面倒になったため数年前にDNSレコードを整理した時にまとめて見直した。
………
変更して数日しか経過していないので効果の程は未知数だが、
必要なメールは正常に送受信出来ているのでひとまずは大丈夫そうだった。
DMARCレポートの構成変更もしており、コッチは海外のサービスも併用予定で調整中だったりする。
此方はスケジュール的にギリギリだが、間に合えば調整内容をコミケで小冊子頒布するかもしれない。
メールはオールドメディアになってきているが、今でもビジネスシーンでは現役なのは事実。
SaaSを使えば細かい所を知らなくてもシステム維持は出来るが、
基礎知識は重要なのと日頃から弄れば自ずと場数を踏めるので引き続き運用していく事になりそう。
« 続きを隠す
2024年10月10日(木) - 23:08 | カテゴリ:
Linux
先日、自宅鯖のDNSクエリログを眺めていたところ、
Zabbix 7.0から発せられるDNSクエリが大量に出ていたり、大小英数字でランダム化されている事に気づいた。
DNSキャッシュサーバの負荷高騰までは行っていないが結構な量だったので原因調査をしてみた。
………
改めてログ解析すると元はZabbix Proxy 7.0だった。
以前のバージョンでは秒間50~100クエリ程度と控え目なのだが、
Zabbix 7.0にアップグレードした直後から秒間200~300クエリに増加しており、
さらに今までは無かったAAAAレコードのDNS名前解決も増加している事が分かった。
そんなでログ解析しながらコミュニティを漁っていたら、時期もバージョンもズバリ合致する記事が見つかった。
This looks like being a feature of libevent that Zabbix 7.0 uses for async DNS resolution. |
どうやら、Zabbix 7.0の非同期DNS名前解決で利用しているlibeventライブラリの機能らしく、
プログラムの組み方次第ではAAAAレコードも無作為に名前解決してNXDOMAINになり、
NXDOMAINをキャッシュせずに改めて名前解決を行う無限ループになる様だった。
………
さらに、DNSクエリがDNS-0x20で大小英数字にランダマイズされる事により、
より一層キャッシュに乗りにくくなっていた。
DNS-0x20の仕組みはカミンスキー攻撃などDNSキャッシュポイズニングを防止する目的で有用だが、
環境によっては凶悪なDDoS状態になり得ると実感した。
筆者の環境ではDNSキャッシュサーバのクエリログ解析をしているので、
DNS-0x20を施されると困る場合もあるのだが、仕様らしく解除するにはプログラムを書き換えるしか無さそう。
コミュニティにみお解決困難と書かれてあり、ワークアラウンドもDNSキャッシュを使う方法のみだった。
自宅のDNSキャッシュサーバは元からスペックを積んでいるので余裕で耐えられるクエリ数ではあるが、
エンタープライズなど大規模環境でコレが発生すると、凄い負荷がかかる筈なのでぞっとする。
特にISPやサーバ事業者とかは死活問題な気がする (´・ω・`)
以前に仕様と分かっているならサーバ増強で対処も出来るが、バグの分類にも感じるので解決は難しそう。
メジャーバージョンアップなので何かあると思っていたが、予期しない所から刺客が来た形となった。
2024年08月31日(土) - 21:30 | カテゴリ:
Linux
過去の名残で利用しているRJ45のSFPモジュールがあるのだが、
EtherChannelの片系トラフィックが0bpsのままになっている事に気づいた。
SFPモジュール故障と判断して在庫のモジュールとも交換した所、
交換した直後に別のSFPモジュールも応答しなくなり自宅で二重障害に派生した。


今回故障したSFPモジュールの片割れがこちら。筆者の元で5年は動作してくれた。
物理ポートが余っているので、そちらに差し変えるのも一つの手だが、
SFPモジュールが故障した時の挙動含め自宅で検証しているので今後も続投予定。
だが、在庫が無くなってしまったので次のモジュールを購入する必要が出てきた。
今回を機に高耐久モデルを導入したいが値段が高いので尻込み中。
最終的には同系統の耐熱モデルになりそうだが、届いたらモジュールを入れ替えたい所。
最近、周囲のIT機材が物理的に故障し続けているので諸々の寿命が来ているのかもしれない。
物理装置は在庫を一応は確保しているが、そろそろ次期バックボーンを考えていく必要があるかも。