成功した概念実証を最も速く殺す方法は、オブザーバビリティなしでオペレーションに渡すことです。機能するものを構築しました。問題を解決します。みんなが興奮しています。そして本番環境に着地すると、SREチームはそれをどう監視するかわからず、デバッグする方法もなく、午前2時に何かが壊れたときにロールバックできる自信もありません。
6ヶ月後、誰も適切に実行することを信頼しなかったため、元の開発者のラップトップでまだ動作しています。
私たちはテレメトリー契約と呼ぶもので解決します:すべてのProof Sprintに付属する、交渉の余地のないオブザーバビリティとハンドオフの要件セットです。
なぜテレメトリーはオペレーションの問題ではなくデリバリーの問題か
ほとんどのチームはオブザーバビリティを、オペレーションがデリバリー後に追加するものとして扱います。テレメトリー契約はこれを逆転させます。オブザーバビリティは後付けではなく、デリバリー要件です。
シグナルパリティ:あなたのコレクター、あなたのダッシュボード
すべてのProof Sprintは、クライアントがすでに使用しているフォーマットでトレース、メトリクス、ログを出力します。Datadogを使っているなら、Datadogに出力します。PrometheusとLokiでGrafanaを使っているなら、それらに出力します。
エビデンスパケット
すべてのProof Sprintにはエビデンスパケットが含まれます:セキュリティと運用のアーティファクトの文書化されたバンドル。パケットには以下が含まれます:SBOM、SCAレポート、IAM差分、データフロー文書。
オペレーション用の滑走路:Day 2を退屈にする
システムが本番で稼働する最初の日はエキサイティングです。2日目は退屈であるべきです。私たちは退屈なDay 2のために設計します:カナリアデプロイメントプラン、ランブック、ロールバック手順、キャパシティプランニングノート。
なぜこれがビジネスケースに重要か
テレメトリー契約は、これらすべてを事前にリスク軽減します。Proof Sprintを引き渡すとき、オペレーションチームは既存のツールを使用しているため、サポート方法をすでに知っています。