ジュニアからテックリードへ:中村の3年間の軌跡
理想的な成長環境を見つけたインフラエンジニアの成功ストーリー。
本記事は、(実在の個人ではない)複数の事例を統合したケーススタディとして、ジュニアのインフラエンジニア「中村」が3年間でテックリードへ到達するまでの“具体的な行動・成果・仕組み化”を時系列で整理します。再現可能なテンプレートとチェックリストも付属。
プロフィール(前提)
- 役割(入社時):ジュニアインフラエンジニア(クラウド運用+CI/CD補助)
- 組織:プロダクトエンジニア40名、SRE/プラットフォーム7名、スクワッド体制
- 指標文化:SLO/エラーバジェット、変更失敗率、MTTR、クラウドコスト(単位経済性)
- 環境の特徴(“理想的”とは)
- 失敗を責めないブレームレスなふりかえり
- 小さく出して計測(トライアル→検証→標準化)
- キャリアを役割×成果で語る(職能レベル定義、ルーブリック運用)
- 週次デモ・PRのレビュー文化(レビューは育成の場)
Year 1:土台づくりと“最初の勝ち筋”
ミッション:安定運用の習慣化+自動化の芽を作る。
- 技術の基礎固め:Linux/ネットワーク/HTTP、クラウド基礎、IaC(Terraform)を“日々使う範囲”から学ぶ。
- 最初の成果(3か月):
- デプロイジョブの分割&並列化で平均デプロイ時間 28分→12分。
- 監視メトリクスの命名規約を整え、誤検知アラートを週35件→8件に削減。
- 半年の成果:
- バックアップ検証を自動化(週次検証の成功率を**70%→99%**へ)。
- 主要ランブックをMarkdown化し、オンコール引き継ぎ時間を30%短縮。
- 学び:ツール導入=目的ではない。“指標に紐づく小改善”を連続させると、周囲から“任せられる”が貯まる。
Year1の評価材料(ポートフォリオ)
- 「デプロイ時間短縮のPR差分」「監視命名規約」「バックアップ検証パイプライン」
- Before→Afterのスクリーンショットと、再現手順。
Year 2:オーナーシップ拡大と“仕組み化”
ミッション:小さな改善を“標準のやり方”に昇格させる。
- SLO導入の主担当:
- フロントAPIの**レイテンシSLO(p95 300ms)**と可用性SLO(99.9%)を策定。
- SLOダッシュボードを公開し、プロダクトとの共通言語を確立。
- リリース信頼性の改善:
- 変更失敗率を**23%→9%**へ(シフトレフトの統合テストとBlue/Green運用)。
- ロールバック平均時間(平均MTTR)を48分→14分に短縮(ワンコマンド化)。
- FinOpsの芽:
- タグ基準の徹底で**未分類コストを月額の12%→2%**へ。
- 予約/コミットの見直しで年間見込みコスト-11%。
- 人のリード:インターン2名をメンター。週次1on1(目的→進捗→障壁→次の一手)を習慣化。
Year2の評価材料
- SLO定義書、運用ポリシー、エラーバジェットレポート(四半期)。
- 変更失敗率改善の実験ログ、ロールバック手順動画。
- FinOpsタグ設計・ダッシュボードのスクリーンショット。
Year 3:テックリードとして“技術×人×事業”を接続
ミッション:プロダクト横断の開発者体験(DX)と信頼性の両輪を主導。
- 内製プラットフォーム(IDP)ミニマム版の立ち上げ:
- テンプレートからセルフサービスで“安全に本番へ”を実現(CI/CD、権限、監視、SLO雛形まで一体化)。
- 新規サービスの初回デプロイ所要時間 3日→半日。オンボーディングは手順書だけで完了。
- インシデント運用の再設計:
- 重大インシデントの平均検知→収束 41分→17分(自動トリアージと役割明確化)。
- ポストモーテム標準を策定し、再発防止率を可視化。
- 採用・評価への関与:
- 面接ルーブリック(スキル/行動)を整備、バーのブレを削減。
- ジュニア→シニアのキャリアラダーを更新(職能×インパクトの両軸)。
- ステークホルダーリード:プロダクト/CS/財務と四半期レビュー(SLO・変更失敗率・コスト指標)を1枚のダッシュボードで合意形成。
Year3の評価材料
- IDPのアーキ図、テンプレート群、ガードレールのポリシー。
- インシデント運用のRACI表、ポストモーテム例。
- 面接ルーブリック・キャリアラダー(公開可能な範囲)。
中村が使った“再現性のある”型・テンプレ
1) 30-60-90日プラン(ロール切り替え時)
- 0–30日(観測):指標・SLO・依存関係・危険変更を棚卸し。小さな改善×3を出す。
- 31–60日(実装):スループットを上げる仕組みを1つ(例:テンプレ/自動化)導入。
- 61–90日(定着):ルール化・ドキュメント化・ダッシュボード化で“人に依存しない”状態へ。
2) ふりかえりテンプレ(週次/インシデント後)
- What(事実)→So What(意味・指標)→Now What(次の一手)
- 失敗は必ず実験番号に紐づけて、再現性を担保。
3) ADR(意思決定記録)ミニ雛形
- 背景 / 選択肢 / 決定 / トレードオフ / ロールバック条件 / 再評価日
4) 面接ルーブリック(採用関与用・要約)
- 技術深掘り、設計トレードオフ、運用/安全、コラボ、実務の証拠(PR/Runbook/ダッシュボード)。
アーキテクチャ(テキスト図・IDPの最小構成例)
dev -> repo template -> CI (lint/test/scan) -> image registry
| |
v v
IaC module ------> staging (blue)
| |
v v
policy guard canary deploy -> prod (green)
|
v
observability (metrics/log/trace) + SLO widget
“理想的な環境”を見分ける質問リスト(転職/社内異動向け)
- SLOとエラーバジェットをどの頻度でレビューしていますか?
- 直近の重大インシデントの学びは何で、どの仕組みに反映されましたか?
- 開発者が本番に到達するまでのステップは何段階で、セルフサービス化はどの程度ですか?
- キャリアラダーと評価の実例を見せてもらえますか?(昇格基準の透明性)
- コスト指標(タグ・単位経済性)を誰が、どの会議体で見ていますか?
失敗と学び(よくある落とし穴)
- ツール先行:導入=価値ではない。指標→実験→定着の順序を守る。
- 属人化:ヒーロー対応は短期的成果でも、長期は負債。ランブックと自動化に還元する。
- “言語化しない”成長:成果はADR/ダッシュボード/ドキュメントに残して初めて組織の資産になる。
真似しやすい“今日からの3ステップ”
- 運用指標の1枚化(SLO/変更失敗率/MTTR/コストの現状)
- 小さな自動化を1つ(可視化でも可)+必ずBefore→Afterで残す
- 週次デモで共有(反応から次の仮説を作る)
まとめ
- テックリードは肩書ではなく、技術×人×事業をつなぐ仕事。
- 中村の3年は「小さく出す→測る→仕組みにする」の反復でできている。
- 再現性の鍵は指標駆動・ふりかえり・意思決定の記録。環境がそれを後押しするかを見極めよう。
付録:使い回せるチェックリスト(抜粋)
- [ ] SLO定義(可用性/レイテンシ/エラーバジェット)
- [ ] 変更失敗率・MTTRの月次レビュー
- [ ] ロールバックのワンコマンド化
- [ ] ランブック整備(新人が読んで動ける粒度)
- [ ] FinOpsタグ基準・未分類0%運動
- [ ] ADRの週次メンテ(古い決定の棚卸し)
- [ ] 採用ルーブリックとオンボーディング手順の整合