ジュニアからテックリードへ
ジュニアからテックリードへ

ジュニアからテックリードへ:中村の3年間の軌跡

理想的な成長環境を見つけたインフラエンジニアの成功ストーリー
本記事は、(実在の個人ではない)複数の事例を統合したケーススタディとして、ジュニアのインフラエンジニア「中村」が3年間でテックリードへ到達するまでの“具体的な行動・成果・仕組み化”を時系列で整理します。再現可能なテンプレートとチェックリストも付属。


プロフィール(前提)

  • 役割(入社時):ジュニアインフラエンジニア(クラウド運用+CI/CD補助)
  • 組織:プロダクトエンジニア40名、SRE/プラットフォーム7名、スクワッド体制
  • 指標文化:SLO/エラーバジェット、変更失敗率、MTTR、クラウドコスト(単位経済性)
  • 環境の特徴(“理想的”とは)
    1. 失敗を責めないブレームレスなふりかえり
    2. 小さく出して計測(トライアル→検証→標準化)
    3. キャリアを役割×成果で語る(職能レベル定義、ルーブリック運用)
    4. 週次デモ・PRのレビュー文化(レビューは育成の場)

Year 1:土台づくりと“最初の勝ち筋”

ミッション:安定運用の習慣化+自動化の芽を作る。

  • 技術の基礎固め:Linux/ネットワーク/HTTP、クラウド基礎、IaC(Terraform)を“日々使う範囲”から学ぶ。
  • 最初の成果(3か月)
    • デプロイジョブの分割&並列化で平均デプロイ時間 28分→12分
    • 監視メトリクスの命名規約を整え、誤検知アラートを週35件→8件に削減。
  • 半年の成果
    • バックアップ検証を自動化(週次検証の成功率を**70%→99%**へ)。
    • 主要ランブックをMarkdown化し、オンコール引き継ぎ時間を30%短縮
  • 学び:ツール導入=目的ではない。“指標に紐づく小改善”を連続させると、周囲から“任せられる”が貯まる。

Year1の評価材料(ポートフォリオ)

  • 「デプロイ時間短縮のPR差分」「監視命名規約」「バックアップ検証パイプライン」
  • Before→Afterのスクリーンショットと、再現手順。

Year 2:オーナーシップ拡大と“仕組み化”

ミッション:小さな改善を“標準のやり方”に昇格させる。

  • SLO導入の主担当
    • フロントAPIの**レイテンシSLO(p95 300ms)**と可用性SLO(99.9%)を策定。
    • SLOダッシュボードを公開し、プロダクトとの共通言語を確立。
  • リリース信頼性の改善
    • 変更失敗率を**23%→9%**へ(シフトレフトの統合テストとBlue/Green運用)。
    • ロールバック平均時間(平均MTTR)を48分→14分に短縮(ワンコマンド化)。
  • FinOpsの芽
    • タグ基準の徹底で**未分類コストを月額の12%→2%**へ。
    • 予約/コミットの見直しで年間見込みコスト-11%
  • 人のリード:インターン2名をメンター。週次1on1(目的→進捗→障壁→次の一手)を習慣化。

Year2の評価材料

  • SLO定義書、運用ポリシー、エラーバジェットレポート(四半期)。
  • 変更失敗率改善の実験ログ、ロールバック手順動画。
  • FinOpsタグ設計・ダッシュボードのスクリーンショット。

Year 3:テックリードとして“技術×人×事業”を接続

ミッション:プロダクト横断の開発者体験(DX)信頼性の両輪を主導。

  • 内製プラットフォーム(IDP)ミニマム版の立ち上げ
    • テンプレートからセルフサービスで“安全に本番へ”を実現(CI/CD、権限、監視、SLO雛形まで一体化)。
    • 新規サービスの初回デプロイ所要時間 3日→半日。オンボーディングは手順書だけで完了。
  • インシデント運用の再設計
    • 重大インシデントの平均検知→収束 41分→17分(自動トリアージと役割明確化)。
    • ポストモーテム標準を策定し、再発防止率を可視化。
  • 採用・評価への関与
    • 面接ルーブリック(スキル/行動)を整備、バーのブレを削減。
    • ジュニア→シニアのキャリアラダーを更新(職能×インパクトの両軸)。
  • ステークホルダーリード:プロダクト/CS/財務と四半期レビュー(SLO・変更失敗率・コスト指標)を1枚のダッシュボードで合意形成。

Year3の評価材料

  • IDPのアーキ図、テンプレート群、ガードレールのポリシー。
  • インシデント運用のRACI表、ポストモーテム例。
  • 面接ルーブリック・キャリアラダー(公開可能な範囲)。

中村が使った“再現性のある”型・テンプレ

1) 30-60-90日プラン(ロール切り替え時)

  • 0–30日(観測):指標・SLO・依存関係・危険変更を棚卸し。小さな改善×3を出す。
  • 31–60日(実装):スループットを上げる仕組みを1つ(例:テンプレ/自動化)導入。
  • 61–90日(定着):ルール化・ドキュメント化・ダッシュボード化で“人に依存しない”状態へ。

2) ふりかえりテンプレ(週次/インシデント後)

  • What(事実)→So What(意味・指標)→Now What(次の一手)
  • 失敗は必ず実験番号に紐づけて、再現性を担保。

3) ADR(意思決定記録)ミニ雛形

  • 背景 / 選択肢 / 決定 / トレードオフ / ロールバック条件 / 再評価日

4) 面接ルーブリック(採用関与用・要約)

  • 技術深掘り、設計トレードオフ、運用/安全、コラボ、実務の証拠(PR/Runbook/ダッシュボード)。

アーキテクチャ(テキスト図・IDPの最小構成例)

dev -> repo template -> CI (lint/test/scan) -> image registry
             |                 |
             v                 v
        IaC module ------> staging (blue)
             |                 |
             v                 v
       policy guard      canary deploy -> prod (green)
             |
             v
        observability (metrics/log/trace) + SLO widget

“理想的な環境”を見分ける質問リスト(転職/社内異動向け)

  • SLOエラーバジェットをどの頻度でレビューしていますか?
  • 直近の重大インシデントの学びは何で、どの仕組みに反映されましたか?
  • 開発者が本番に到達するまでのステップは何段階で、セルフサービス化はどの程度ですか?
  • キャリアラダーと評価の実例を見せてもらえますか?(昇格基準の透明性)
  • コスト指標(タグ・単位経済性)を誰が、どの会議体で見ていますか?

失敗と学び(よくある落とし穴)

  • ツール先行:導入=価値ではない。指標→実験→定着の順序を守る。
  • 属人化:ヒーロー対応は短期的成果でも、長期は負債。ランブックと自動化に還元する。
  • “言語化しない”成長:成果はADR/ダッシュボード/ドキュメントに残して初めて組織の資産になる。

真似しやすい“今日からの3ステップ”

  1. 運用指標の1枚化(SLO/変更失敗率/MTTR/コストの現状)
  2. 小さな自動化を1つ(可視化でも可)+必ずBefore→Afterで残す
  3. 週次デモで共有(反応から次の仮説を作る)

まとめ

  • テックリードは肩書ではなく、技術×人×事業をつなぐ仕事
  • 中村の3年は「小さく出す→測る→仕組みにする」の反復でできている。
  • 再現性の鍵は指標駆動・ふりかえり・意思決定の記録。環境がそれを後押しするかを見極めよう。

付録:使い回せるチェックリスト(抜粋)

  • [ ] SLO定義(可用性/レイテンシ/エラーバジェット)
  • [ ] 変更失敗率・MTTRの月次レビュー
  • [ ] ロールバックのワンコマンド化
  • [ ] ランブック整備(新人が読んで動ける粒度)
  • [ ] FinOpsタグ基準・未分類0%運動
  • [ ] ADRの週次メンテ(古い決定の棚卸し)
  • [ ] 採用ルーブリックとオンボーディング手順の整合

投稿者 greeden

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)