停電後、アマゾンは上級エンジニアにAI支援の変更を承認させる方針
概要
- Amazonが通常は任意参加の会議への出席をスタッフに要請
- AI支援による変更にはシニアエンジニアの承認が必須に
- AWSでAIコーディングツールによる障害が複数発生
- 人員削減後の障害増加に関する社内の声と会社の反論
- 障害の影響範囲や今後の運用改善方針についての説明
Amazonによる会議出席要請とAI運用強化
- Amazonは通常任意参加である会議への出席をスタッフに要請
- TWiSTは小売テクノロジーリーダーとチームによる週次運用会議
- ウェブサイト可用性の見直しは「通常業務の一環」と説明
AI支援変更の承認プロセス強化
- ジュニアおよびミッドレベルエンジニアによるAI支援変更には
- AI活用のリスク管理を強化する方針
AWSにおけるAI関連障害事例
- **Amazon Web Services (AWS)**でAIコーディングアシスタント起因の障害が少なくとも2件発生
- Kiro AIコーディングツールによる環境の「削除と再作成」で13時間の中断
- 2023年12月中旬、コスト計算ツールで発生
- 影響は中国本土の一部サービスに限定
- 2件目の障害は「顧客向けサービス」には影響なし
人員削減と障害増加に関する見解
- Amazonエンジニアによると、事業部門で「Sev2」インシデントが増加
- 「Sev2」は迅速な対応が必要な障害
- レイオフが影響しているとの声
- Amazonは人員削減が障害増加の原因であることを否定
- 2024年1月に16,000人のコーポレート職を削減
今後の運用改善と対応方針
- AIツールの利用拡大を進めつつ、リスク管理体制を強化
- 会議や承認プロセスの厳格化による運用の安定化を目指す方針