概要
- GitHubは Copilotユーザーのインタラクションデータ をAIモデルの学習に活用開始
- 2024年4月24日以降、Free, Pro, Pro+ユーザーが対象(オプトアウト可能)
- Business, Enterpriseユーザーは対象外
- 収集データには 入力・出力・コードスニペット等 が含まれる
- オプトアウト済みの設定 はそのまま維持
GitHub Copilotにおけるデータ利用方針の更新
- 2024年4月24日以降、Copilot Free, Pro, Pro+ユーザーの 入力・出力・コードスニペット・関連コンテキスト などのインタラクションデータをAIモデルの学習に使用開始
- オプトアウト を希望する場合、 設定>プライバシー から選択可能
- Copilot BusinessおよびEnterpriseユーザーは本変更の対象外
- 以前に データ収集を拒否したユーザー は、その設定が維持され、再度の同意がない限りデータは利用されない
- この方針は 業界標準に則り、モデルの性能向上を目的
データ利用の目的と効果
- 実際の開発現場からのデータ を活用することで、AIモデルの 精度・安全性・多様性 を向上
- Microsoft社員のインタラクションデータ 導入により、受け入れ率や多言語対応での性能向上を確認
- より多様なユースケースに対応するため、 現実のユーザーデータ での学習が重要
収集・活用されるデータ範囲
- ユーザーが 受け入れた/修正した出力
- Copilotへの入力 (コードスニペット含む)
- カーソル周辺のコードコンテキスト
- コメント・ドキュメント
- ファイル名・リポジトリ構造・ナビゲーションパターン
- Copilot機能とのインタラクション (チャット、インライン提案など)
- 提案へのフィードバック (いいね・よくないねなど)
利用されないデータ
- Copilot Business/Enterpriseや企業所有リポジトリのインタラクションデータ
- オプトアウト設定をしたユーザーのデータ
- イシュー・ディスカッション・プライベートリポジトリの静的データ
- ただし、Copilot利用中のプライベートリポジトリのコードはサービス提供のため処理される場合あり
データ共有とプライバシー
- GitHubの関連会社(Microsoft含む)とのみデータ共有
- 第三者AIモデル提供者や独立サービスプロバイダーとは共有しない
- プライバシー重視 の姿勢を維持
ユーザーへのメッセージ
- AI支援開発の未来 には現実の開発者データが不可欠
- MicrosoftおよびGitHub社員のデータ活用 でモデル改善を推進
- 参加することで、より良いAIツールの構築に貢献可能
- 参加を希望しない場合もAI機能は引き続き利用可能
- FAQやディスカッション で詳細確認可能
Mario Rodriguezについて
- GitHub Chief Product Officer
- 20年以上 MicrosoftおよびGitHubで開発者ツールの推進
- CopilotのAI戦略・製品ライン を統括
- 教育活動や家族との時間 も大切にしている人物
関連情報
- GitHubの可用性問題への対応状況
- 最近の障害と安定化作業についての詳細共有
- GitHub Docs
- GitHub活用のための総合情報
- GitHub Build
- 世界中の誰もが何でも作れるプラットフォーム
- カスタマーストーリーやPodcast
- 現場の声や最新トレンドの紹介