ハクソク

世界を動かす技術を、日本語で。

1Mコンテキストが「Opus 4.6」と「Sonnet 4.6」で一般提供開始されました

概要

  • Claude Opus 4.6Sonnet 4.6が1Mトークンのコンテキストウィンドウを標準価格で提供開始
  • 長文コンテキストプレミアム廃止、全長で均一料金
  • 画像・PDF上限が600枚/ページに拡大
  • 主要クラウドサービスでも利用可能
  • エンジニアや法律分野など多分野での活用事例

Claude 1Mコンテキストウィンドウの標準価格提供

  • Claude Opus 4.6Sonnet 4.61Mトークンのコンテキストウィンドウを標準価格で提供開始
    • Opus 4.6:$5/$25(百万トークンあたり)
    • Sonnet 4.6:$3/$15(百万トークンあたり)
  • 長文コンテキスト利用時の追加料金不要
    • 900Kトークンでも9Kトークンでも同一単価課金
  • 全長でレート制限も均一適用、アカウントのスループットも全ウィンドウで統一
  • 画像・PDF上限が600枚/ページに拡大(従来の6倍)
  • Claude PlatformMicrosoft Azure FoundryGoogle Cloud Vertex AIで利用可能
  • ベータヘッダー不要、200K超リクエストも自動処理
  • Claude Code(Max, Team, Enterprise)はOpus 4.6で1Mコンテキストを自動利用

1Mコンテキストの品質・活用例

  • Opus 4.6は**MRCR v2で78.3%**と業界最高水準の長文リコール性能
  • 長文でも高精度、世代ごとにリトリーバル改善
  • 膨大なコードベース、数千ページの契約書、長時間エージェントの全履歴も一括投入可能
    • 要約やコンパクションの頻度低減、会話の文脈保持
  • Claude Codeでは100K+トークンの検索や集約も1Mウィンドウで一括実行
    • コンパクションイベント15%減少、長時間エージェントの記憶力向上

エンジニア・法律・研究現場での具体的事例

  • Devin Review agent:大規模diffレビューが1Mで高品質・効率化
  • Eve(法律AI):400ページの証言記録やケースファイルの横断参照が容易
  • 物理学研究:百本超の論文・証明・コードを一度に統合解析
  • 社内法務:100ページ契約書の複数バージョン比較・交渉履歴の一括把握
  • 大規模システム運用:全アラート・理論・信号を1Mで統合管理
  • AIエージェント:200K→500Kへの拡張でトークン消費効率化
  • スプレッドシートタスク:複雑な調査・マルチステップ計画も文脈保持

導入・利用開始ガイド

  • Claude PlatformAmazon BedrockGoogle Cloud Vertex AIMicrosoft Foundry即時利用可能
  • **Opus 4.6搭載のClaude Code(Max, Team, Enterprise)**は1Mコンテキストが自動適用
  • 詳細は公式ドキュメント・価格表参照

Claudeで業務変革・最新情報

  • 組織のオペレーション変革を支援
  • 開発者向けニュースレターで最新情報・プロダクトアップデート・事例を毎月配信
    • メールアドレス登録で購読可能(いつでも解除可)

Hackerたちの意見

大きな変化は、> 「標準価格が両モデルの1Mウィンドウ全体に適用され、長いコンテキストのプレミアムがなくなったこと。」メディアの制限が600画像またはPDFページに拡大されたこと。Claude Codeユーザーにとっては大きなニュースだね。200kトークンを超えても一貫性が強いと仮定すると。
そんなにフルなコンテキストウィンドウって、実際に役に立つことあるのかな?俺は使用率を40%以下、つまり約80kトークンに抑えるようにしてる。Dex Horthyが言ってる「ダムゾーン」を避けるためにね。今のところ、これでうまくいってるよ。雰囲気は不要だね: https://youtu.be/rmvDxxNubIg?is=adMmmKdVxraYO2yQ
1Mウィンドウの品質は、特にコーディング作業に関してはすごく悪かったな。既存の会話で起こったことを常に忘れちゃう。n=1、状況によるかもね。
さて、問題は何が使用に影響を与えているかってことだよね。コンテキストが増えるにつれて、入力トークンの量も増えていくから。800Kトークンを入力にしたモデルコールは、100Kトークンのモデルコールの8倍もコストがかかるんだ。特に会話を再開してキャッシュがヒットしない場合、APIの価格設定ではすごく高くつくよ。
仕事で1Mウィンドウを使ってるんだけど、企業プランを通じてAIを開発のワークフローに取り入れ始めたところなんだ(Cline経由で)。700kを超えるまでは結構持ちこたえてたけど、それを超えると時々ちょっと頭が悪くなったりもした。(ハンズオンのペアプログラミングモードで使ってるから、完全自動のバイブコーディングモードではないよ。)
じゃあ、1枚の絵は1666語の価値があるってこと?
Claude Code 2.1.75では、ベースのOpusと1M Opusの区別がなくなったよ。同じモデルになったんだ。変化はMax+専用のはずなのに、Proを使ってる私も同じ状況を見てるのがちょっと変だね。編集:Proはこれにアクセスできないと思う。普通のプロンプトがコンテキストの制限に達しちゃった。200kトークンを超える追加料金の撤廃は、GPT 5.4の1Mウィンドウとその追加料金に対するAnthropicの反撃かもしれないね。
Proには変化なし、今確認したけど、1Mコンテキストはまだ追加使用だよ。
マックス20倍持ってるけど、まだ2.1.75では別々なんだよね。
効果的なコンテキストについての解説はどこかにある?100kトークンのコンテキストウィンドウでも、実際に使えるウィンドウはそれより小さいことが多かったと思う。100kに近づくにつれてパフォーマンスがかなり落ちたし。今もそれが真実だと思うけど、曲線はどんな感じなんだろう?
提供されたベンチマークチャートがその解説だよ。他はただの経験則だね。
仕事でこれを言ったけど、コンテキストは同じ速度で劣化するね。90kトークン消費しても、100kのコンテキストウィンドウでも1Mでも同じように悪い結果になる。個人的には6M以上のコードベースを使っていて、古いウィンドウでは問題なかったけど、小さなプロジェクトのように盲目的にコードベースに送信するわけじゃない。スケールで良いプロンプトが必要だね。
トランスフォーマーのアテンションって、コンテキストサイズに関しては複雑さが二次関数的じゃなかったっけ?1Mトークンのコンテキストを実現するためには、これらのモデルがたくさんのショートカットを使ってると思う。専門家じゃないけど、これがコンテキストロットの説明になるかもね。
これはめっちゃワクワクする!今日ちょっと触ってみたけど、確実にワークフローが変わるね。サブエージェントとの3、4時間の並行コーディングセッションが、今は1つのマスターセッションに収まる感じ。統計によると、Opusの1Mは256kの5.4と同じくらいだって。長いコンテキストテストは、残念ながら質のある推論能力と必ずしも一致しないけど、これはまだ大きな改善だし、私のテストでは劇的な落ち込みは見られなかった。q4 '25モデルとは違ってね。追記:コンテキストが長くなるにつれてソネット4.5が相対的に良くなるのはどういうこと?
ランダムな質問だけど、Claude Codeは自分で払ってるの?それとも会社が払ってるの?うちの会社はGitHub Copilotの拡張機能だけ払ってるんだ。
よくなった?Sonnet 4.5の1Mをよく使ってたけど、パフォーマンスは同じくらいだった印象だけど、1Mモデルは各ステップでより多くのトークンを使うから、すごく速くなったよ。
Claudeの価格設定で一番変なのは、5Xプランが前のプランの5倍のコストだってこと。普通は大きいプランを買うと何らかの割引があるのに、Claudeでは「5倍の使用量、5倍のコスト、はいどうぞ」って感じ。
5対5
彼らが買ってほしいプランじゃないよ。20倍プランを買わせるための価格戦略なんだ。
どちらも補助金が出てると思うから、どっちもお得だよ。
そういうボリュームディスカウントは、もっと消費を促すためにやることだよね。Anthropicは今、物流的に対応できる以上の需要があるから(稼働率のチャート見てみて、信頼性がほとんど1/9だよ)。彼らにとって、1人のユーザーが5ユニットの計算を消費するより、5人のユーザーが1ユニットを消費する方が魅力的なんだ。もし純粋な価格効率だけが彼らの関心事なら、彼らはおそらく「減少価値」価格設定を導入するだろうね。
長いコンテキストでの応答の一貫性はどうなんだろう?他のモデルだと、ウィンドウが大きくなるにつれて、あるポイントを過ぎると質が急激に落ちるのをよく見るんだよね。
昨日と比べて、Claude Maxのサブスクリプションは使用量がめちゃくちゃ減ってる(今日のリセットからの週の使用量の13%が、C++の新プロジェクト2つで数回のプロンプトだけで)し、耐えられないほど遅くなった(プロンプトの応答に1時間かかるくらい)。GGWP Anthropic、楽しかったけど、これには何百ドルも払う価値はないよ。
そうだね、東部時間の朝のClaudeは厳しいね。
すごいな.... Sonnet 4.5では、Clineが400kでソフトトリガーの圧縮をしてた(500kではちょっと迷子になったけど)。でも、4.6モデルの安定性は注目に値するよ。小さいコンテキスト(小さなファイル、簡潔なプラン)で理解しやすいシステムを構築するのはやっぱり大事だと思うけど、これは素晴らしいね。(あ、最近はすっかりClaude Codeにハマってるよ...)
これすごいね。長時間のタスクをやるとき、指示をメモリーに保存して、復元する必要があるんだよね。
クロードがトークンをどんどん消費しなくなってるのに気づいたよ。特に、ツールを毎週使ってるのも影響してるかも。