AIの経済は理解できない

14時間前原文(www.wheresyoured.at)

概要

GitHub Copilotが2026年6月から従量課金制に移行
AIサブスクリプションの経済モデルの破綻を指摘
AIサービスのコスト構造と利用者への影響を詳細分析
利用者の反発と業界全体の価格改定の流れ
従量課金制が避けられない理由を説明

GitHub Copilotの価格改定とAIサブスクリプションの限界

GitHub Copilotが2026年6月1日より従量課金制へ完全移行
- これまでの「リクエスト数」制から、実際のモデル利用コストに基づく請求へ
- 月額$19プランの場合、利用者は$19分のトークンを消費可能
Microsoftは「持続可能で信頼性の高いCopilot事業」を目指すと説明
Copilotは従来のエディタ内アシスタントからエージェント型プラットフォームへ進化
- 長時間・多段階のコーディングセッションや最新モデル利用が可能に
- これにより計算資源・推論コストが大幅増加
現在のプレミアムリクエストモデルは経済的に維持不可能
- GitHubがこれまで大半の推論コストを負担していたが限界に到達
従量課金制は実利用に応じた課金で、サービスの信頼性維持やヘビーユーザーの制限緩和に寄与

AIサービスの経済モデルの問題点

AIサブスクリプションの多くは実際のコストを隠蔽
- 利用者は「トークン」「メッセージ」「時間制限」等でコスト実感なし
実際はAIスタートアップや大手クラウドが多額のコストを負担
- 例：Anthropicは1ドルのサブスクで8ドル分の計算資源を提供
- OpenAIも同様の状況
サービス提供側は「サブスクで利用者を囲い込み、後で値上げ」を想定
- しかし推論コストはむしろ上昇傾向
- 新型モデルほどトークン消費が激しく、コスト増加
月額サブスクリプションでLLMサービスを成立させるのは不可能
- 利用者ごとのコスト変動が大きく、静的な価格設定が困難

価格改定がもたらす影響と利用者の反発

GitHub Copilot利用者の間で「サービス終了」「完全に台無し」との声が噴出
Wall Street Journalによると
- 個人利用者は月額$10支払いに対し、Microsoftの平均損失は1人あたり月$20超
- 一部のヘビーユーザーには月$80ものコスト負担
AIサービス各社も同様に損失を抱え、今後広範な値上げ・従量課金化が進行予想

AIサブスクリプションとUberの比較

Uberの価格改定は経済構造自体は変わらず
- 利用者は乗車ごとに支払い、ドライバーも実費負担
AIサブスクリプションは「Uberが月額$20で100回乗車、ガソリン代$150/ガロンをUber負担」という異常なモデル
- 利用者は実コストを意識せず、企業側が赤字を垂れ流し
- 従量課金移行は「ガソリン代を利用者負担」に近い構造変化
サブスクモデルは「AI実コストから利用者を切り離すための補助金スキーム」

LLMサービスにおける従量課金制の必然性

LLMサービスのコストは利用内容により大幅に変動
- 軽い利用者とヘビー利用者で負担が全く異なる
利用者ごとのコストを企業側がコントロール不可
- 制限を強化すれば製品の魅力低下、緩和すれば赤字拡大
利用者の多くは「トークン消費量やコスト感覚が希薄」
- 従量課金移行で利用行動の見直しが不可避
月額サブスクは固定コスト型サービスには適合するが、LLMのような可変コスト型サービスには不向き

今後のAI業界動向と利用者への提言

今後、全AIサービスで従量課金制や値上げが広がる見通し
- 企業は「サブスクで囲い込み→値上げ」戦略からの転換を迫られる
利用者は「AIサービスの真のコスト」を意識し、利用方法やサービス選定を見直す必要
サブスク時代の終焉と新たなAI利用の経済常識の確立が求められる

Hackerたちの意見

そうだね。変な価格設定は落ち着いてきてるみたいだし、電気と比べるのが面白いね。基本的にAnthropicは定額の電気サブスクリプションを売ってたんだけど、高い洗濯機（OpenClaw）をサブスクリプションに接続する人が出てきたら、価格モデルを変える代わりに洗濯機を禁止しちゃったんだよね…。AIの価格も「電気」スタイルになるのかな。電気が予測可能なのは、時間を通して平均的な使用量が比較的一定で、価格も管理しやすいからだよね。俺は家の暖房に電気を使ってないし、電気代もある程度の範囲内で管理してる。AIの問題は、今やっと使えるAIが出てきたところで、今のところはまだ高すぎて実用的じゃないから、安定するまで補助金を出してるって感じだね。「安くて賢い」レベルに達するまで、まだ2年はかかる気がするけど、今は補助金をやめちゃってるし、どうなるか興味深いね。

└

OpenClawはClaude APIから禁止されたわけじゃなくて、定額プランだけが禁止されたんだよ。

└

>基本的にAnthropicは定額の電気サブスクリプションを売ってたんだよね？定額だけど、限度があいまいに設定されてた（例えば5倍、10倍、20倍とか）。彼らは「電気」の使い方で差別化してたけど、これは電力会社が住宅ユーザーと産業ユーザーで異なる料金を設定してるのとあまり変わらないよね。

└

ウーバーのサブスクリプションの例もいいね。

一般的に、コンピュータサービスのメーター制課金モデルに対する平均的なユーザーの問題は、コストオーバーランを簡単にコントロールできないことだよね。昔は、スラッシュドットやDDoS攻撃を受けたときにホスティングコストで痛い目にあったり、最近のマイクロサービスの恐怖体験でCIのリトライループが一晩でお金を燃やしたり、今のAIでは質問を考えている間にどれだけ効率的か全然わからなかったりして、結局失望やコストオーバーランの原因になってるんだよね。先週得た価値が得られないって感じることになるし。

└

>一般的に、普通のユーザーがメーター制の請求モデルに対して抱える問題は、コストオーバーランを簡単にコントロールできないことだよね。自動エージェントを夜中に走らせっぱなしにする以外に、これって実際の問題なの？

>いつか、生成AIの信じられないほどの有害な燃焼率が彼らに追いつくことになるだろう。それが価格の上昇につながるか、企業が新しい製品や機能を発表する際に非常に厳しい料金を設定することになるだろう（..）それによって、予算が潤沢な企業の顧客さえもその費用を正当化できなくなるだろう。これが早く起こることを祈ってるけど、しばらくそんな話を聞いてる気がする。

└

大きな船は方向転換に時間がかかるからね。

└

それが起こっていない唯一の理由は、この技術に投じられている膨大な額の資金だよ。企業の評価額も天文学的に過大評価されてるし。この技術には使い道があるし、実際にかなりの数があるんだけど、ChatGPTやClaudeの使い方ではOpenAIやAnthropicが今の評価額に見合う価値を持っているとは到底思えない。両社は、AIのカードハウスの頂点から爆発せずに降りる方法を必死に模索しているところだよ。一方で、DeepSeekは、はるかに少ないハードウェアで動作するより高性能なモデルを出してきて、実際に大多数のユーザーが望んでいることをほぼ完璧に実現している。これは金融的な大惨事になるだろうね。もちろん、責任のある人たちは大丈夫だろうけど、結局は他の人たちが苦しむことになるから、そこが気になるんだよね。

記事にはいくつかの大きな問題があるよ。最も明らかなのは、フロンティアラボがトークンのコストに近い料金を請求していないことだね。私の知る限り、ほとんどの見積もりは80%以上の利益率を見込んでる。参考までに、プロバイダーはKimi K2.6を1Mトークンあたり4ドルで利益を上げて提供してる。Opusと同じくらいの性能かって言ったら違うけど、少なくともSonnetレベルだから、Sonnetよりも約4倍安いのに、マージンで利益を上げられるんだ。だから、実際に補助金の領域に入るには、5:1以上のサブスクリプション対名目トークンコストが必要だよ。一回のチャットセッションでどれだけのトークンを消費できるか現実的に考えてみて。Opusや他のフロンティアモデルは、たぶん60トークン/秒、250kトークン/時間くらいだね。もっと使えるけど、ほとんどの場合、キャッシュは新しい入力よりも5-10倍安い。例えば、リクエストごとに平均500kトークン、90%がキャッシュだとしたら、新しい入力に相当するコストは100-150kトークンになるし、ほとんどの場合、出力に相当するコストは約20-30kトークンになる。1分ごとにリクエストをすると、合計で約1.5-2Mトークン/時間になる。API価格で計算すると、Opusは1時間あたり50ドルだけど、実際にはAnthropicがそれを提供するのにかかるコストは10ドル/時間くらいだろうね。とはいえ、開発者が50ドル/時間を消費しても、大企業の多くの従業員は全てのコストを考慮すると年収10万ドル以上かかるから、彼らを20-30%生産的にするだけでほとんどの人にとっては価値があるんだ。もしラボが最終的にマージンを20-30%に削減したら、サービスを利用するコストは約15ドル/時間になるし、ほとんどのホワイトカラーの仕事は年収3万ドル以上かかるからね。もし年収が8万ドルなら、会社に200万ドルかかるだろうから、あなたを15%生産的にすることで15ドル/時間のコストを相殺できる。だから、ファーストパーティのプロバイダーは補助金の観点から見ても恐ろしい状況にはないんだ。悪い状況にいるのはCursorやPerplexityで、フロンティアモデルを持ってなくてオープンソースコミュニティに依存しているから、通常はフロンティアより6-12ヶ月遅れてる。彼らは80%のマージンで大手が提供するハーネスのAPIコストを全額支払わなきゃいけなくて、これは確かに持続不可能だから、ユーザーにオープンソースモデルやコストで提供できる社内モデルを使わせるか、はたまた大幅に料金を上げる必要がある。Gemini、Claude、ChatGPTのファーストパーティサービスであるAntigravity、Codex、Claude Codeは深刻な問題には直面していないけどね。

└

>そうは言っても、開発者が時給50ドルを使っているとしても、大企業の多くの社員は全てのコストを考慮すると年収10万ドル以上かかるから、彼らを20～30%生産的にするだけでほとんどのケースでそれが価値あるものになるよね。もしラボが最終的にマージンを20～30%に削ったら、サービスを使うコストは約時給15ドルになるし、ほとんどのホワイトカラーの仕事は年収3万ドル以上かかる。もしあなたの年収が8万ドルなら、会社にかかる総コストは20万ドルくらいになるから、あなたを15%生産的にすることでその時給15ドルのコストを相殺できる。この記事を含めて誰も「これは決して利益を生まない」とは言ってないよ。みんな「この面白いツールがこのお金を取り戻すことは無理だ」と言ってるけど、それは完全に正しいと思う。これでお金を稼ぐことは絶対できるけど、この規模では無理だよ。このビジネスの構築は本当にクレイジーで、関わっている企業のいくつかは数十億、さらには数百億ドルの過剰負債を抱えてる。どうやってそれを返済するの？投資家に配当を出しつつ、これを時給15ドルで売るなんて、計算が成り立たないよ。ググったら、アメリカだけで150万から440万の開発者がいるって。まあ、優しく見積もって500万として、彼らが毎日8時間これにサブスクしてたら、年間6億ドルの収益になる。もしその収益を全部使ってこの負債を返済したら、社員の給料や維持費、開発費を一切残さずに、OpenAIが既に抱えている負債を返すのに数十年かかるよ。そう、私はコードに直接関わってるから、それが本当に得意なことだと思ってる。地球上のすべての知識労働者とそのマネージャーが常に自動エージェントを動かすなんて本当に提案してるの？何のために？メールを読んだり書いたりしなくて済むように？その例だけでも、法的、コンプライアンス、セキュリティ違反の大混乱を引き起こすことになるよ。LLMは知能がないし、適切にセキュリティを確保できないからね。ごめん、こんな業界を真剣に受け止められないよ。基本的な計算でも「彼らはヤバい！」って叫んでるのに。

└

>一回のチャットセッションで現実的にどれくらいのトークンを使い切れるの？私は数日で単桁のビリオントークンを使ったよ、参考までに。

└

たくさんの言葉だね。トークン単価は長期的に上がると思う？それとも下がる？タスクごとの価格はどうなるかな？人間の労働の価格は？

└

トークンごとの固定コストじゃないし（そう請求されるけど、固定価格の食べ放題よりはずっとマシだけどね）。生成されたトークンの数に応じてコストがかかるし、各トークンのコンテキストにも比例する（キャッシュされてない入力のためのプレフィルコストも加わる）。だから、平均生成コンテキストが増えると費用が二次的に増えていくんだ。ローカルの言語モデルでエージェント的なコーディングをしようとすると、これがすごく見えてくる。コンテキストの長さやモデルのサイズをコントロールすることが、無駄な努力を避けるのと同じくらい重要だって気づくよ。本当の詐欺は、ChatGPTみたいなAIのQ&Aじゃない。実際、これはかなり実用的だし、会話が長くなるにつれて少しだけ効果が薄れるけどね。問題は、最先端のモデルと巨大なコンテキストを使ったエージェント的なコーディングなんだ。

└

> 知る限り、ほとんどの企業は80%以上の利益率を見込んでるこれが君の主張の要点みたいだね。私が岩の下で暮らしてたのかと思うくらい、フロンティアラボが利益を上げてる話は聞いたことがない。私の知る限り、今のところAI企業は顧客を獲得するためにお金を燃やしてるだけなんだけど、これって間違ってる？

└

これは、製薬会社が高額な研究をやめれば簡単に利益を上げられると言っているようなものじゃない？巨額のR&D支出はビジネスプランの核心だし、それがあるからこそ高い価格を要求できるんだ。OpenAIがトレーニングに何十億も使うのをやめたら、価格設定の力が消えちゃう。ユーザーはAnthropicや次のフロンティアモデルを出すところに移っちゃうからね。そうなると、ある種の消耗戦で一つだけが生き残るスペースがあるってことになるかも（シリコン業界に似てるかもね）。

└

あなたの計算はちょっとおかしいよ。50ドル/時はスウェーデンの基準での年間コストで、50ドル/時 × 40時間/週 × 48週/年 = 96,000ドル/年だよ。そのレートで30%の生産性向上に対しては本当にひどい取引だね。20ドル/時に下げてなんとかトントンにしても、スキルや理論の構築が失われて、建築的な進歩の可能性が減って、沼にはまるリスクが高くなるよ。

└

この数学の問題は、いつも馬鹿げた基準の報酬（またはコスト）を事実として前提にしてることだよ。200kもかからない開発者がいる世界があるんだから。大きな会社では、開発者の生産性を30%上げたら、その分30%多くのコードが「変更管理」の地獄を数ヶ月も通ることになる。立ち止まってるわけじゃなくて、ボトルネックをさらに押し込んでるだけなんだ。ほとんどの人が状況を悪化させるために払う意欲がある金額は、ほぼゼロに近いよ。

この記事の全ての根拠は、トークン生成が変動費用であり、そのコストが時間とともに減少しないということだよ。>経済的な観点から見ると、月額サブスクリプションは比較的静的なコストでしか意味がない。データセンターの運営は固定費用だ。人々がそのデータセンターをどれだけ使おうが、オペレーターが支払う金額は変わらない（電力使用量は関係するけど、GPUが100%稼働しているときはアイドルのときよりも多くのワットを消費するけど、データセンターの他の固定費や変動費にはあまり影響しない）。>彼らはまた、トークンのコストが時間とともに下がると仮定していたと思うけど、実際には、いくつかのモデルの価格が下がったかもしれないけど、新しい「推論」モデルははるかに多くのトークンを消費するから、推論のコストは、どういうわけか時間とともに高くなってしまった。これは逆だよ。何かのコストが下がると、人々はそれをもっと使うようになる。これは基本的な供給と需要の法則だ。推論はすでに安くなっているし、これからも安くなり続けるだろう。企業が成長のためにコストを補助することはよくあることだし、そうだね、サブスクリプションから使用ベースの価格設定に切り替えるのは顧客にとっては嫌なことだけど、企業は支払い続けるだろうね。

└

>データセンターの他の固定費や変動費にあまり影響しないよね。データセンターのコストは、1世代のGPUの寿命の間にどんな感じになるんだろう？10%が建物、60%がGPU、30%が電力。情報を探しに行ったわけじゃないけど、見かけたこともないな。

この記事を読んで、数年前に聞いたポッドキャストを思い出した。そこで初期のGoogleのマーケティング社員がGoogle検索の経済学について話してたんだ。彼らは調査をして、平均ユーザーは年間20ドル相当の価値を得ると結論づけたから、それが検索に対して現実的に請求できる最大額だと言ってた。一方で、彼らはQ4だけでユーザーあたり500ドルの広告収入を得てた。だから、もちろん広告だよね。LLMのビジネスモデルが広告収入の魅力に耐えられるとは思えない。検索やテレビ、ラジオ、映画と同じように。コパイロットがプルリクエストに広告を入れる話を無視しても、公共のLLMが出力に広告を挿入しないわけがないよ。これが私の記憶していることに似てる。

└

出力は人間に読まれないから（実際、私の使い方でもそうなってきてるし）、それがどう機能するのか分からない。もし出力が最高入札者によって決まるなら、それは成り立たないよね。出力がエージェントの方向性に影響を与えるとしても、それもダメだと思う。

これには別の道があると思う。エンジニア1人あたり年間7000ドル以上のトークン使用料なら、エンジニアに高性能なGPUやRAMを搭載したマシンを買って、ローカルでモデルを動かすのは非常に合理的だと思う。今は意味がないかもしれないけど、誰かがそれを解決して、企業に3年で1万ドル以上の節約をもたらすだろうね。

└

それだとGPUが使われずに待機してる時間ができちゃうね。多くのエンジニアが共有できるクラスタがあった方がいいと思う。クラスタが飽和しないように、他の会社のクエリもバッチ処理すればいいし。あ、待って、AI推論をクラウドでやるのが効率的な方法に戻ってきたね。

└

もし数千ドルの機械で出力されるモデルだけが欲しいなら、もっと安いクラウドサービスのモデルがあるんじゃないの？（そして、姉妹コメントが指摘してるように、ハードウェアを共有することで利用率が上がって、ユーザーあたりのコストが下がるよ。）

初めの頃はエドに対して少し尊敬してたんだけど、最近はちょっと失ってきたかな。彼はまだいくつかのことについては正しいけど、数ヶ月前の強い立場から徐々に後退しているのが見える。彼は「これらは絶対に何の役にも立たないし、ただお金を燃やしているだけだ」と言ってたのに、最近は「まあ、時々は機能するかもしれないけど、コストには見合わない」とか言い出してる。これは合理的な疑問だよね！彼が間違ってたことを認めないスタイルがちょっと苦手だし、彼が絶対的な事実として物事を提示するのも、私たちと同じように推測してるのにね。彼は多くのことについて正しかったし、間違ってたこともある。認めるのは全然悪くないと思うし、ファン層も気にしないんじゃないかな。

└

経済的には、すでに月に1万ドル以上払ってるICのために数百ドルのソフトウェアを使って生産性を上げるってことだよね。なんで賢い業界の専門家たちがこの明らかな事実に気づかないのか不思議だよ。彼らは本当に専門家なの？

└

CrowdStrikeが大規模な障害を引き起こしたとき、彼は基本的にWindowsやMicrosoftのせいにしてたよね。それ以来、彼を真剣に受け止めるのをやめた。彼の意見にはある程度同意するけど、ジャーナリズムよりも怒りを売ることに興味があるみたい。

└

俺も彼に対してまったく同じ気持ちだよ。彼の「数字が大きい」アプローチの書き方（「リアルタイムで学んでいることについての18,000語のブログを見てみて」）もなんか引いちゃうから、完全に関わるのをやめた。もっといい業界批評家が必要だよね。

└

変だね、特に私たちの多くが似たような意見を持っているから。彼は最初からそう言ってたのか、それとも最近になってその方向にシフトしたのか、全く新しいことなの？コストについての話は新しいわけじゃないし。

└

これがオンラインの評論家になるための基本だよね。インターネットは挑発的な意見を評価する。自分に自信がなくて見解を修正する傾向があると、(a) 意見が挑発的でなくなって、クリックを集める見出しに繋がりにくくなるし、(b) 「わからない」と言ったり、自分の意見を抑えたりすることが多くなって、必要な週刊の発表スケジュールを維持するのが難しくなる。つまり、この人をスケープゴートにするのは簡単だけど、彼のアプローチはみんながシェアしがちな他の「意見記事」ブロガーと変わらないと思う。

└

彼の作品はちょこちょこ読んだことがあって、AI懐疑派だと思ってたから、彼の立場が「LLMはどんな価格でも役に立たない」なんてことだとは思わなかった。それは真剣な人が言うにはかなり極端なことだよ。正直言って、AI懐疑派の誇張したストローマンのように見える。俺は自分を一般的にAI懐疑派だと思ってるけど、それは次のことに対する懐疑心だね：1) AIビジネスやデータセンターの投資リターンに関する近い将来の期待。2) LLMが特定の高スキル職業（例えばソフトウェアエンジニアリングや音楽/映画制作など）のほとんど/全ての上級職を急速に置き換えるという主張。それによってその種の労働者の仕事が減って、大量失業が起こること。3) AIがすぐに大規模な自己改善を持続できるようになるという「フーム」仮説。俺はAIが今日のいくつかのことにかなり役立っているとは思ってるし、投資家がAIでお金を稼げないなんてことも思ってない。AIがいくつかの職業で労働者を置き換えることもあるだろうし、AIを使うことでAIの開発が加速しているのも明らかだ。ただ、影響の大きさやその速さ、広がりについては過剰な期待や誇張が多いと思う。急速で大きな影響がいくつかあるかもしれないけど、大半はもっとゆっくりとした、徐々に進行するもので、極端な予測ほどの破壊的なものではないと思う。多くの過剰な予測は実現しないかもしれない。実現できないからじゃなくて、もっと日常的な経済的、物流的、人間的な要因による理由で、1950年代のどの家にも飛行機があるというビジョンから今も遠いのと同じように。

└

彼のコストに関する考え方は完全に間違ってるよ。APIの料金は提供者のコストじゃないし、みんながやってることを基にして適当に決めた数字なんだ。オンデマンドの使用や研究、マーケティング、株の買い戻しをカバーできると思ってるだけ。彼らはおそらく60〜90%の粗利を持ってるんじゃないかな。

└

エドの文章スタイルは、ちょっと受け入れがたいし、繰り返しが多くて、時々「必死」な感じすらする。でも、業界で誰も真剣に考えてない質問を提起してるのは確かだよ。もしあのモンスターたちが本当に利益を出してないとしたら、どうするの？だから、彼の文章を定期的に読むのはやめたけど、四半期に一回は、私たちの避けられない善良な終末的LLMの神々や、完全な失業と絶望を予言する聖サムのことじゃない何かを読むために訪れてる。この状況はBitfinexedのブログを思い出させる。あの人はTetherトークンの詐欺を何年もかけて研究して証明してたけど、正しかった。でも、彼は小さなニュアンスを考慮してなかったんだ。Tetherは金融犯罪に役立つし、金融的な妥当性やまともな金融機関からの拒否に関係なく、公共によって支えられてる。結局、裏付けのないトークンが1000億あっても、「代替的に裏付けられた」ものであれば問題ないんだと思う。LLMモンスターも同じようになるかもしれないし、そうじゃないかもしれない。真剣な質問だけど、もっとまともで要点を押さえたスタイルのLLMバブル批評家っているのかな？大体のYouTubeの人たちみたいに、根拠のない誇大広告を投稿してるだけじゃなくて。

└

彼の見解には共感するな。私も最近までAIのハイプトレインは完全な詐欺だと思ってたから。コーディングエージェントが実際にちゃんとした仕事をしてるって認める人が増えたのを見て、50ドルで一つ試してみることにしたんだ。雑務をこなすのに役立つことに驚いてる。特別賢いわけじゃないけど、jsonlファイルの特性を編集するためのPythonスクリプトを書くとか、構造化データを整理するのが得意なんだ。限られた出力を超えて役立つとは思ってなかったけど、狭くターゲットを絞ったタスクには結構いい感じ。コードの制約があるから、他のものよりも適したカテゴリーだと思う。エロンが「今日、全人類を救うかもしれない」って言ってるけど、まだまだハイプマシンだよね。それはかなりあり得ないと思う。

この投稿がフラグ付けされたり「シャドウバン」されたりするのはどれくらいかかるかな。エドのHNでのほとんどの投稿がそういう運命を辿ったのは、理由が分かるよね。

└

新しいデータを考慮せずに以前の見解を変えない人は、ここにはあまり合わないかもしれないね。それは全然構わないけど。

ちょっと naïve な質問かもしれないけど：携帯電話のプランやインターネットサービスプロバイダーも、固定の月額料金をよく使ってるよね。競争がある中で、どうしてそれが成り立ってるの？問題は月額料金、補助金、それとも両方？

ハクソク