ハクソク

世界を動かす技術を、日本語で。

MozillaのChromeのプロンプトAPIに対する反対意見

概要

  • MozillaがPrompt APIに対してネガティブな立場を表明
  • 提案者は**@domenic**、仕様はWebMachineLearningリポジトリで公開
  • Blink(Chrome)がプロトタイプの意向を表明済み
  • 主要なブラウザベンダーやドキュメントサイトからの反応やリンクは未記載
  • 仕様や議論の詳細はGitHub上で進行中

Prompt API に対する Mozilla の標準化ポジション

  • Prompt API仕様へのMozillaの公式見解は「ネガティブ」
  • 提案仕様はWebMachineLearning/prompt-apiリポジトリで管理
  • **Explainer(解説)**はGitHubのREADMEで確認可能
  • 仕様の詳細な議論やMDN、Caniuse、Bugzilla等の関連情報は未提供
  • **Blink(Chrome)**がプロトタイプ開発の意向を表明
  • WebKitや他ベンダーからの公式コメントは現時点でなし
  • Mozillaの標準化レビュープロセス内で「Unscreened(未審査)」状態
  • 関連する担当者やプロジェクトマイルストーンも未設定

Prompt API とは

  • ウェブアプリケーションが**ユーザーに対してプロンプト(入力要求)**を表示するためのAPI
  • セキュリティやユーザー体験への影響が議論の中心
  • ブラウザごとの実装方針や標準化の必要性について意見が分かれる状況
  • 仕様の進捗や業界全体の合意形成に注目

現状と今後の動向

  • Mozillaは現時点で実装・標準化に消極的
  • Blink(Google Chrome)はプロトタイプ実装を推進
  • 他ブラウザ(WebKitなど)の立場表明は未確認
  • 仕様の今後は業界内の議論と実装状況に依存
  • 最新情報や議論はGitHub Issueで随時更新

Hackerたちの意見

> ブラウザとオペレーティングシステムは、ますます言語モデルにアクセスできることが期待されています。[0] 本当にそうなの?
ブラウザ:Chrome(このPrompt APIを提案した) オペレーティングシステム:Windows(内蔵のCopilot)、MacOS、iOS(Apple Intelligence) だから、デスクトップブラウザとOSの90%以上、さらにモバイルOSの30%以上がこれに該当するね。そう考えると、「ブラウザとオペレーティングシステムは、ますます言語モデルにアクセスできることが期待されている」と言ってもいいと思うよ。
これは間違った方向だと思う。OSやブラウザがLLMにアクセスするのは嫌だけど、LLMがブラウザやOSにアクセスするのは必要だと思う(実際、もうアクセスしてるし)。だから、デフォルトでは無効にしておいて、ユーザーが必要なときに有効にできるインターフェースを提供すればいいと思う。それで、AppleがOSに入れたLLMに縛られずに、どのLLMプロバイダーを使うか選べるしね。例えば、ClaudeにApple Intelligenceがアクセスできるものにアクセスさせたいんだ。
その言葉は、あなたがリンクした文書の位置づけの声明(2段落目の始まり)だよ。何を言いたいの?
これは典型的な「馬の前に車」みたいな企業のテックトークだね。シリコンバレーが誰も実際には欲しくないものを売りたいときは、こういうのが普通なんだ。人々が本当に欲しいかどうかに関係なく、みんなが欲しがるだろうと勝手に思ってる。ほとんどのテックメディアは「アクセス」を維持することに夢中で、こういうことを批判する余裕がないし、一般のメディアは調査するほど興味がない。こういうことは前にも見たことがあるよね、クリプトが思い浮かぶ。ソーシャルメディアサイトが突然六角形のアバターに夢中になったのを覚えてる?ほとんどのものは本当にその延長線上にあるんだ。(はっきり言うと、ユーザーはこれを求めてない。最近のユーザーフィードバックの指標では、AIの押し付けがユーザーを疲れさせて、企業の必死さが漂ってる。シリコンバレーのごく一部の人たちだけが、こういうふうにすべてにAIを詰め込みたいと思ってるんだ。)
そうだね。macOS、iOS、Windowsにはサードパーティ開発者向けのローカルモデルAPIがあるけど、Chromeはそれを試してる段階。Firefoxは代替テキストを生成するためにモデルを使ってるけど、APIはないんだ。理論的には便利だけど、開発者がローカルモデルに頼れるなら、プライバシーも保たれて分散化されるし、AWSやAnthropicにお金を流す必要もない。オフラインで使える無料のローカルなユースケースもあるけど、実際にはAppleのファウンデーションモデルがネイティブアプリで使われてるのは見たことない。MacやiOSの開発者が何かシェアしてくれることがあるのかな。
Mozillaがここで立場を示してくれて嬉しい!
2025年4月28日、これはMozillaがブラウザにたくさんのAI機能を追加する前じゃないの?
アーチボルドは反AI派だね。彼の公の発言の70%以上がそれを示してる。彼は西側の現在の一般的な感情にほぼ一致していて、主にAIに反対してる。でも現実的には、ただのゆっくりした適応やネットワーク効果なんだ。例えば、MLBが今年自動ボールストライクシステムを導入する前、昨年の議論では65%以上が否定的か中立的だった。でも今や導入されたことで、オンラインでのABSに関する感情の95%がポジティブになった。主なコメントは「なんでこれをもっと早くやらなかったの?」とか「なんで今は全ての投球で自動的にやらないの?」ってこと。社会には、すべての主要な技術革新と同じように、これを遅らせる認知的・情報的な流れの制限があるんだ。でも一度導入されると、オンラインで聞こえてくる視点はデジタル主権についてになる。今やAIのためにデータを外部プロバイダーに送る必要がなくなった、なんでこれが以前はなかったのか。人々はおそらく、広告のための主要なデータ源を減らすからブロックされていたと考えるだろうね。全体的に、未来のAIとロボティクスは社会の平等を高める最大の要因と見なされるだろう。西側の多くの人々が持つ技術への根底にある嫌悪感や無礼が、私たちが世界での事実上のリーダーシップを失う理由の一つになるかもしれないね。
これを投稿したとき、最新の声明にリンクしたんだ。https://github.com/mozilla/standards-positions/issues/1213#i... それがタイトルに関連する内容(APIに対する私たちの反対の詳細)なんだ。残念ながら、誰かが特定の投稿へのリンクを削除しちゃった。
ああ、反対意見を投稿したのが誰か気づかなかった。これはジェイク・アーチボールドで、長いことChromeチームで働いてたグーグルの人だね。今はMozillaに移って、Chrome APIに反対の意見を出してる。批判がしっかりしてるのも納得だわ。これで党の方針に縛られなくて楽になったんじゃないかな。
これって、LLMなしでは生きられない若い世代と、プライバシーを侵害するウェブブラウザを動かすためにスパコンが必要だと思ってる古い世代の対立みたいなもんかな。個人的には、これが人々がブラウザやウェブの代替案を考え始めるポイントだと思う。
若い人たちはAIを嫌ってることが多い気がする。
ここでの反対意見は、LLMの好き嫌いとは関係ないと思う。この特定の提案されたオープンウェブAPIの実現可能性についての話だよ。個人的には、コーディングの手助けや家庭の自動化にLLMを使ってるけど、このAPIがウェブにとって良いとは思わない。
これはMozillaがAIに反対してるわけじゃないよ。提案されたAPIが現状ではウェブの相互運用性にとって悪い理由を明確に論じてるだけ。
> プライバシーを侵害するウェブブラウザを動かすのにスパコンが必要なんて、そんなのはもう2008年に終わった話だよ。
ちょっと話が逸れるけど、正直言ってブラウザのインターフェースを再設計するよりも、オペレーティングシステムの概念自体を見直すべきだと思う。正しい答えが何かはわからないけど、Niri/WaylandとGNOME、Windows、Macを使ってきた経験から言うと、タイル型デスクトップやキーボード駆動のワークフローには戻れないな。
> Chromeのドキュメントによると、プロンプトAPIを使うにはGoogleの生成AI禁止利用ポリシーを「認識」しなければならない。このポリシーの要素は法律を超えている。例えば:>> 性的に明示的なコンテンツを生成または配布することに関与しないこと。誤情報、誤表現、または誤解を招く活動に関与しないこと。これには、政府や民主的プロセスに関連する誤解を招く主張を助長することが含まれる。 > これはウェブプラットフォーム上のAPIにとって悪い方向性に思えるし、使用に関するUA特有のルールを持つ他のAPIに対しても心配な前例を作る。もっと強く言うけど、ブラウザAPIにコンテンツ制限があるのは完全に狂ってるし、表現の自由の原則に違反してると思う。
同意だね。もしかしたらGoogleは、アメリカ政府を批判する段落には使えないCSSテキストフォーマットプロパティを提案するかもね。なんかバカみたいだけど、今やってることから考えると、そんなに遠くない気がする。
なんでGoogleはこんなことしてるんだろう?APIの利用を管理しなきゃいけないよね?ブラウザのAPIを管理することで何を得られるんだろう?
オープンプロトコルの良いところは、一つの実装を支持したり使ったりする必要がないことなんだけど、なぜかブラウザの独占が続いてるのが悩みだよね。ungoggled chromiumやtorみたいな素晴らしいプロジェクトもあるけど、一般の人の声が届かないのが一番の問題だと思う。もっと大衆とつながるプロジェクトが必要だよね。無知なユーザーが原因やメッセージの伝え方に無関心で、「楽しい」ものにしか興味を示さないのも問題だと思う。自由やコントロールよりも、摩擦の少ないものを求めてるんだよね。これをどう解決する?ブラウザをみんなのものにするにはどうすればいいんだろう?考えると悲しくなるよ。
> これをどう解決する?ブラウザをみんなのものにするにはどうすればいいんだろう?シンプルだよ。反トラスト法で大手テック企業を分割すればいい。彼らは今の時代の強盗貴族だよ。
> これをどう解決する?ブラウザをみんなのものにするにはどうすればいいんだろう?残念ながら、答えはほぼいつも「本当の公共資金」だよね。
自分でブラウザをコンパイルすると、さらに悪化するよね。SpotifyやNetflixが欲しい?Widevineと認証が必要だよ。Googleにお金を払ってね。ブラウザエージェントの文字列がChromeやFirefoxじゃない?無限のCloudflareのキャプチャや403エラーを楽しんでね。
まあ、そこそこいいブラウザを持ってるね。普通の人はChromeを使ってるけど、気にする人は前者に切り替える。何を解決する必要があるの? > 平均的な人の声と大衆とつながるプロジェクト > 彼らは「楽しい」ものと関わりたいし、自由やコントロールよりも摩擦が少ない方がいいと思ってる。矛盾してると思わない?普通の人はコントロールよりも摩擦が少ない方に「つながる」んだよ。
まず、Chromeに「ネイティブ」アプリケーションを同梱するのをやめて、プラットフォームAPIを学ぶことから始めるべきだね。それから、Chromeがやってることではなく、Web標準に基づいたWebアプリケーションを作って、FirefoxやSafariがゲームに追いついてないと文句を言う。
これって、あの悪名高いタグ[0]に似てる気がする。最初は良い感じだったけど、後で考えると良いアイデアじゃなかったっていう。 [0]. https://developer.mozilla.org/en-US/docs/Web/HTML/Reference/...
マーキーって悪いアイデアだったのかな?後の開発(javascript)に飲み込まれたと思うけど、確かに問題だったのは、すべてのブラウザで使えなかったことだよね。タグ自体が悪いアイデアだったわけじゃないと思う(スクロールするテキストがどれだけ良いかは別として)。モデルAPIの状況は、AMP仕様に似てる気がする。
反対意見は明確だね。プロンプトとモデルの密接な結びつき、そして利用規約におけるモデルの中立性。GitHubのこのリンクからの引用だけど、「個人的な例を挙げると、ホームオートメーションシステムのためのアナウンスを作成するシステムプロンプトを作ったんだ。最初に使っていたGeminiモデルは、すごくアメリカ的な反応を示して、スピーカーのイギリスの声には合わなかった。システムプロンプトを通じて、出力がイギリスの声で話されていることを伝えたけど、結果はイギリスの悪いアメリカ風のものになっちゃって(「ああ、元気かい、親父。リンゴと洋ナシだよ」みたいな感じ)、だからもっと調整して本当のイギリス風にしなきゃいけなかった。このプロセスで、システムプロンプトはモデルに合わせて調整されるんだ。他のモデルにはそれぞれの癖があるし、あるモデルのために追加したことが、別のモデルには過剰修正になっちゃうかもしれない。」
これ、音声認識APIを思い出させるね。もうAIを使ってて、ほとんどのブラウザで利用可能なんだ。だから前例はあるよ。でも一番重要なのは、これでやっとこういうJavaScriptが書けるようになるってことだね:const a = prompt("31度Cは華氏でいくつ?") 未来は明るいね!
現時点でこの議論はちょっと変だと思う。こういうAPIをアルファ版として遊べるようにする基本的なプロセスが必要じゃない?すごく良い具体的なユースケースがない限り、誰もこれを本番環境で使い始めないよ。今の時代、2GBのMLモデルをブラウザで大規模に動かすなんて普通じゃないからね。