ハクソク

世界を動かす技術を、日本語で。

Hackerたちの意見

ちょっとしたPRの誇張だけど、ジェミニと他のサービスを比べると、OpenAIには明確な優位性がないってことがはっきり示されたと言えるね。
もしこのバブルが数日中に崩れなかったら、これは明らかに間違いだね。
消費者向けの優位性はブランド力と、OpenAIが持っている「メモリー」だね。これを他のプロバイダーに移行することはできないから、応答がもっと個別化されるんだ。たとえば、あなたの仕事を知っていたり、友達とどこに行くかを知っていたり、「デート」について聞くときはロマンティックな関係のことを指しているってわかる。うまく機能するようになれば、OpenAIはあなたの友達や信頼できる存在になって、長年の友達を理由もなく捨てたりしないと思うよ。
次に気づくのは、クロードがGoogleのコーディングエージェントより明確に(または全く)優れているわけではないってことだね。
代替リンク: https://www.msn.com/en-us/money/other/how-google-got-its-gro...
https://archive.is/TyJ8q
> ナイナ・レイジングハニ、00はアップロードを完了させるために新しいツールの名前が必要だった。でも、午前2時半で誰もいなかったから、友達が付けてくれたニックネームを組み合わせて適当に作ったんだ。ナノバナナってね。なるほど、そんな素晴らしいツールにしてはちょっとおかしな名前の理由がわかったよ。もっと普通の名前だったら、Google Gemini Image Pro Red for Workspaceになってたかもしれないね。
正直、ナノバナナって名前が大好き。めっちゃバカみたいだけど、最近の企業名がどれも堅苦しい中で言うとちょっと楽しい。
まだ古いGoogle文化の名残があるって証拠があるのがいいね。
強く反対だな。Google、OpenAI、Microsoftは、Gemini/ChatGPT/Copilotの下にすべてをまとめる非常に混乱した製品名戦略を持っていて、個々の製品名は記憶に残らないし、本当にわかりにくい。(Codexは何をするんだっけ?)Nano Bananaは製品が何をするか教えてくれないけど、名前は絶対に覚えるよね。口に出しやすいし、SNSでもすごく目を引く。
ジェミニ3の盛り上がりが理解できない…確かに彼らの初めての使えるモデルだけど、Opus 4.5やGPT 5.2ができることには全然及ばない。ベンチマークではどうか知らないけど、仕事で毎日ジェミニを使わされてる一方で、プライベートでは毎日Opus 4.5やGPT 5.2を使ってるから、ジェミニはウィットやクリエイティビティ、多段階の問題解決能力が全然足りないんだ。それに、ジェミニCLIは使いづらいし、クロードコードのスムーズさに慣れちゃったから余計にね。これって俺だけ?
gemini.google.comでは使わない方がいいけど、aistudio.google.comで試してみて。モデルは同じかもしれないけど、aistudioのエージェントはコード生成に関してはかなり優れてるよ。jules.google.comは実際のコーディングエージェントに関してはまだまだ遅れをとってるし、コマンドラインで動かせるものが少ない。Googleはいつも通り、ユーザーを混乱させるように過剰に設計してるね。
いや、ひとりじゃないよ。アイデアを具体化するにはGPTの方が断然いいと思う。概念的に深いし、意図を理解して異なるアイデアをうまく組み合わせることができる。Geminiはちょっと自閉的で、細かいところにこだわりすぎる感じがある。APIは大量のデータ抽出には便利だけど、GeminiのAPIの信頼性はかなり改善されて、OpenAIよりも失敗率が低いと思う。
Gemini 3のせいでChatGPTのサブスクリプションをキャンセルしたから、当然違う体験してるよ。とはいえ、Cursorを通してコーディングにはOpus4.5を使ってる。Geminiは計画やラバーダッキング、分析、検索用だね。これらに関しては本当にGeminiの方がいいと思う。ChatGPTには、何かの説明が分からないときに、直接的にハルシネーションしない代わりに、長ったらしい混乱した言葉のサラダを作ってしまう問題がある。Geminiはそういうことはほとんどなくて、科学的・技術的にしっかりした説明を出してくれることが多い。ただ、少し二面性があって、出典からの推測で自信満々に発言することもあって、必ずしも支持されているわけではないけど、ありそうなことを言うことがある。
フルタイムのAntigravityユーザーだけど、個人的にはコーディングアシスタントとしてはこれが一番コスパいいと思う。他のAI Proの特典も含めずにね。一般的なターミナルやVS CodeへのアクセスにはClaude ProやGitHub Copilotのサブを使ってる。どれもトップクラスのモデルだと思うけど、VS CodeのCCサイドバーやCCターミナルよりもAntigravityのフルIDE UXが好き。Opus 4.5はコード関連では素晴らしいけど、Gemini 3 Pro(High)のUIの方が好きなことが多い。この1ヶ月は主にPython/Vueのプロジェクトで使ってて、そこではすごく得意だよ。特定の実装に不満があったらOpusに切り替えようと思ってたけど、まだその必要はなかった。何回かはプロンプトの誤解で正しい結果が出なかったけど、再プロンプトで解決できた。ドキュメントにはClaude/GPT 5.2を使ってるけど、英語のコマンドに関しては彼らの方が洗練されてると思う。でも、純粋なコーディングアシスタンスには、Antigravityユーザーとして満足してるよ。
一般的なリサーチやチャットボットに関しては、どちらが優れているとは感じないけど、私はすでにGoogle Oneプランに入ってるから、プランのアップグレードがOpenAIに月20ドル払うより安いんだ。だからChatGPT Plusをキャンセルした。あと、私のGoogle Oneは家族と共有してるから、彼らも高度なGeminiモデルを使える。
それがあなたの個人的な体験かもしれないけど、私にとってはGeminiがClaude Opus 4.5よりも質問に対していつも良い答えを返してくれるし、GPT 5.2よりも良いことが多い。コーディングエージェントの話じゃなくて、ウェブベースのAIシステムについてね。これまでに何回もそうなった(私は3つのシステムで全てのクエリを実行してる)から、Geminiの方が今は自分に合ってるってかなり自信を持って言える。以前は常に最下位で、ほんとにダメだったのにね。だからこその盛り上がりだよ。
人はあるモデルに慣れて、それでうまく作業するようになる。iPhoneユーザーにAndroidフォンを渡すと、Androidがひどくて役に立たないって文句を言うだろう。逆も同じことが言える。これが、モデルの挙動についての矛盾した報告がたくさん出る理由の大部分だと思う。モデルに慣れれば慣れるほど、特にそれが良いモデルなら、他の良いモデルが不安定で壊れてるように感じるんだよね。
> Gemini CLIは使いにくいってこともあるよね - Claude Codeのスムーズさに慣れちゃった後だと。モデルの違いではなく、各コマンドラインツールについて話してるの?そうなら、Claude CodeがうまくやってるGemini CLIの主な問題点を挙げてくれる?
代わりにCLIのオプションを試してみるのもいいかもね?例えば、https://opencode.aiとか。あと、https://github.com/charmbracelet/crush と https://github.com/mistralai/mistral-vibe も好きだよ。
これ逆に聞こえるかもしれないけど、Gemini 3のフラッシュは特定のタスクを与えるとかなり良いよ。すごく速いし(OpusやGPT-5.2よりもずっと速い)、指示に従うのも上手で、ちゃんと動くコードを出してくれる(他のフラッシュやハイクなどの速いモデルとは対照的にね)。しっかりしたテストスイートが必要だけど、明確に定義された小さなタスクを与えれば、すごく速く進めるよ。PRDを作って、エピックやストーリー、最後にタスクをProで分解するんだ。これがすごくうまくいく。
私の予想はこうだ:GoogleはGeminiを広告なしで長い間運営できるけど、OpenAIは収益を上げる必要がある。だからOpenAIは何かしらの手を打たないといけない(または無限にお金を集められると信じているのかも)。Googleは簡単にGeminiを広告なしでユーザーに提供できるから、OpenAIは収益が必要で早めに広告を入れざるを得ないと思う。GoogleとAnthropicが勝者の2社になるだろうけど、OpenAIやPerplexityはどうなるかわからない。もしかしたらOpenAIはMicrosoftと合併するかも?
マイクロソフトは、必要な限りOpenAIに資金を提供するって。代わりは何なんだろう?
パープレキシティがまだ生きてるなんて驚きだよ!これで、こういうツールの価値や持続力を評価する自分の能力に疑問を感じる。 (DAUが見れたら、もう死んでるかもしれないけど…)
この記事はただの見た目の話だけど、ここでのコーディングエージェントについてのコメントは、実際の消費者向け製品、つまり一般ユーザー向けのチャットボットと比べると、私たちはただのニッチだってことを理解してないと思う。うちの母はClaude Codeなんて使わないし、彼女には関係ない。Hacker Newsの私たちは、一般の人々を代表してるわけじゃないんだよね。
Claude Codeは、収益が10億ドル以上あるらしい。経済的価値で言えば、コーディングエージェントは確実にLLMのトップラインの使い方の一つだね。
AIコーディングには、導入を進めて収益化するのが一番簡単な要素がたくさんある。最大の要因はFOMO(取り残される恐怖)。多くの組織が、価値に関係なく経営者が全体のためにAIを買ってるっていう原則-代理人問題を抱えてる。個人から少しずつお金を取るより、こっちの方が簡単に収益が上がる。次の要因は循環型テクノロジー経済。みんながみんなを知っていて、みんながみんなから買ってる。お金が行ったり来たりしてるだけ。最後に、AIコーディングは具体的な価値を生み出せるはず。AIがコンパイルできて問題を解決するコードを作れば、何らかの価値があるはず。比較すると、あなたの製品が「書く」ことなら、AIのライティングはちょっと微妙だね。
もう一つの問題は、AIがまだ利益を生んでいなくて、ただの金食い虫だってこと。消費者が20ドル以上払うのを拒否したら、コーディングエージェントのコストが爆発的に増えるかも。エージェントの収益は、システムを維持するには全然足りないし、しかもすごく要求が厳しい。
コーディングエージェントは、最終的にみんなが日常の仕事で使う汎用エージェントになる可能性が高いと思う。ツールの使い方に関しては、特にファイルシステム周りで、最も成熟していて包括的な能力を持ってるし、ブラウザを開いたり、ウェブ検索したり、プログラムを実行したり(コマンドライン経由で)するのも得意だよ。広く使われるための現在の制限はUXとセキュリティだけど、少なくとも後者は改善中だよ。最近、技術に詳しくない友達にこのコーディングエージェントをインストールする手伝いをしたんだけど、質問に答える以上のことができるAIモデルを使うにはこれが一番いい方法だと思ったから。
お母さんはchatgptにお金を払うかな?それとも、もっとユーザーを増やそうとした時にやめちゃう?
これ、どのCRT基準を模倣するつもりなの?NTSCじゃないよね、あまりにもクリーンすぎる。赤はそんなにきれいに表示されることはない。赤は、彩度が上がるとにじむことで有名だったし。True PALの経験はあまりないけど、60HzでしかPALを見たことがないから、同じ赤のにじみ問題があったかは分からない。こういう細かいディテールが、また別のエミュレーターを際立たせることができるんだよね。
スレ違いかな?
Gemini 3は最高だよ。gptから移行したけど、もう戻る気はない。ただ、素晴らしいモデルにはコストがかかると思うし、Googleがモデルを抑えるのは時間の問題だと思う。ディスティレーションや量子化、あるいは小さいコンテキストウィンドウを使ってお金を止めるためにね。これが実際に起こるかどうかのレポートがあるよ:https://www.reddit.com/r/GeminiAI/comments/1q6ecwy/gemini_30...
それはまさに教科書通りの「エンシティフィケーション」だね、避けられないよ。
Geminiは使ってないけど、将来的には一番安くなると思ってる。Googleが全体のスタックを開発してるから、GPUに頼らなくて済むんだよね。これでOpenAIみたいな他の会社よりもずっと良い位置にいると思うよ。 https://cloud.google.com/tpu
「Googleが新しいMicrosoft」って感じがするね。Windows 1は好奇心をそそるもので、2は「まあまあ」、3.xから本格的に勝ち始めたって感じ。同じことがIEにも言える:初期のバージョンは冗談みたいなもので、その後「十分良い」になって、配布がその後を支えた。Gemini 3はGoogleの「Windows 3 / IE4の瞬間」って感じだね。まだみんなのお気に入りってわけじゃないけど、やっとしっかりしてきて、デフォルトの位置が重要になってきた。現状維持の立場なら、そんなに優れている必要はないんだよね。十分良ければ、デフォルトで勝てる。最終的にはみんなGemini 6(IE 6、Windows XP)を使うことになるだろうし、その時に文句を言うことになるんじゃないかな。