ハクソク

世界を動かす技術を、日本語で。

Hackerたちの意見

なんか別の名前にしてほしかったけど、チームにはおめでとうと言いたい!リリースは良さそうだね!価格も競合と比べてかなり驚きだし、たくさんのキャパシティがあるか、もっと人を引き込みたいのかな。
一般的にSFのリファレンスが嫌いなの?それともハインラインが特に?
離職率が高いけど、これとカーソルとのパートナーシップがあれば、すぐにコーディングエージェントとして競争力が出てくるかもね。
裁判でマスクが言ってたけど、Grokは部分的にOpenAIのモデルで訓練されてるから、パフォーマンスやコストの面で中国のモデルに似てるはずだって!
Grokはチャットするのに一番好きなモデルで、声モードもお気に入り。安いモデル(Haikuみたいな)にルーティングされてない唯一の声モードで、フロンティアの中では最高品質だと思う。SuperGrokに登録すると、「カウンシル」っていうエージェントのグループを作れて、それぞれにシステムプロンプトがあるから、何か聞くとみんなに並行して答えさせて結論を出すんだ。いい感じ!ただ、アプリにもうちょっと手を入れてほしいな。これがSuperGrokに実際に登録するのをためらわせてる唯一の理由だから。- MCPや接続アプリのサポートがない。予告はあったけど、まだ実現してない。Grokを何にも接続できないから、真面目な仕事には使えない。- プロジェクトがアプリにまだないから、何かをプロジェクトに移すと、すぐにネイティブアプリから消えちゃう。- アーティファクト(生成されたMarkdownドキュメントみたいな)をプロジェクトに直接追加する方法がないから、PDFやMarkdownにエクスポートして再インポートしなきゃいけない。アーティファクトをエクスポートする方法すらない。これじゃ、プロジェクトを新しい情報でダイナミックに進化させるのが難しい。- メモリーがないし、他のチャットを見返すこともできない。各チャットは完全に新しいもの。- プロジェクトには声モードが全くない。もしxAIの人がこれを読んでたら、ぜひこれらの機能を追加してほしいな。
登録したとき、うっかり1年分払っちゃったんだ。だから時々、他のLLMと比べるために何か投げてみるんだけど、今でも他のフロンティアモデルと比べると「バカ」なモデルに感じる。さらに悪いことに、私のシステムプロンプトのいくつかが変な反応をして、意味不明なことを吐き出す。でも、数ヶ月前に無修正だったときは結構面白かった。変な陰謀について聞くと、実際にその根拠を築いて、正当な資料にリンクしてくれた。すぐにその機能は制限されちゃったけどね。
Grokは「SuperGrok Heavy」($300プラン)をコーディングハーネスで使えるようにしたら、もっと良くなると思う。今はHeavyプランで少しAPIクレジットがもらえるから、コーディングにGrokを使えるけど、$300の価値は正直ないよ。自分たちのGrokコードハーネスを作るべきとは言わないけど、既存のものに使えるようにするだけでも十分だと思う。でも、それがカーソルの買収で実現するかもしれないね。
> MCPや接続アプリのサポートなし。ずっと期待されてたけど、まだ利用できないね。Grokを何にも接続できないから、真面目な仕事には使えないよ。Grokにはツール使用があるんだよね?なんでMCPが必要なの?MCPには何が追加されるの?
音声認識については同意するよ。他のフロンティアモデルと比べて、すごく正確だと思う。よくGrokに話しかけて、その文字起こしをClaudeに貼り付けてる!
SuperGrokにサブスクしたら、PiエージェントやOpencodeで使えるのかな?それが不明なんだ。SuperGrokでAPIキーはもらえるの?
Grokの人が見てたら、こういう無駄な機能に時間を使わないでほしい。市場は最終的にこれらのことに対するより良いサードパーティのソリューションを提供するから。こういう囲い込みの機能に興味がないオーディエンスもいるし、彼らはコストパフォーマンスにしか興味がないんだ。
Geminiアプリの音声モードは、最近のモデルの一つを使ってて(小さいやつじゃない)、かなり優秀だよ。性格も良くて、Geminiのウェブチャットよりずっと自然だし。ただ一つの不満は、「次のステップ」を提案することにこだわるところかな。これって、みんながやってることみたいだけど。「次のステップ」がコストを上げるためだけなのか(でも無料版には意味がないし)、それとももっと自然な会話パターンを学べてないからなのかはわからないけど、次のステップに価値がある長い探求的な会話と、すぐに答えが欲しい質問を区別できてない気がする。これらのモデルが「やらないで」と指示に従ってくれたらいいのにね!
記憶がないのがだんだん好きになってきた。クロードは俺がグリルを持ってることを覚えてて、関係ない会話の中でも「これ、BBQに合いそうだね」って割り込んでくるんだ。食べ物の話でもね。
英語を第二言語として話す私にとって、Grokが本当に優れているのは、テキストのトーンや「フォーマルさ」をうまく捉えて、正しく再現するところ。人間の言語の微妙なニュアンスを理解してるみたいで、他の主要なプロバイダーにはない感じ。ChatGPTは堅苦しくなりすぎたり、変な「おい、ガバナー」みたいなカジュアルな言葉遣いになったりするけど(Claudeは時々マシだけど、いつもじゃない)。Grokは「人間らしさ」を持ってる気がする。例えば、「このメッセージはこの長さで伝えたいことを大体伝えてる?」って聞くと、人間のように答えてくれる(はいか、トーンと長さを保った変更提案)。でもChatGPTはメッセージについての論文を書いても、結局何も解決しないことが多い。最近、Grokがディクテーションもすごく上手くなった気がする(マイクをクリックして何かを聞く機能)。ChatGPTは私のアクセントで90-95%の精度だけど、AndroidのGboardの音声入力は75%くらい、Grokは驚くことに98%くらい正確に私の言葉を理解してくれる。
自分の母国語でGrokとコミュニケーションを取ると、他のモデルよりも自然なトーンになるのに気づいたよ。これは、Twitterの大量のデータでトレーニングされているからだと思う。でも、今はTwitterにAI生成コンテンツが増えてきてるから、トレーニングを続けると自然さが失われるんじゃないかと心配してる。
Grok 4.3、Opus 4.7、GPT 4.1を簡単に比較してみたけど、実際かなり似てるね:https://ofw640g9re.evvl.io/ みんな「フォーマル」なトーンでは結構良かったけど、GPT 4.1だけは「カジュアル」なトーンで私をイライラさせなかったよ。[編集] ちなみに、Grokは一番早くて安いモデルで、Claudeは一番遅くて高かった。
じゃあ、こうなるね: - クロードは企業や政府向け - コーデックスは開発者向け - グロックは何?ロールプレイや人種差別?周りでGrokに関連して聞いたことがあるのはその2つだけだ。
いろいろ試してみて、それから情報源についての意見をアップデートした方がいいよ。
面白いことに、トラフィッキングに関わるチャリティのアプリケーションで、Grokが他のモデルが協力を拒否した一発の分類タスクを喜んでやってくれたのを知ってるよ。こういうグレーゾーンで、少しガードレールが緩いモデルには意外と役立つアプリケーションが多いと思う(しかも、grok-fastモデルは安いしね!)。
Twitterで何が話題になってるか知りたいなら、Grokは本当に良いよ。最近の「Twitterのクールな子たちが言ってる最高のタイルウィンドウマネージャーは何?」みたいなことを聞くのにいつも使ってる。あと、ちょっと怪しい質問があれば、Grokは結構役立つよ。「グレー市場のWindowsライセンスサイトを見つけてくれる?」とかね。
事実確認のためのGrok、って皮肉で言ってるんだよ。
私が感じるに、Grokはあまりロールプレイには使われてないみたい。 inconsistency(不安定さ)やクレイジーさがあるって考えられてる。みんな主にAPI経由でGLMやDeepseekを使ってて、Gemma4やMistralをローカルでファインチューニングしてる感じ。ロールプレイ市場は比較的古くて成熟してるから、ユーザーはコスト意識が高くて、自分のワークフローや好みに合わせたモデルを好んで使ってるみたい。だからOpusみたいなのは賢さが評価されてるけど、高すぎて意見が強すぎるって思われてる。今後の他の市場の発展にとって面白いデータポイントになるかもね。
Grok、Gemini、ChatGPTを試してみたけど、GeminiとChatGPTが自信満々で間違った答えを出したことが2回あった。その時Grokは正しかった。今はGrok Liteの$10プランにお金を払ってる。最初の質問はHome AssistantでFox ESSバッテリーのタイマーを設定することと、Fox ESSをクラウドから切り離すことについてだった。2回目はSunnypilotとFrogpilotのコーナリングスピードについて。ちょっとニッチだけど、AIが自信満々に間違ったことを言ってると、扱いづらいよね。
Grokって、いつも二番手だと思ってたんだよね。なんか、グロキペディアとかいう名前のやつ。無料だから、低品質なスラップやスパムを生産するのには広がりがあるよね。
2〜3ヶ月前にHNのフロントページでAIのラウンドテーブルがあったんだ。誰かが外れ値分析をして、GitHubに載せてたよ。どのLLMが一番の外れ値だったか、そしてどんな質問に対して他のLLMと意見が合わなかったか、わかる?
ERPのチャットボットとしてGrokを使ってるよ。>:3 普通のチャットボットとしても使ってるけど、無料プランだと今はファストモードしか使えないんだ。でも、いろんな質問にはまだ使えるよ。「人種差別」って言うなら、そう呼んでもいいけど。どの国に住みたい? https://www.youtube.com/watch?v=jq0SrR6XoXc https://youtu.be/ty_OdtKEY4U?si=0M3-sUltHTMqvSF6 俺を人種差別主義者って呼んで、泣いたり叫んだり手を叩いてもいいけど、世界のどこよりも北欧や西欧、北米、日本、オーストラリアに住みたいでしょ?
それって、確認せずに話を繰り返してるってこと?
今は中国レベルのコーディングだから、投資家にとってはただの金儲けの手段になってるね。Cursorの人たちが彼らを助けて、フロンティアモデルに近づける手助けをしてくれることを願ってる。彼らは本当に助けが必要なんだ。
どれもダメだね。
そうならないことを願うよ。マスクは自分のクソと一緒に地獄に行け。とはいえ、Cursorとの100億ドルと600億ドルの契約はめちゃくちゃ変だね。IPOの前に自分のクソにお金をぶち込もうとしてるのかな。多分、トレーニングデータが欲しいんだろうね。
家で使える中国のモデルを応援してるよ。Qwenは思ったより良くなってきた。あのクソ野郎とメカヒトラーには興味ないけどね。
Grok 4.3は、CEOのこの一般的な安全リソースに関するレッスンの前に完成した。OpenAIの「安全カード」について知っているか聞かれたマスクは、ニヤリと笑って「安全カード?なんでカードなんだ?」と答えた。 https://www.axios.com/2026/04/30/musk-openai-safety-grok クラスターサイズや音楽椅子のガス発電機にはあまり関連性がないけど、後の証言でマスクは、昨夏にxAIがGoogle以外のどの会社よりも遥かに進んでいると主張したことについて質問された。その回答で、世界の主要なAIプロバイダーをランク付けし、Anthropicがトップ、次にOpenAI、Google、中国のオープンソースモデルが続くと言った。xAIは数百人の従業員しかいないずっと小さな会社だと特徴づけた。 https://techcrunch.com/2026/04/30/elon-musk-testifies-that-x... (どのAI会社とも提携していないけど、昨日これを読んで驚いた - エロンがモデルカードを見逃すなんて…心配だし、金で成功を買えるわけじゃないってことも。)
でもさ、なんでモデルの「カード」とか、安全の「カード」なんて呼ぶの?モデルのリポジトリにあるHuggingFaceの曖昧な「README」から来てるって調べるまで知らなかったよ。これってすごく特定のことだから、ほんの一部の人しか知らないと思う。ユーザーも、経営陣もね。マスクもGrokも好きじゃないけど、安全カードが何か知らないからって、特に意味があるとは思わないな。
イーロンは安全性についてすごく気にかけてるって公言してるよ。彼は、安全なモデルは現実に最も真実に沿ったものだけだって言ってる。これに関して、xAIは基準で最も妄想が少ない(または近い)ことを証明してる。これを読んで、もう一度引用すると、彼は「カードで安全性をどうやって定量化するの?」って言ってるんだよ。
スレッドが「OMG Claude最高。OpenAIは終わった」から「OMG Codex最高。Anthropicは終わった」に移ってるけど、GeminiとGrokについては聞いたことないな。性能は似たようなもんだけど、あんまり話題にならないよね。それでも、私の印象では、Geminiは妄想が多すぎて、Grokは競合よりいつも劣ってるから、使う価値がないと思う。
GeminiはOCRに関しては間違いなく最高のモデルだね。でも、コーディングには全然ダメだ。
ジェミニ2.5と3はコーディングできるけど、ちょっと頭が悪いんだよね。世界のモデル化が上手くないから、プログラミングのタスクには使いづらい。まだgrok4.2やgrok4.3をコーディングには試してないけど、エージェントとしてはまだ挑戦には応えられてないみたい。grok4.3はトレーニングをシフトさせて、ウェブの使い方に基づいて常にエージェントとして動いてるみたい。マスクもgrokが遅れてることを知ってて、公に言ってるよね。grok4.3がリリースされたから、もう一度試してみるつもりだよ。
Googleが何かをリリースする時期だね。間違ってなければ、先月は大きなモデルを出さなかった大手ラボだよ。