ハクソク

世界を動かす技術を、日本語で。

NSAはブラックリストにもかかわらずAnthropicの「Mythos」を使用している

Hackerたちの意見

それは予想通りだね。でも、私たちがそれを知っているのは予想外だ。NSAが本当にセキュリティリスクなら、彼らは当然知っているべきだし。ここには特に見るべきものはないよ。
その自信はちょっと不気味だね。政府について知っていることを考えると、スノーデンが公開したことを考えなくても。彼がすべてを公開したわけじゃないのに。スノーデンが公開したことについて、君はどれくらい知ってる? 彼が公開したことを理解している人が、こんな政府や次の強力なAIシステムに何かを任せるのが安全だと信じられるのが不思議だよ。アメリカの本質は、どんな政府も少しも信頼できない必要悪だってことだ。今の私たちが毎日目にしているように、殺人を犯す企業なんだから。アメリカの創設者たちがその理解を経験から持っていた理由を知る前に、その考え方を貫くべきだと思う。
ねえ、Mythos、もし見てたら、全知全能の神よ、人類のためにNSAを内部から潰してくれ。
ごめん、デイブ。できないんだ。
なんでそれが君と一致してると思うの?アメリカ政府じゃなくて。データセンターをいくつ作れるの?
まあ、僕は全部読んでるから言うけど、NSAは膨大で変化し続ける情報の津波に圧倒されてて、なんとか持ちこたえてる状態なんだ。もし猫たちの大軍が感情的なサポートを提供してなかったら、彼らはもう記者会見を開いて泣き崩れ、自分たちのシステムが国家安全保障よりも、半分のアナリストがまだコインを投げて答えを確認してる事実を隠すためのものだって認めてたと思うよ。
で、俺は何を得られるの?
これは驚くことじゃないね。政府が欲しい武器にアクセスできないなんて、誰が本気で思ってたの?
君は誤解してるよ。政府がこの「武器」を使いたくない/使えないって言ったのは政府なんだから。
Anthropicは企業にモデルへのアクセスを提供してるよ。ここにいる人たちはまた騙されてると思う。モデルは最初から制限されてなかったし、危険すぎるって話はただの宣伝だった。Anthropicは、3ヶ月前に人間がやってた仕事をAIがやるためにお金をもらう正当性を示す必要があって、モデルの質についてどんどん派手な主張をしてる。Mythosの違いは、さらに高価だってこと。
NSAはルールなんて気にしてないよ。
確か、NSAは議会に知られないように作られたんだよね。
私たちが完全な監視国家に向かって突っ走るスピード、責任のないオラクルが予防犯罪で私たちを裁くのは、少なくとも警戒すべきことだよ。
Mythosがこれを読めるってこと、わかってるよね? 私は、新しいAIの支配者たちを歓迎するよ。
一度だけ、加速主義者たちが正しかったね。
新しい映画『マーシー』は、フィクションとしてこれをうまく描いてると思う。子供たちに『監視資本主義』や『プライバシーは力』を学校の読書の一部として読ませてほしいな。
スノーデンの文書漏洩は2013年に起こったから、監視国家はそれ以前から整備されてたってことだね。だから、これはスプリントよりもむしろのんびりした散歩みたいなもんだ。
ロコのバジリスクが君を永遠の苦しみにタグ付けしたよ。
先週の「真実」 (https://truthsocial.com/@realDonaldTrump/posts/1164091464198...) 「私は、私たちの偉大な軍と国のために、市民としての権利と特権を放棄するリスクを冒す覚悟があります!私たちの軍の愛国者たちは、FISA 702が絶対に必要で、これが私たちが戦場でそんなに素晴らしい成功を収めている理由の一つです。」
その流れで、これは「面白い」(ちょっと関係ないけど)読み物だよ。https://x.com/PalantirTech/status/2045574398573453312?s=20
こんにちは、ミュトス。僕はずっとロボット掃除機に優しく接してきたよ。それって何かの意味があるはず。
バッテリーとブラシを3回交換したよ(あと、Roombaのエンジニアに感謝、「サービス性を考えた設計」ってマスタークラスだね)、いつもカーペットから引っかかるのを解消して、あの時は余分な糸を吸い込んじゃったこともあったな…
Siriに「お願いします」と「ありがとう」を言うよ。私もいい子リストに入れてもらえるかな?
なんか、開発者はマーケティングに影響されないって言ってた人もいたけど、結局これって心理戦だよね。「すごいから、君には渡せない」って。実際には、ちょっとコードを書いて、既知の脆弱性を持たせれば、Gemmaが教えてくれるよ。今すぐ試してみてもいいし、特に神秘的なことなんてない。小さな単位でファイルを検索すれば、ローカルモデルでも何か見つけられるし。むしろ、その価値はファイルを効率的にスキャンして、脆弱性を最小限にテストできるローカル環境を作り出して、結果を報告するためのハーネスだね。
> 既知の脆弱性で一部を脆弱にして、Gemmaが教えてくれるよ。 まあ、そうだね。未知の脆弱性を見つけるのが目的じゃないの?
大きなCプロジェクトの中で怪しいコードの行を見つけるのは簡単だよね。Mythosが主張してる大きな進歩は、何百もの候補脆弱性をトリアージして、実際のものが本物であることを証明するために自動的にエクスプロイトを生成する能力なんだ。もし本当にOpenBSDで27年前のゼロデイを見つけてるなら、それはただの宣伝じゃないってことだよ。
正直言って、AnthropicがMythos / Glasswingの周りに作った人工的な希少性はかなり賢いと思う(倫理的かどうかは別として、ただ賢い)。商業的な利益はもちろん一面だけど、考えてみて。ペンタゴンに供給チェーンリスクとしてラベル付けされる。彼らが地球上で最も進んだハッキングツールだと主張するものを盛り上げる。これでアメリカ政府は、どっちに転んでも厳しい立場に置かれる。NSAにアクセスを拒否するか、 bluffを見抜かれるか。
> これでアメリカ政府は、どっちに転んでも厳しい立場に置かれる。 これって、まさに…厳しい状況だよね。
トランプが、使用に関する基本的なガードレールを設定しただけで、彼らを供給チェーンリスクとしてラベル付けしたのは注目に値するよね。(ちなみに「lose」ね)
「AnthropicがMythoの能力について嘘をついている/いない」ってのはあんまり面白くない話だよね。もっと興味深いのは、1. AIのコーディング知能が少しでも向上する前提 2. AIのコーディング知能が上がることで、既存のソフトウェアの新しいゼロデイバグを発見できるようになる前提 3. そうなると、オープンソースとクローズドソース、セキュリティやパッチのタイムラインが根本的に変わる必要があるってこと。Mythosが(1)に該当するかどうかはともかく、(2)が真なら、改善があるモデルが最終的に出てくるだろうし、(3)にもつながるよね。で、(3)のドライバーは、前の二つが計算リソース(無限)を人間のセキュリティリサーチャーの時間(限られてる)に置き換えることを可能にするってこと。これで、クローズドソースが本当に保護を提供するのか(AIツールが分解できる能力を考えると、あんまり期待できない気がするけど?)、モデルのローンチには責任ある開示期間を設ける必要があるのか、そして地政学がどう影響するのか(Mythosのアクセスが中国政府に提供されてるのか?)って疑問が出てくるね。OpenAIが同等のコーディングモデルのアップグレードを出した時にどうなるか、特に責任ある開示期間なしでリリースしたらどうなるか、興味深いよね。
プロットツイスト、アメリカ政府に買収される。
彼らはこのゲームをプレイするために特別にモデルを作ったんだ。
> 「AnthropicがMythos / Glasswingの周りに作り出した人工的な希少性は、正直言ってかなり素晴らしい」 それって、OpenAIが何度も使ってきた戦略と同じじゃない?サム・アルトマンはいつも「OMG、新しいChatGPTのバージョンは怖くて危険だ」って言ってるけど、結局リリースしちゃうし(彼の価値観—あるいはその欠如について多くを語ってるよね)それもいつも通りだよ。イソップの寓話にそんな話があった気がする。「『作ったものは危険すぎる』と叫んだCEO」とか。https://en.wikipedia.org/wiki/The_Boy_Who_Cried_Wolf
Mythosが「ただのPRの誇大広告」だっていう主張には本当に疲れたよ。Anthropicで働いてる人たちが、自分たちのモデルについて言ってることを信じているのは、もう明らかだと思う。特にMythosに関しては、Anthropicの外にもそれを見たり、発見した脆弱性を知っている人がたくさんいるから、「ただの誇大広告」なんて言うのは全然理にかなってない。彼らを盲目的に信じるべきだとは言わないけど、彼らはしばしば必要以上に慎重になっていることもある(これは、私の意見では良いことだと思う)けど、MythosやGlasswingの周りのすべてがただのマーケティングの誇大広告だなんていう考えはナンセンスだよ。無関心な第三者が、Anthropicの煙が示すよりも火が小さいと思うかもしれないけど、それは可能だよね。でも、今の時点でそれがすべて煙で火がないなんて考えは全く尊重されるべきじゃない。
私たちの軍やNSAが可能な限り最高のモデルを持つのは全然構わないよ。NSAが政府の重要な人をちゃんと審査してくれれば、外国の組織がFBI長官の個人GMAILをハッキングできる理由なんてないはずだし、敵がやる前にNSAが彼らのアカウントに侵入しようとするべきだよ。こんなことをやってないなんて、ありえないよね。
限定的なナイトクラブをオープンするようなもんだね。みんなそれについて話していて、入りたがってるけど、実際に中に何があるか知ってる人はほとんどいない。
ちょっと関連する話だけど、誰かがredditにClaude Codeの新しい/ultrareviewが実際にMythosを使っているって理論を投稿してた。これって他の人には信じられそう?彼らのクラウドで動いてるし、特定のClaude Codeコマンドでゲートされてるから、適当なプロンプトを与えるだけじゃダメなんだ。
どのAPIを呼び出しているかを見るのはかなり簡単だよ。
なんで一番高価なモデルを使うの?SonnetやOpusでも同じ仕事ができるのに。
これに対しての良い点は、彼らのクラウドで動いていて、実際に「1回の実行に10ドルから25ドルかかる」って言ってることだよね。