クウェンの地で何かが起こっている

45日前原文(simonwillison.net)

概要

AlibabaのQwenチームによるQwen 3.5ファミリーが話題
チームの主要メンバーが大量離脱し、将来が不透明
CEOも緊急会議を開き、事態の重要性を認識
Qwen 3.5モデルは高い性能と多様なサイズ展開で評価
今後のQwenチームや主要メンバーの動向に注目

Qwen 3.5ファミリーとチームの危機

AlibabaのQwenチームが過去数週間でQwen 3.5ファミリーをリリース
Qwen 3.5はオープンウェイトモデルとして注目を集める
チームのリーダーJunyang Linが突如辞任を発表
- Linは2024年以降のQwenのオープンウェイトモデル開発を牽引
辞任の背景には組織再編とGoogle Geminiチーム出身の新リーダーの就任が噂
36Kr.comが詳細記事を公開、信頼できる中国テックメディアとして評価
2026年3月4日、Alibaba CEOのWu Yongmingが緊急All Hands会議を開催
Linの辞任発表後、Qwenチーム内外で大きな動揺
「競合他社よりはるかに少ないリソースで成果を出したのはLinのリーダーシップ」との声
LinはWeChatで「Qwenの兄弟たち、予定通り進め、大丈夫」と投稿
しかし復帰の有無は明言せず

主要メンバーの大量離脱

Linの辞任と同時に複数の中核メンバーも離脱
- Binyuan Hui：Qwenコード開発リーダー、Qwen-Coderシリーズ責任者、ロボティクス研究にも関与
- Bowen Yu：Qwenポストトレーニング研究リーダー、Qwen-Instructシリーズ開発主導
- Kaixin Li：Qwen 3.5/VL/Coderの主要貢献者
多くの若手研究者も同日に辞任
CEO自ら緊急会議を開くなど、会社側も事態の重大性を認識

Qwen 3.5モデルの特徴と評価

Qwen 3.5は非常に高性能で多様なサイズ展開が特徴
- 初期モデルQwen3.5-397B-A17B：807GB
- 続いて122B, 35B, 27B, 9B, 4B, 2B, 0.8Bなど多様なモデルを展開
27B/35Bモデルはコーディングタスクで高評価、32GB/64GB Macでも動作可能
9B, 4B, 2Bモデルは小型ながら高い効果を発揮
- 2Bモデルは4.57GB（量子化で1.27GB）、推論・マルチモーダル（ビジョン）対応
小型モデルでも高品質な成果を出すQwenチームの実績

今後の展望

Qwenチームの解散はAI業界にとって大きな損失
コアメンバーが新たなプロジェクトや他研究所で活躍する可能性に期待
Alibabaが人材流出を止められるか、今後の動向に注目

Hackerたちの意見

彼らが他の場所で仕事を再開して、競争力のあるオープンウェイトモデルのための素晴らしい戦いを続けてくれることを願ってるよ。正直言って、今の政府が資金を提供すべきだと思ってたけど、中国の企業がそれに次ぐ存在なんだろうね。

新しいqwenモデルをCodex CLIとRoo Codeで試してみたけど、かなりひどかった。例えば、新しいviteアプリが欲しいって言ったら、全てのファイルをゼロから書き始めたんだ（うまくいかなかった）けど、vite CLIツールを使うんじゃなくて。これらのモデルに使える、もっと良いエージェンティックコーディングハーネスってあるのかな？私の経験からすると、これらのモデルがEvalsに過剰適合していて、広く使えるわけじゃないっていう主張は信じられるよ。

└

オープンウェイトモデルは、トレーニングでよく使われたツールやコマンドを使うのをためらうことが多い気がする。AGENTS.mdやプロンプトで明確に指示しないと、なかなか動いてくれないんだよね。広範な要件を受け入れられるステップに落とし込むのも苦手みたい。計画を立てるとかなり助かる。ハーネスについては、どれくらい違うのかは分からないけど、https://pi.devの方がOpenCodeより運がいい気がする。Piのミニマリズムがオープンモデルの限られた能力と相性がいいんだと思う。

もっと話し合いが必要だね: https://news.ycombinator.com/item?id=47246746

これが開発にあまり影響しないことを本当に願ってる。サイモンが言うように、Qwen3.5はすごく印象的だよ。ここ数日、Qwen3.5-35B-A3Bをテストしてるけど、非常に優れたモデルだと思う。今まで試した中で、そのサイズのエージェンティックコーディングモデルでは一番能力があるよ。Piハーネスを使ってRustやElixirを書かせてみたけど、明確に定義されたタスクをほとんど私の指示なしでこなすのがすごい。テストを書くように言うと、ちゃんとしたテストを書いて、カンニングせずに合格するようにしてくれる。テストやコンパイラーエラーに対応しながら、目標に向かって進むのも上手だよ。

└

Qwen3.5-35B-A3BとQwen3-Coder-Next、どっちがいいと思う？

└

同じようにRustでテストしてみたけど、無限ループにハマってかなり時間がかかった後、ようやく解決したよ。他のモデルよりも詰まりやすい気がする。計画段階で選んだデッドプールやデッドプール-r2d2で自分を追い込んでるみたいだけど、全体的にはかなり良い仕事をしてると思う。作ったコードはほとんど正常だけど、データベース層のことでちょっと手を入れなきゃいけないかも。今のところ、自分でホストできる他のモデルよりは確実に良い仕事をしてるよ。

└

'A3B'って何の意味？

└

llama.cppでローカルで動かしてるの？もしそうなら、チャットテンプレートをいじらずに動いてる？デフォルトのチャットテンプレートを使うとツール呼び出しが失敗するんだけど、これを使うとかなりうまくいくみたいだよ: https://huggingface.co/Qwen/Qwen3.5-35B-A3B/discussions/9#69...

└

どんなハードウェアで動かしてるの？日常のコーディングにフロンティアモデルを置き換えられると思う？置き換えるつもりはある？

└

最近、GH200で3.5:122bを使ってrust/react/tsをいじってたんだけど、明らかにSonnetには及ばないけど、細かい説明をすれば小〜中規模のタスクはまあまあこなせるよ。スコープが小さいとSonnetと同じくらいできるしね。見つけた主な癖は、詳細な指示に従っている途中で「もっと簡単にするために、やらない方がいい」と決めちゃう傾向があること。新機能のための初期サポートインフラがコードから削除されちゃってるのも気になる。

AIが人を置き換えるって話から、AIは（この特定の）人なしでは死んでしまうって話に急に変わって、ちょっと混乱してる。もう十分先に進んでるから、AIがここからやってくれるんじゃない？すごい時代だね！

└

「AIは（この特定の）人なしでは死んでしまう」と言ってるのは誰なんだろう？人々はQwenモデルファミリーにとって具体的に何を意味するのか疑問に思ってるね。

└

AGIの目標から広告を通じて短期的な思考に移っちゃったね。これで物事がより明確に見える気がする。

└

Claudeは自分自身のネイティブアプリケーションを作ることができないし、ウェブアプリに関しても十分に悪いから、AnthropicがBunを買収するのも納得だね。

└

Anthropicは今、稼働率が1%だよ。一つだけ。 https://status.claude.com/ AIが人を効果的に置き換えられるなら、CEOが人を説得し続ける必要なんてないよね。

アメリカの研究所が、これらの研究者たちが自分たちのラボで働けるように、なぜ大量の資金を投入しないのか不思議だよ。

└

確かに；あるいは、ヨーロッパはアメリカの政治的なナンセンスに対抗するために、競争力のあるモデルが必要だね。

└

彼らは試みたかもしれないけど、自分たちのラボを始めるのに必要な資金が足りないと感じてるんじゃないかな。新しいスタートアップラボが中国全体を事実上の捕虜市場にすることを考えると、どんな金額でも彼らがその新しいスタートアップに挑戦しないようにするには少なすぎるってことが分かるよね。お金が目的なら、アリババは彼らに白紙の小切手を渡すべきだと思う。自分たちで金額を書かせればいい。そうしないと、彼らは自分たちでスタートアップを立ち上げるだろうね。ただ、彼らのスタートアップがどんなモデルを作り上げても、世界にとっては大きな損失になると思う。

└

アメリカがやったことは、法的移民として誘拐されてキャンプに送られる可能性を高めるために、トラックいっぱいの現金をばらまいたってことだね。

└

中国は彼らに現金を満載したダンプトラックも提供しているからね。それに、ナショナリズムの理由も考慮しないといけない（残念ながら、アメリカではこれが薄れてしまっている人が多いけど）。出会ったほとんどの中国人にとって、自国を築くという考えは大切にされているよ。それに、中国はお金やコネがあれば本当に住みやすい国だから、働いてたくさんお金をもらって、良いことをしている気分になれるんだ。アメリカでは、たくさんお金をもらっても、政府が自分のモデルを使いたがるから、オンラインで人に怒鳴られることもあるしね。

└

ICEが私の地域で中国人を拘束していて、少なくとも中国人やインディアンが多く住んでいる一つの近所では家を一軒一軒訪れているらしい。先週、ここ（オハイオ）の中国人コミュニティの間でこの話が広まって、運転免許証以外の法的書類を常に持っておくようにって注意喚起があったんだ。人々はこの話を耳にしていて、かなりの（そして当然の）冷却効果があるよ。アメリカの研究所は試みるかもしれないけど、アメリカ政府がこんな態度を取っている限り、あまり成功しないと思う。*編集: 重要ではないけど、MAGAが勝手に想像するので、私が言っているのは全てアメリカ市民とグリーンカード保持者のことだよ。

└

それが最初に思ったことなんだけど、これはお互いに人材を奪い合ってる感じだね。GoogleがGeminiの研究者を取ったから、Googleも同じように反応したんだ。

└

問題はNSFの資金削減だけじゃないよ。他のところはもう大量のお金を投入してるし。公衆衛生の状況（麻疹やポリオにかかりたい人なんていないよね）、戦争中の国からの報復攻撃のリスクとかもあるし。アメリカが研究者にとって魅力が薄れている理由については、いくらでも書けるよ。私がトランプ政権の初期にディープラーニングの博士号を取ってた時、アメリカの大学はすでにムスリムバンの影響を受けていて、多くの才能が他の国に流れてしまった。兄弟のコメント者たちが指摘しているように、特に白人と認識されない外国人は、厳しい税関プロセスに直面していて、長期的かつ増加する脱出のリスクがあるんだ。NISTの研究所が突然外国の科学者を制限するって見出しを見ると、他のこともすべて不確かに感じるよ。誰かが自分が脱出のリスクにさらされていないと信じていても、他のことを見ているからね。それが結局、評判の問題に帰結するんだ。研究のトップ選択肢だった時代は過去のものだよ。この時代にアメリカで博士号を取得することを履歴書に書くと、もっと良いところに受からなかった理由についてどう答えるかを考えざるを得ないかも。

小さいQwen 3.5モデルがOpenRouterに登場するのはいつか知ってる人いる？

└

もうそこにいるの？ https://openrouter.ai/qwen/qwen3.5-27b

Qwen3.5は本当に優れていると思う。キャリブレーションでは、（35bバリアント）がローカルでAda NextGen 24GBを使って、gemini-cli + Gemini 3 Proと同じことを簡単にやってたけど、同等のパフォーマンスだったよ… 本当に印象的で、かなり速く動いてた。

└

q4 quantは175 tgと7K ppを提供してくれるから、ほとんどのクラウドプロバイダーよりも優れてるよ。

Qwenの研究チームとAlibabaのプロダクトチームの間に緊張があるみたいだね、Qwenアプリによると。最近、AlibabaがDAUをKPIとして強制しようとしたらしい。Alibabaみたいな会社が、いろんな理由でプロダクト戦略を変えさせるのは理解できるけど、研究チームの重要なメンバーを追い出す理由がよくわからない。業界にはモデルの研究者やビルダーが不足してるんじゃなかったっけ？

└

もしかしたら、将来のQwenモデルをクローズドでプロプライエタリにしたかったのかもしれないね、でも著者たちはそれに従えなかったのかな。