ハクソク

世界を動かす技術を、日本語で。

Hackerたちの意見

これはひどいね。もちろん、営利目的になってしまうリスクは大きいよね。学術出版社がこの動きを裏で操ってるんじゃないかって疑いたくなる。大学がトップに立つような法的な構造にできなかったのかな?例えば、いくつかの大学がarXivの全体の所有権を持つ株を所有して、arXivが独立して資金を調達できるようにするとかさ。
> もちろん、営利目的になってしまうリスクは大きいよね。記事には「独立した非営利法人になる」と書いてあるけど、OpenAIの失敗した試みが示すように、非営利から営利に変えるのは本当に難しいか、あるいは不可能だよね。 > 大学がトップに立つような法的な構造にできなかったのかな?法人(たとえ非営利でも)には取締役会があるからね。彼らの憲章がどうなるかは全くわからないけど、少なくとも一席は大学の代表に取られているとは思うし、それ以上の席もありそうだね。
arXivの声明: https://tech.cornell.edu/arxiv/
これがメインのリンクであるべきだね。元の記事はCEOの求人情報に基づいているよ。
さて、問題は、arXivがコーネルと10年にわたる血みどろの戦争を繰り広げるのか、重歩兵(博士課程の学生)、弓兵(レビュアー)、野戦砲(AIの雑な論文)を使って、それとも独立がほとんど平和的に進むのかってことだね。時間が経たないとわからないね。
博士課程の学生はせいぜい徴兵兵士で、ポスドクは装甲兵士って感じだね。
何か見落としてるかもしれないけど、まだ理由がわからないな。「解決すべき問題」なんて見当たらないよ。
記事には理由がかなり明確に書かれてるよ。
6段落目で述べられている問題は解決する必要があると思う。
もうすぐアメリカの軍事資金に依存することになるのかな?大学とトラブルを抱えてる人にコントロールされるの?これは悲惨な結果になるよ。
グラフベースの信頼システムを導入したらいいんじゃないかな。お気に入りの学術的なゲートキーパー(=論文指導教官)に保証してもらわないとアップロードできないようにするの。そうすればAIのゴミがフラグされて、その恥がグラフを通じて広がる。フラグには再度フラグできる証拠が添付される必要があるね。
似たような信頼システムがソーシャルメディアやウェブ検索などでうまく機能するだろうなって思ってたけど、意味のある形で実装されてるのは見たことがない。何か見落としてるのかな。
承認システムはその方向で機能してるよね:https://info.arxiv.org/help/endorsement.html 完璧ではないだろうけど、実際には最悪のクレイジーなスパムを排除するには十分だったみたい。
つまり、承認みたいな感じ? https://info.arxiv.org/help/endorsement.html
これ、前から基本的な形はあったよね。[1] > arXivでは、ユーザーが初めて論文を提出する前に承認を受ける必要があるんだ。[1] https://info.arxiv.org/help/endorsement.html
科学が博士号を持ってる人だけのものになっちゃった?
最近のレビュー記事やポジションペーパーを拒否する発表は、より「意見的」な姿勢へのシフトを感じさせたし、今回の動きはさらに悪化してる。arXivが元々埋めていた空白は、ちょっとした評判があって、いくつかのプレプリントが正式に発表された論文に引用されるのを許す、名誉あるPDFホスティングサービスだった。スパムや混乱に陥らない程度のモデレーションもあったしね。オープンアクセスに向けて出版社を推進するのにも重要だった(つまり、ついに諦めさせるために)。残念ながら、年々arXivは独自の「場」のようになってしまって、特に機械学習の分野では、きちんと引用されている論文が正式に発表されず、「プレプリント」があちこちで引用されるようになった。arXivのプレプリントへの言及と、著者の所属機関のウェブサイトへのリンクを見たときの印象を考えてみて。私の見解では、arXivは機関としての権力が少ないほど、その機能をよりよく果たしていると思うから、コーネル大学との分離がその機能によって推進されているとは全く信じてない。彼らの声明やFAQからの「おもねりの文体」を何度も見てきたし、今はサイトのスナップショットを取って、ミッションステートメントの避けられない修正を見守る時だね。「ユーザーが期待するポジティブな変化は何ですか?」 - ネガティブな変化は自分たちで見ていくしかないね。[1] https://tech.cornell.edu/arxiv/
俺も似たようなことを言いに来た。機械学習を応用する分野で働いてるけど、純粋にそれだけに集中してるわけじゃないから、arXivが唯一の関連プラットフォームだと思ってる人や、論文に提出する必要がないと思ってる人と接することがある。一方で、プレプリントは全くカウントされないと思ってる人もいるし、データは学術誌に印刷されるまで公開されないって考えてる人もいる。まるで異なる世界がぶつかり合ってる感じだね。両方の側が学び合えると思う。機械学習の場合、早く進めたい気持ちは分かるし、トップジャーナルの平均出版までの時間が250〜300日なんて、余計な負担に感じることもある。でも、ピアレビューの両方の側にいた経験から言うと、そのシステムには価値があって、より良い仕事が生まれるんだ。何もやらないのは、他の選択肢と比較することなく進めるのと同じ精神だし、それすらも後付けで考える感じ。あるいは、ベンチマックスするけど、実際の現実的な結果や時間、コストのトレードオフを探求しないみたいな。さて、学術出版は完璧か?もちろん、全然そんなことない。非常に遠い。経済的にアクセスしやすく、著者や編集者、ピアレビュアーにとって時間効率が良くなるように改革が必要だし、「その日のホットトピック」がジャーナルを支配しないように、ピアレビューがコミュニティのニーズに合致して、実際に仕事の質を向上させるようにしないといけない。悪意のあるピアレビューで引用を稼ぐようなことは避けたい。機械学習の分野が持つ力とオープンレビューの面白い実験を考えると、もっと科学システム全体に関与して、改革を進めたり改善したりしてほしいな。完全に放棄して、PDFホスティングサービスをジャーナルとして扱うのは避けてほしい(もちろん、プレプリントはまだ望ましいし重要だけど、全ての分野を一人で支えることはできない)。
俺の観察では、特にAIの研究は大学を離れて、今は大学がSTEMに対してあまり研究を集中させていないように見える。MetaやOpenAI、Anthropic、Tencent、Alibabaなど、いろんな企業が研究を行っているみたい。
AIのトレーニング用にコンテンツをライセンスする計画があるのかな?
OAIとかはもう許可なしにコピーしてるんじゃないかな?
「最近、arXivの成長が加速してる。2022年以降、提出された原稿が50%増えたこともあって、スタッフを27人に増やした。」これにはちょっと警戒してる。俺の意見では、ビジネスモデルが壊れてると思う。2022年には27人いたけど、2030年には破産してるかもね。
それに、新しい組織を運営するためにLinkedInのビジネスバカを雇ったんだって - だから、ガバナンスに関しては無限成長のテックスタートアップを目指してるみたい。非営利の技術的法的地位にもかかわらずね。発表の言葉遣いにもそれが表れてるよ(「長期的な財政的持続可能性の向上」)。OpenAIがその仕組みがどれだけうまくいくか、そしてそのガバナンスが企業や科学、公共にどう影響するかを示してる。要するに、めちゃくちゃだ。