世界を動かす技術を、日本語で。

私たちは「Sora」との別れを告げます

概要

  • OpenAIのSora 公式アプリが登場
  • AI動画生成技術 の進化と社会的影響
  • 映像業界やクリエイターへの 影響と課題
  • 著作権問題 や倫理的な懸念
  • 今後の 展望と規制動向

OpenAI Sora公式アプリの登場

  • OpenAIが Sora公式アプリ をリリース
  • AIによる動画生成 技術を一般ユーザーにも開放
  • シンプルなインターフェースで テキストから動画生成 を実現
  • 革新的な動画制作体験の提供
  • クリエイターや一般利用者の 表現手段の拡張

AI動画生成技術の進化と社会的影響

  • Soraは 高品質な映像生成 が可能なAI
  • 数秒から数分の動画 を自然な動きで生成
  • 従来の映像制作コストや時間を 大幅に削減
  • SNSや広告、エンタメ分野での 活用可能性の拡大
  • 教育・研究分野 での応用も期待

映像業界やクリエイターへの影響と課題

  • AI動画生成の普及による 映像制作の民主化
  • プロの映像制作者やCGクリエイターの 役割変化
  • 新たな競争環境 の出現
  • 独自性や創造性の 再定義
  • 既存コンテンツとの 差別化戦略 の必要性

著作権問題や倫理的な懸念

  • AI生成動画の 著作権帰属問題
  • 既存作品の模倣や盗用 リスク
  • ディープフェイクなど 悪用リスク の増大
  • 情報操作やフェイクニュース 拡散の懸念
  • 利用規約やガイドラインの 整備の重要性

今後の展望と規制動向

  • AI動画生成技術の さらなる進化 予測
  • 各国政府や業界団体による 規制・法整備 の動き
  • 透明性や説明責任 の確保が求められる
  • クリエイターやユーザー教育の 重要性
  • イノベーションとリスク管理 の両立が課題

Hackerたちの意見

「OpenAIのトップ幹部たちは、コーディングとビジネスユーザーに焦点を当てる大きな戦略転換の計画を最終調整中」 - WSJ コーディングが金になるんだよね。 https://news.ycombinator.com/item?id=46432791#46434072

*AI開発ツールをみんなに押し付けるのが金になるんだよ。シャベルを売るのと、労働者階級の力を壊すための道具を提供すること。

でも、アンソロピックから市場を取り戻すにはどうするつもりなんだろう?

OpenAIは昨年9月にSoraを立ち上げ、ユーザーがAI生成コンテンツを共有できるTikTokスタイルのソーシャルフィードを作ることで、消費者の間での支配を拡大しようとしました。このアプリが何を目指していたのか、全然理解できなかった。TikTok(そして、ほとんどの現代のソーシャルメディアプラットフォーム)は、友達と何かを共有することではなく、エンターテインメントがメインなんだよね。ほとんどの人は、面白いからTikTokやYouTubeの動画を見るんだ。最初の2〜3分の新しさを超えて、競合プラットフォームでプロが作った高品質なコンテンツがたくさんある中で、AI生成の動画には何があるの?

最初の2〜3分の新しさを超えて、AI生成の動画には何があるの? どこから9月って出てきたのか分からないけど、Soraは2024年2月に立ち上がったんだよね。人々がひどいAI生成コンテンツに飽きる前だった。無限のAI生成コンテンツでソーシャルネットワークを一日中スクロールすることに人々が興味を持つと思われていたんだ。Suno AIのように、「ミュージシャンはもう古い」っていうムーブメントが起きたけど、結局ほとんど関係なくなったよね。Sora 2は、特定のタイプの動画をかなり良く作ってたと思う。説得力のある低解像度の携帯電話の映像を作るのが得意だった。でも、面白いものを引き出すにはすごくクリエイティブな発想が必要で、著作権やコンテンツの制限が大きな「楽しさ禁止」条項になってたから、終わりを迎えたんだ。メインのSoraページにあったのは「かわいい動物が何か素敵で予想外なことをする」動画ばかりだった。私の「お気に入り」の部分は、生成後のチェックが自己報告するところ。例えば、イギリス訛りの怒ったシェフの動画を作るのが不可能だったんだ。Soraは常にそれをゴードン・ラムゼイに合わせてしまって、生成後に自分の動画をフラグ付けしてたんだよね! [0] https://news.ycombinator.com/item?id=39386156 - スレッド全体で「AIスロップ」の言及は一回だけだけど、「ムービースロップ」に部分的なクレジットがある。

このアプリで意味が分からなかったのは、誰がAI生成動画だけをスクロールしたいと思うのかってこと。実際には、人々はアプリで動画を生成して、それを普通のソーシャルメディアに投稿するだけだから、OAIはその広告収入を得られないんだよね。古くからある「あなたの製品は別の製品のサブセットに過ぎない」ってやつ。

このアプリで意味が分からなかったのは、誰がAI生成動画だけをスクロールしたいと思うのかってこと。IPガードレールが出てきて、私たちが知っているキャラクターや文化で何もできなくなるまでは、本当に楽しかったんだ。アメリカのYouTubeのトップ動画を見てみると、どの日でも40〜60%の動画がIPベースなんだ。スター・ウォーズ、任天堂、マーベル、音楽など。

このアプリで理解できなかったこと:誰がAI生成の動画だけをスクロールしたいと思うんだろう?これは何百万もの人がFacebookを使う方法だと言っても過言じゃない。HNの人たちが使う方法とは違うかもしれないけど、新しいアカウントを作れば、AIのゴミ動画を大量に作ってる人たちに絶対に誘導されるよ。でも問題は、FBやTikTok(そして少しだけYT Shorts)がAI動画のドゥームスクロール市場を独占してるから、誰もソラや関連モデルをもっとクリエイティブに使おうとは思ってないみたい。それが多分、補助金を出す価値がないってことに繋がってるんだろうね。

動画生成はOpenAIやGemini、Grokにとって基本的に損失リーダーだとずっと思ってた。一般の人々に「バイブコーディング」でAIが世界を変えるトリリオンドルの技術だって納得させるのは難しいけど、リアルな偽動画は一見して印象的で、多くの非技術者にAIやLLMが革命的なものだって思わせるかもしれない。

モルトブックが最近メタに買収されたんだって。TikTokのAIエージェントとかと同じ仮説だと思う。

Soraユーザーとして言うと: - Soraは頼んだものをうまく作れなかった - 100回生成して、良い動画は3本くらいだった - 良い動画はすべてSoraの外で編集が必要だった(だからSora内で共有できなかった)ただの私の経験。

GPTを使ってクリエイティブに画像を生成する時の経験とほぼ同じだな。ロバート・フロストの詩に合う画像を生成しようとしたけど、なんか…それっぽいのはできたけど、私が描写してたものとは違った。次の90%の時間を、欲しいものに10%近づけるために使ったけど、結局完全にはならなかった。いろんなレベルのオープンエンドを与えたり、この機械式キーボードみたいな美的感覚を持たせたり、70年代のスライドショーからこのグラフィックのSVGを生成させたりしたけど、結局思い描いてたものとはちょっと違った。結局、最初の試みで出てきたものを受け入れる覚悟がないと、この手のものを使って画像を生成するのは難しいと思う。

AI動画が未来だと思ってたのに?今や世界最大のAI企業がサービスを閉鎖するって、費用がかかりすぎるから?OpenAIと業界全体にとって、ただの大惨事だね。

未来の可能性はあるかもしれないけど、今のところOpenAIはお金を稼がなきゃいけないからね。

AI動画のタイムラインがOpenAIと合ってないんだよね。プロンプトから映画になるのはまだまだ遠いし、VFXのためのツールになりたくないみたい。だって、それじゃお金にならないから。他のモデルは、業界のプロのニーズに焦点を当ててるから、彼らの周りを回ってる感じ。

エンターテインメントに使われるフロップは、機会費用だよ。AGIを作るために内部で使うコンピュートの方が、パロディ動画を作るよりずっと価値がある。

Soraが終了するだけで、AI生成動画がなくなるわけじゃないよ。記事にはこう書いてある:「OpenAIはAI動画ビジネスから手を引くわけじゃない(AI動画はChatGPTアプリの中の多くのツールの一つだからね)。でも、スタンドアロンのSoraアプリは、彼らの進化する野望の犠牲になるみたい。」

Soraは「再利用」されて、彼らのAIスラップソーシャルネットワークになった。OpenAIはAI動画ビジネスから手を引くわけじゃなくて、ただAI版TikTokが資本やリソースの最適な使い方じゃないことに気づいたってことだね。

心配しないで、NVIDIAがギガチャド9000xを持ってきて、モデルを問題なく動かすから。

「ソラで作ったものは大事だった」って言葉、なんかイラッとくる。多分、「どうやって」って部分がちょっと曖昧だからかな。今朝トイレで作ったものも大事だったと思いたいな。

曖昧で、上から目線で、自己宣伝みたいな感じがすごく嫌だ。「大事だった」って言葉、全然意味ないし。子供に落書きが可愛いって言ってる時のトーンみたい。しかも、ユーザーはソラで何かを作ったわけじゃなくて、ちょっと入力しただけで機械が作ったんだから。結局、OpenAIが自分たちのやったことが大事だったって言ってるだけだよね。

人々がLLMを使って「表現」するとき、医療的な定義が頭に浮かぶな: https://medical-dictionary.thefreedictionary.com/express

典型的なPR用語だね。

新しい世代のための「素晴らしい旅」って感じだけど、今回は楽観的じゃなくて、ポスト資本主義的な「まだ仕事があるうちに楽しんでね」って雰囲気。クリントン時代がどんどん懐かしくなってきた。バブルが弾けたときに、 vibe コーディングされた「クソ会社」のバージョンを楽しめるか全然自信がない。

もっと適切な例えかもしれないけど、これらのLLMシステムのほとんどが使うおべっかのような言葉だね。こういうのを使って、実際に自社のツールを試してるのかな?この発表はChatGPTが書いたの?正直、どちらの答えも少し心配になる。顧客に対して失礼か、自社製品への信頼がないってことだから。

それは、彼らが人類とどう向き合うかを考える時間を確実に持っている人たちからの空虚な企業用語だからだよ。彼らだけが自然や人間の心に対して信じられない力を持つ、いくつかの厄介な(どんなに突飛でも)終末的なシナリオによって引き起こされたもの。しかも、ソラで作られたものの大半、もしかしたら全てが全く重要じゃなかったってことはみんな知ってるからね。

注目すべきは、Soraの安全対策に関するこのプライマーが昨日発表されたばかりだってことだね。Soraのチームがこれが来るって知らなかったのか、決定があまりにも唐突で一晩で変わったのか、どっちにしてもあまり良い印象じゃない。

アプリは今日終了するわけじゃないから、まだこの内容が役に立つって判断したのかもね。

ディズニーとの契約が破談になったのがきっかけだったんじゃないかな、逆じゃなくて。

よくないね、資金が尽きそうで、パートナーも離れていってるみたい。正直、彼らには本当に強い競争優位性がなかったし。アンソロピックが企業向けでシェアを奪ってるし、他のプレイヤーは他のビジネスからのキャッシュフローがあるから(XAIやGoogle)。

うん、これは戦略的な失敗と衰退のサインだと思ってる。ChatGPTは面白い製品だけど、特定のことには好きなんだ。でも、去年のPRのゴタゴタの後、OpenAIからのニュースはほとんどが期待外れで、縮小の気配が漂ってるね。

母と一緒に動画を作るのがすごく楽しかった。最初の2週間で、ほぼ200本のカメオ動画を一緒に作ったんだ。アップロード制限に常にぶつかってた。たくさんの本物のクリエイティビティ、喜び、笑いが生まれたよ。でも、その2週間が過ぎた後は、結局…もう使わなくなっちゃった。新鮮さがなくなって、戻る理由がなかった。それがソラの本当の崩壊だった。

これまでに、何かを感じさせるAI動画を見たことがない。何を生成してたらそんなに面白かったの?実際にクリエイティブなスキルを身につけたことあったの?

これって、いろんなAIアプリに共通してるよね。Gammaにハマってたけど、最近全然使ってない。NotebookLMも同じ感じ。