世界を動かす技術を、日本語で。

RSSフィードはGoogleよりも多くのトラフィックをもたらしてくれます

概要

  • 個人ブログのトラフィック分析とその傾向についての考察
  • SEO対策を積極的に行わずとも安定したアクセス数の維持
  • RSSやニュースレター購読者からの流入が検索エンジンを上回る現象
  • トラフィック元の多様性と、購読者の割合の高さに対する驚きと喜び
  • トラフィックの質と性質の違いについての短評

個人ブログのトラフィック傾向と購読者の影響

  • Susamのブログ記事 を読んだことがきっかけで、自身のサイトトラフィックを分析
  • 積極的なSEO対策 (キーワード詰め込みやAMP導入等)を避け、 セマンティックなレイアウトメタデータ付与 のみ実施
  • Google が流入元の上位を占め、 DuckDuckGo も意外と高順位、 Bing はほぼ圏外
  • FediverseBlueSky からの流入も観測、 Twitter からのアクセスはほぼ消滅
  • 数週間前に RSSニュースレター のトラッキングを追加
    • RSSやメールのトラッキングは精度が低く、画像の読み込み等でカウントされる仕様
    • Gmail はトラッキング画像の読み込みを難読化
  • AIクローラーやボット はできる限りブロックし、プライバシー配慮を徹底
  • 購読者(RSS/ニュースレター) からの流入が全体の約25%を占め、 大手検索エンジンを上回る 現象
  • はてなブックマークReddit学術的引用 等、突発的な流入も発生
  • 購読者流入検索流入 は性質が異なり、前者は読者が自発的に「いいね」や「購読」を選択した層
  • 多様な経路からのアクセスと、 多くの人に読まれていることへの感謝

トラフィックの質と今後の姿勢

  • 検索流入は「特定の情報を探して偶然たどり着く」ユーザー
  • 購読者流入は「積極的に継続して読むことを選んだ」ユーザー
  • 購読者の存在 がブログ運営のモチベーション向上要因
  • 今後も過度なSEOやトラッキングを避け、 読者本位の運営姿勢 を継続予定

Hackerたちの意見

ここには選択バイアスがたくさんあるね。テレンスは主にオープンウェブの標準や、RSSリーダーを使ってる人にとって興味深いトピックについて書いてる。RSSリーダーは基本的に自動化されてるし、私も何年も使ってるけど、読まない記事を引っ張ってくるだけだったりする。ポッドキャストの「リスン」も実際には自動ダウンロードだし、RSSのトラフィックは必ずしも誰かが記事を読んでるわけじゃない。一方で、検索トラフィックは一般的に意図が強くて、少なくともサイトに目を通してる人がいるってことになるからね。

RSSリーダーは基本的に自動化されてる。私も何年も使ってるけど、読まない記事を引っ張ってくるだけだったりする。彼らはそれに対処しようとしてる > 「RSSとニュースレターのトラッキングを追加したよ。」このデータはかなり損失が大きい。誰かが私のRSSフィードに登録して、投稿を開いて、クライアントが投稿の最後にある遅延読み込みされた画像をダウンロードしたら、私はヒットをもらう。

ここには選択バイアスがたくさんあるね。このデータは1つのウェブサイト以上をカバーすることを主張してない。データから他のウェブサイトについての一般化があるわけじゃない。ただ「これが私のヒットの出所だよ」ってだけ。

そうだね、RSSの数字(特定のブログ投稿に対して)は、RSSフィードの寿命の中での累積訪問者を反映してると思う。一方で、検索エンジンからのクリック数は瞬間的な人気を反映してる。同じパターンが、例えばサブレディットの購読者数と、関連するIRCチャンネルに現在いるニックネームの数に見られるけど、IRCのロガーがその違いを和らげてるね。

Googleで私たちを見つけていたユーザーが、今はAIチャットの要約に満足して、実際のページをクリックする必要がなくなったってことはないかな?その一方で、RSS経由で登録してる長年のユーザーは、いつも通りに現れてる。もしそうなら、コンテンツクリエイターにとってはちょっと悲しい現実だね。

そうだね。検索のCTRが大幅に下がったよ。これを「Google Zero」って呼ぶんだ。情報サイトには致命的だよ。僕の方では、生活のために運営してるウェブサイトのトラフィックが約70%減った。でも、これはまだトレーニングデータの一部なんだよね。こんなのに同意したわけじゃないけど。

最近、フィードを把握するためにLLMベースのエージェントをいじってるんだ。RSSリーダーでの課題は、情報の洪水の中で面白い低頻度の情報が埋もれちゃうことだった。フォローしてる人たちの面白い情報が、高頻度のニュースの更新に埋もれちゃうんだよね。昔は、高頻度の情報にはRSSフィードを使わないことで解決してた。でも、面白い人たちをたくさんフォローしてたから、それが恋しい。これがアルゴリズムベースのフィルタリングにつながったんだ。Hacker Newsはシンプルなアルゴリズムを使ってるけど、確実に使ってるし、まあまあうまく機能してる。だからここに来るんだ。みんなで投票して、残ったものはフロントページからざっと見るには十分に面白い。ちょっとした編集もあるけどね。ソーシャルネットワークは広告収入のためにアルゴリズムを操作しようとしたから、最近はあまり人気がなくなった。MediumやSubstack、Tumblrなどは、シンプルなブログから引き継いで、すぐに発見プラットフォームとしての壁を作り始めたけど、少なくともRSSはサポートしてる。多くのウェブサイトもそうだよ。定期的にニュースや記事を発信するウェブサイトを運営してて、フィードをサポートしてないなら、ちょっとアホだよ。簡単だし、コストもかからないし、たまにはフィードを使ってくれる人もいるかもしれない。実は、あなたのサイトにもフィードがあるかもしれない。ほとんどの新聞にはフィードがあるし、どこにでもある。問題はそれを見つけることじゃなくて、そこから選別することなんだ。昔はそうだった。エージェントベースのアプローチでは、アルゴリズムをコントロールできる。昔はそれができなかったけど、LLMは要約、集約、カテゴライズ、グループ化、フィルタリングなどができる。

ちょっと提案なんだけど、クラスタリングの観点で考えてみたんだ。もし5つの異なるフィードからの5つの投稿が1つのストーリーについて書かれてるとわかったら、それを1つのUI要素にまとめられるかな。

Subweb.netを作ってるんだけど(まだ準備中で、LLMパイプラインはまだオンになってないテストフィードがいくつかあるだけ)、RSSフィードアイテムにトピック、関連性/興味、場所、翻訳をタグ付けして、フィードとして表示するつもり。ユーザーが好みのカスタムプロンプトやランキングパラメータを指定できるようにするかもしれないけど、標準のプロンプトでも十分だと思う。オープンウェブは戻ってくるべきだと思うけど、みんなにとって公平な方法で、読者が自分のフィードをコントロールできる一方で、元のソースにトラフィックやコメントを戻すようにしたい。まだどうやるかはわからないけど。

フォローしている人からの面白い低頻度の情報が、高頻度のニュースの絶え間ないフィードに埋もれちゃう。主要なRSSリーダーはすべてフォルダをサポートしてるよ。あなたの問題は、RSSをソーシャルメディアのフィードのように扱っていることだね。一つの単一の逆時系列フィードで。そんなことはしないで。高頻度のニュースフィードはフォルダにまとめて、見出しをざっと読んで「すべてを既読にする」ボタンを押せばいい。気になる低頻度の情報は別のフォルダに入れておけば、未読のままで自分のペースで読めるよ。細かいフィードを提供していないサイトでも、主要なフィードリーダーはフィルタリングオプションを提供してるし、かなり複雑な正規表現フィルタリングを提供してるところも多い。> これがアルゴリズムベースのフィルタリングにつながったんだ。フィードアグリゲーター(そしてほとんどのソーシャルメディア)は、発見性のために存在してる。新しい人たちから新しい情報を見つけるために。> エージェントベースのアプローチでは、アルゴリズムを自分でコントロールできる。それは過去にはできなかったことだ。LLMは要約、集約、カテゴライズ、グループ化、フィルタリングなどができる。今の計算能力で1セント未満のコストでできていたことに、何十ドルもかけることになるよ。

RSSフィードをカテゴライズする方法として、言語埋め込みを使うことを試してみたんだ。結構うまくいくよ。でも重要なのは、すごく安いから、請求書に載ることはほとんどないってこと。以前のプロトタイプではOpenAIの埋め込みを使ってた。5ドルのAPIクレジットを入れて、1年後にはそのクレジットが切れた。 https://aws.amazon.com/blogs/machine-learning/use-language-e... https://github.com/aws-samples/rss-aggregator-using-cohere-e...

読者にどうやって通知するか、他に方法はあるかな?RSSは結構いいと思うけど、企業はあまり好きじゃないみたい。情報の拡散をコントロールしたいからね。ページに再度アクセスさせて、もっと広告を見せたり、ニュースアルゴリズムで情報を提供したりしたいんだ。でも、RSSは誰かがあなたのページを知っていないと機能しないんだよね。YouTubeはRSSに関しては結構いい感じ。チャンネルのRSSを持っていれば、新しい動画の通知が来るし、チャンネルも発見しやすいからね。それと、私のRSSフィードのデータベースの宣伝も。h ttps://github.com/rumca-js/awesome-database-feeds

彼らが嫌いってわけじゃないんだよね。むしろ、気にしてないか、彼らのレーダーに入ってないって感じ。

あなたのフィードのデータベースがキュレーションされているのは理解してるけど、別のフィードをリストアップしてるデータベース、Wikidataにも興味があるかもね。例えば、20個のランダムなフィードの簡単な例がここにあるよ:https://w.wiki/MpjN (もちろん、国や言語などのフィルターを追加できるよ)。今のところ、そこには合計18598個のフィードがあるみたい。

RSSフィードにすべてのコンテンツを公開したくない理由は、企業的なものだけじゃないよ。https://ciechanow.ski/ はブラウザで見るとこそ本当に楽しめるサイトだし。ブログの全盛期には、書くことや考えを広めるのと同じくらい、HTMLやCSSでどんな面白いことができるかも重要だったんだよね。山内ファミリーオフィスのウェブサイトは、ただのテンプレートのSquarespaceページになってもおかしくなかったけど、彼らはこんな風に見せることにしたんだ:https://www.y-n10.com/

ある平行宇宙では、RSSがブラウザと密接に統合されていて、サイトの更新を「購読」するメインの方法になってるんだろうね。

ああ、あなたのフィードは確実に私のリーダーに入ってるよ。あなたのサイトにアクセスするとき、URLに「?rss_ref=mydomain」を付けてるんだ。これであなたや他のドメインは、RSS訪問者がどこから来たかがわかるよ(もちろん完璧じゃないけど、スパマーも自分のドメインをURLに入れられるからね)。もっと重要なのは、私のトラフィックを見ると、あなたのサイトで私の投稿が確実に読まれてるってこと(少なくとも開かれてる)。私のリーダーには、フィードを読みもせずに引っ張ってくるような裏方のことはないよ。私のフィードの読み方は、もっとTinderスタイルで、ランダムなフィードから最新の投稿を一つずつ見る感じ。コンテンツが大量に流れてくることを考えるだけで気持ち悪くなる。

同じ体験だね。RSSはサーバーログで最もリクエストされるリソースだよ。時にはトラフィックの70%がRSSから来てることもある。ただ、どれくらいが実際の人間で、どれくらいがボットなのか気になるところ。あと、どれくらいが死んだトラフィックなのかも。死んだっていうのは、RSSリーダーにたくさんのものを追加するけど、実際には読まない人たちのことね。RSSはこの点ではちょっとブラックボックスだけど、逆にそれが良いことかもしれない。

フィードリーダーに220,000件の未読アイテムがあるよ。

RSSはこの点ではちょっとブラックボックスだよ でも、投稿されたURLにトラッキングパラメータを追加して、それを分析で追跡すればそうじゃないよ。

僕は現代のウェブに抗議して、すべてのコンテンツをRSSで消費しようとしてる。フィードリーダーが僕の世界へのメインウィンドウになるんだ。コンテンツクリエイターにとって、僕が彼らのことを読んでるのが明らかじゃないのは残念だから、「あなたが書いたこの記事、楽しんだよ、ありがとう」ってメールを送ることが多いんだ。僕も小さなブログを書いてるから、その裏側も見てるけど、SEOやメトリクスにはもう諦めた。僕はこの世界で見たい変化になりたいから、フルコンテンツのRSSを公開して、すべての分析を取り除いて、ウェブサイトをできるだけシンプルにして、連絡先情報を載せて、唯一の成功指標はたまに読む人とのインタラクションの数なんだ。

サイエンスフィクションの短編小説については、新しい号やストーリーの通知をすべてRSSで受け取ってるよ。毎月新しいストーリーを投稿するサイトもあるし、例えば https://www.freesfonline.net/NewAdditions.html みたいなサイトがそうだね。そのリストには常にニュースサイトがあって、RSSリーダーにもっとエントリーを追加できるから、ウェブやエージェントを探してコンテンツを増やす必要はないよ。

僕のRSSリーダーは、オフラインで読めるように投稿のローカルコピーをダウンロードするんだ(Reeder)。これが彼の分析を引き起こすかもしれないね。

ウェブ版をダウンロードするのか、それともRSSフィードからコンテンツをコピーするのか、どっちなんだろう?テレンスのRSSフィードには、彼のサイトを訪れたときに見る内容のフルコピーが含まれてると思うよ。