ハクソク

世界を動かす技術を、日本語で。

自分のオープンソースプロジェクトのSEO戦争に敗れている

Hackerたちの意見

第三者の視点で見てるけど(.netがもっと上位にランクする「べき」ってわけじゃないよ)1) .net版は、theregisterやthenewstackからの非常に権威のあるリンクがいくつかあるんだ。どちらもかなりのエンゲージメントがあったし、そのリンクなしではランクインできなかったと思う。2) まだ一週間しか経ってないから、Googleにどのページが上位にランクするべきか理解させる時間をあげよう。3) Googleは、他のサイトよりも早くトピックをカバーするサイトに偏ってる気がする。特定の競争の激しいクエリで、数年後もトップ3にいるページを見たことがあるけど、それは単にそのトピックについて最初に書いたからだよ。提案としては、時間を与えてあげて。ついでに、言及する時はGitHubじゃなくて自分のウェブサイトにリンクを貼ることをおすすめするよ、少しでもブーストになるから。
>> 特定の競争の激しいクエリで、数年後もトップ3にいるページを見たことがあるけど、それは単にそのトピックについて最初に書いたからだよ。インターネットにはたくさんの模倣者がいるから、最初に公開したものが元のソースの良い指標のように思える。でも、ここで見るように、それが常に真実とは限らないんだよね。
問題の大半は「まだ一週間しか経ってない」って部分だと思う。君は「権威」や「質」みたいな色々な重みが不一致な場所でパッチが当てられたアルゴリズムと戦ってるからね。サイトの不明瞭な属性によって駆動される数千の小さな重みがあって、それを叩いたり変更したりしてもなかなか理解できないと思うよ。
誰かの手間を省けるなら:その記事が間違ったページを引用しているという主張を二重確認したくて行ったら、The Registerについては君が正しいけど、archive.orgの他の二つの記事の最古のコピーは模倣サイトを参照していないみたい。代わりにGitHubを参照してるよ。
うん、Googleは2008年か2009年頃からほとんどのウェブを有用にインデックスするのをやめちゃったんだ。あの時はすごく明らかだったし、それ以来ずっとそうだよ。君のGitHubは特別なサイトだから上位にあるけど、個人サイトはそうじゃないから、正確で珍しいフレーズを検索してもランクインするのはかなり厳しいと思う。最近のGoogleのウェブはそんな感じだからね。もっとトラフィックを増やして(Googleアナリティクスに見てもらうようにして、たぶんそれが重要だと思う)、それが助けになるかも。他のインデックスもあまり良くないしね。スパムと戦うのはお金がかかるから、実際には大きなサイトや特別扱いされてるスパマーをブーストする方が楽なんだよ。
> スパムとの戦いは高くつくことが分かったよ。大きなサイトを優遇して、広告ネットワークを使うスパマーを許可する方が楽だね。結果を見ると、広告部分が本当に広告なのかはっきりしないことも多いし。特にお金が絡むトピックでは、Googleの1ページ目にはトラフィックから利益を得られる企業がよく表示される。
プロジェクトをcodebergに移したんだけど、最初の結果はまだロックされたGitHubプロジェクトで、新しいリンクが表示されてる。
「公式」サイトにはGithub Pagesを使うのがいいと思う、似たような理由で…もしクライアントサーバーが必要なインタラクティブな部分が本当に必要じゃない限り…その場合はページと自分のドメインを分けることもできるかも。ちょっとした提案だよ。
それよりひどいよ。今日、nanoclawについて調べてたら、実際に見つけた第二の模倣者がいるんだ - nanoclawS [dot] io - そいつはメールアドレスを収集してる。明らかなリスクは、これらのサイトの一つがGitHubのリンクを悪意のある模倣者のリポジトリに切り替えることだよ。一つのアプローチは、Googleのランキングではなく、サイトそのものに対処することだね。ホスティング会社が削除してくれるかどうか確認してみて。著作権を主張できるものがあれば、DCMAリクエストをかけることができるけど、オープンソースプロジェクトには難しいかもね。しかも、偽サイトは(まだ)実際に詐欺をしてるわけじゃないし。頑張ってね!
記事には「Google、Cloudflare、ドメインレジストラのspaceship.comに削除通知を提出した」と書いてある。
すべてのOSS開発者へのアドバイス:プロジェクトをオープンソースにしたら、あらゆる可能な方法で悪用されることを覚悟しておいて。心配があるならオープンソースにしない方がいいよ。これは好きかどうかに関わらず、世界の仕組みなんだ。私たちが学ぶためにプロジェクトをオープンソースにしてくれて感謝してるけど、正直言って、自分をまず助けてあげて。
スティーブ・ジョブズは、Appleで無料の食事を一切許可しなかったことで有名だよね。人間は、無料のものには心理的に敬意を払えないんだ。オープンソースに寄付しない、フードスタンプを使い切る、アプリに無料プランがあったら1ドルも払わない、AWSみたいな企業がオープンソースを平気で盗むのもそのせい。もし「条件なしの無料の関係」を提案されたら、真剣に受け止める?街角で5ドルと500ドルのアートがあったら、同じ作品でも最初に目を引くのはどっち?自分の作品を尊重してもらいたいなら、オープンソースにはしない方がいいよ。成功する確率はちょっとだけ上がるかも。公に公開されているGitHubリポジトリの97%は外部ユーザーがいないってことも覚えておいて。
SEOで負けるのは、株式市場でお金を失うのと同じくらい辛いよね。相手はめちゃくちゃ効率的なシステムで、君の具体的な悩みなんて一兆年経っても気にしない。弁護士を雇ったり、SNSで文句を言ったりしても、ほとんど効果はないよ。できることは、一歩引いて市場の理解を見直し、戦略を調整することだけだね。
数年前、ジョン・ライリーがHNに「どうやってSEOを台無しにしたか」って投稿して、俺が無料で修正を手伝ったんだ。彼がそのことについて書いたのはここだよ: https://johnnyreilly.com/how-we-fixed-my-seo もし君も同じように手伝うよ。君の場合の最も早い解決策は、.netサイトが得たバックリンクを全部マッピングすること(これを手伝うよ)、その後、リンクしてくれた出版物にメールを送る。「NanoClawについて取り上げてくれたけど、偽サイトにリンクしてるよ。本物はこれだよ。」実際にリンクを交換してくれるところがどれだけあるか、驚くと思う。それだけで状況が変わるかも。それ以上に、nanoclaw.devには技術的なSEOの要素があって、構造化データやスキーマ、検索エンジンやLLMへの信号があるから、手伝うよ。アップデート: 予想以上に反響があるから、実用的なことをいくつか教えるね。1. Google Search Console - nanoclaw.devを追加して確認した?まだなら、今すぐやってサイトマップを提出して。基本だけど、めちゃくちゃ重要だよ。2. 偽サイトをチェックしたけど、実際にはそれほどバックリンクがないから、状況は思ったより勝てるかも。3. 君のGitHubリポジトリには質の高いバックリンクがたくさんあって素晴らしい。そこにアプローチして、ストーリーを伝えてみて。いくつかは君の実際のサイトにリンクを追加してくれると思う。それだけで、今後の偽者に対してずっと強くなれるよ。これはすべてが新しいから起こっていることだね。君のリポジトリに向かっているバックリンクのリストはこちら: https://docs.google.com/spreadsheets/d/1bBrYsppQuVrktL1lPfNm... 4. プロジェクトのためにオープンなソーシャルプロフィールを作って - Twitter/XやLinkedInページがあればいいよ。これが検索エンジンにNanoClawの知識グラフを構築するのを助ける。そしたら、nanoclaw.devにOrganizationやsameAsのスキーママークアップを追加して、すべてをつなげるんだ(君のサイト、GitHubリポジトリ、ソーシャルプロフィール)。これがGoogleに「これらはすべて同じエンティティに属している」と伝える方法だよ。5. もう一つ - 君はこのHNスレッドからnanoclaw.devにリンクするチャンスがあったけど、ツイートにリンクしたよね。気持ちは分かるけど、フロントページのHN投稿からの強いリンクは、君のサイトの権威に本当に役立つよ。もしルールに反しないなら(特定のケースだから、モデレーターに確認してみてね笑)、ここにnanoclaw.devへのリンクをコメントしてみて。誰も文句を言わないと思うし、それが偽サイトに勝つための一歩になるかも。
すごく寛大だね!でも、もし俺が著者だったら、Googleが壊したものを直すために自分の力を使わなきゃいけない状況に置かれてる気がする。これはただの現実かもしれないけど、俺の中の不公平センサーが暴れまくるよ。Googleが何十億の資本を持ってるのに、GitHubリポジトリにある正しいサイトを見つけられないなんて、俺の人生の時間を奪うの?うんざりだね。これが今の時代なんだろうけど、著者のために機械に対して怒りを感じるよ。
いいフィードバックだね!
素晴らしいアドバイスだね。
> 「NanoClaw」をグーグルすると、偽サイトがプロジェクトのGitHubのすぐ下で世界で2位にランクインしてる。残念ながら、その偽サイト [.net] はKagiで3位、Duckduckgoでは1位だ。KagiではGitHubが1位で、nanoclaw.devは「Interesting Finds」をカウントすると4位だけど、DuckduckgoではGitHubが2位で、nanoclaw.devはどこにも見当たらない。
> このゲームをやりたくないんだ。コードを書いたり、コミュニティを作ったり、機能を追加したり、バグを直したりしたい。じゃあ、コードを書いて、機能を作って、バグを直せばいいじゃん。誰も君に検索エンジンの問題を直せって強制してるわけじゃないよ。トラフィックからお金を稼いでないなら、SEOについてそんなに心配する必要ある?自分のやりたいことをやればいいよ。本当に気になるなら、GitHubに偽サイトについて警告するメモをちょっと書いて、あとは自分の人生を進めればいい。
「nanoclaw」って書いた人が、業界で有名になったりキャリアを良くすることに全然興味ないと思う?
いろんな検索エンジンやAIを使って実験してみたんだ。結果はこんな感じ:GoogleとBraveは公式のGitHubリポジトリにリンクして、その後に偽のドメインが来た。DuckDuckGoとBingは最初に偽のドメインにリンクして、その後に公式のGitHubが続いた。Mojeekは二つのサードパーティの記事を高く評価したけど、公式のGitHubと偽じゃないウェブサイトの両方にリンクしてた。Qwantは最悪で、公式サイトが複数の偽サイトや無関係なGitHubリポジトリの中で二番目の結果だった。AIについては、ChatGPT、Google AIモード、Gemini、Grok、Perplexity、Brave Searchの「Ask」はみんな公式サイトにリンクしてて、いくつかはGitHubリポジトリも追加してた。DuckDuckGoのSearch Assistは公式のGitHubだけにリンクしてた。Google AIモード、Gemini、Grokは偽のウェブサイトについても明確に警告してた。Copilotは公式サイトとGitHubを正しくリンクしたけど、恐らく偽のXアカウントにもリンクしてた。結論:検索ではGoogle、Brave、Mojeekが勝ち。AIは非常に優れていて、全体的に検索を上回ってる。Google AIモード、Gemini、Grokは質が際立ってるね。
ルイ・ロスマンがやったことをやってみて…GoogleのAIに自分のサイトで何を変えればいいか聞いてみて。今それが秘密らしいよ。