ハクソク

世界を動かす技術を、日本語で。

このCSSは私が人間であることを証明します

概要

  • 資本化(Capitalization)や書式変更が文章やコードに与える影響
  • コードブロックやエムダッシュの美学と技術的対処法
  • スペルミスや単語選択の意図的な操作
  • 書き手のスタイルとアイデンティティの葛藤
  • 技術的手法やスクリプト例の紹介

資本化という最初の傷

  • Capitalizationは最初の傷、その痛みは思ったほどではない
  • 単語が自動的に大文字化されるため、別の方法を模索
  • cat post.md | tr A-Z a-z | sponge post.md のような単純なツールは粗雑すぎ、コードブロックは不可侵領域
  • text-transform: lowercaseの慎重な適用で十分
    • body { text-transform: lowercase; }
    • code, pre { text-transform: none; }

エムダッシュの隠された愛

  • **エムダッシュ(—)**は大切な存在、だがそのままでは使えない
  • 本来の姿を隠し、別の形で表現する必要
  • uv run rewrite_font.py のような簡単な操作で美しいグリフが損なわれる危険
  • Monospaceフォントは避ける、過去のトラウマ
  • FontForgeやfontTools.ttLibを使ったエムダッシュの再構成例
    • エムダッシュをハイフン二本で再現
    • スクリプト例でフォントファイルを自動生成

意図的なスペルミスと単語選択

  • わざとスペルミスすることへの抵抗
  • their/there, its/it’s, your/you’re などの使い分けは避ける
  • definatelyのような露骨なミスは不可
  • lead/lede, discrete/discreet, complement/compliment のような微妙な違いは悩みどころ
  • Peter Norvigのスペルチェッカーに学ぶ
    • 単語の出現頻度で希少語を抽出
    • edits1関数でスペル候補生成し、より一般的な単語に置換

書き手のスタイルとアイデンティティ

  • 書き方を変えることは、外見だけでなく思考や世界との関わりそのもの
  • ただの仮面ではなく、自身の「顔」
  • スタイル変更は本質的な自己喪失のリスク
  • 一歩踏み出すか逡巡し、「今日はやめておく」と結論

技術的手法・スクリプト例

  • text-transformによる部分的な小文字化
  • FontForgefontToolsを活用したフォント編集スクリプト
  • Peter Norvigのスペル修正アルゴリズム
    • 単語分割、頻度計算、編集距離での候補生成

このように、文章やコードの書式・表現を変えることは、単なる技術的操作にとどまらず、書き手のアイデンティティ美意識にも深く関わる問題となる。

Hackerたちの意見

読んでるうちに、これが何も証明してないって思ったよ。人間のサインを試みる投稿をスクロールしながら見てるのと同じ感じ。だから、プロットツイストはちょっと新鮮だった。誰が書いたかは、あんまり関係ない気がする。
詩のアイデアはクールだけど、正直言ってトーンが自己重要感満載で、説明不足で、引き込まれなかった。小文字で書き始めた時点で、AIがそれを真似するのは簡単だから、すぐに興ざめしちゃった。そして、最後にAIが書いたって告白したことで、「私の文章は単に私の見た目じゃなくて、私の考え方や理由付け、世界との関わり方なんだ」っていうフワッとした表現がすごく納得できるようになった。追記:実際、これは人間が自分の人間性を公にアピールしようとしているのではなく、AIが自分の自然な話し方を壊すことを悲しんでいるというアイデアなのかな?そうは思わないけど、それはもっと面白い前提だと思う。
> AIがその小文字を簡単に真似できるかもしれないけど、エムダッシュは無理だよね。
> AIがそれを簡単に真似できるって言うけど、もうすぐオンラインで自分が人間だと証明する方法は一つだけになるだろうね:憎悪表現、人種差別的なスラング、攻撃的な言葉を優雅に組み合わせて書くこと。
作者は、非人工的に見えるように書くために無茶な努力をしてるけど、そういう特徴(不適切な大文字、小さなスペルミスなど)を粗野で不快だと思ってる。でも、結局彼らは自分の根本的な文体も変える必要があることに気づく。それは彼ら自身の反映だから、実際には不可能だと言われてるんだよね。だから、皮肉なことに、その文を書いたのはLLMを通すことだけ。私は、作者が本当にLLMを使ってこの投稿を書いたとは思わない。
最近、この自己重要感満載の非難がよく見られるようになった気がする。いつも簡単に物事を無視するための手段みたいに感じる。> 実際、これは人間が自分の人間性を公にアピールしようとしているのではなく、AIが自分の自然な話し方を壊すことを悲しんでいるというアイデアなのかな?そうは思わないけど、それはもっと面白い前提だと思う。最近まで、私たちは文章を芸術だと考えていて、その意味は読者が決めるものだった。
「自己重要感が強すぎる」AIが書いたものを知らずに読むことからフォーラムやサブレディットを守ろうとする人って、ちょっと自己重要感が強い気がするよね。他の人が自分のUnicodeで形作った宝物を間違って扱うことを心配して、表面的なスタイルに異常にこだわるのが気になる。
これが皮肉だってことは90%確信してる。AIの疑いを避けるために、わざわざ文章を変えるべきじゃないってことを示してるんだと思う。
「スタイルをどう変えるの?」と「いいえ。今日は違う。」の間の二段落は、AIの出力か、非常に良い模倣だと思う。どちらにしても、AIによるスタイルの書き換えを侮辱するために含まれてるんだ。残りは著者が書いたものだと確信してる。
これがすごく良いから、AIが書くのに関わってないと信じたい。
それについて深く考えてみてほしいな。本当に大事なことなのか?影響が変わるのか?それが大事かどうかで、自分について何がわかるのかな?俺にとってはアートなんだけど、これって大文字の「アート」なの?私たちは何を創り出したんだろう?
非作家として詩を書くために使ったことがあるけど、これってAIの匂いがするな。気にしないけど、AIとのコラボって感じがする。
いつか、私たちはすぐに物事を無視するようになるだろうね。自分の世界観に反するからって。日常の荒らしは、完璧じゃない言葉の選び方や不自然な表現を見て、「L0l d0 J00 3V3N 41」みたいなコメントを残すんだろうな。
ゼロトラストポリシーが少しずつ日常生活に浸透してきてるね。いい方向に向かってるのかな?話せる人、感じられる人、見える人を信じよう。
みんなが言ってるように、これがAI生成だってことは簡単にわかるよね。実際、ちゃんと人間であることを証明する方法を作ろうとしてるんだ。ブログにも書いたよ: https://blog.picheta.me/post/the-future-of-social-media-is-h...
俺は今でもHTMLとEmacs(mhtml-mode)を使って手書きで投稿してるよ。投稿の中には長くなりがちなものもある。例えば、レクリエーショナル数学の問題について書くときは、わざと長くて複雑にすることもある。いくつかの解法を捕まえたいから、無駄に複雑なものも含めて、最後に小さくてエレガントな解法について話すんだ。良くも悪くも、どんな投稿の最初のバージョンには結構な数の誤字が含まれる。投稿を読み返して誤字をメモして、家に帰ったら直して変更をプッシュするまでに、何度か電車に乗ることになるから、少なくとも一つは人間の脳から出てきた証拠があるよね。文と文の間にダブルスペースを入れるのも、ソースを見たい人には低レベルな指標になるかも。でも、それでも、書いたものがLLMの出力と間違われるんじゃないかって、ますます気を使うようになってる。これが少し書く喜びを減らしてるんだ。人々がLLM生成の文章に対して疑いを持つようになった理由はよくわかる。でも、数年後に状況が落ち着いたら、今の過敏な疑念が和らいで、手作りのブログを持つ人たちが自分の作品に対して持つ疑念がなくなることを願ってる。
自閉症の人間としてこの文章を読むと、全然違った感じがした。著者が描写する不安、自然なコミュニケーションの仕方が間違っていると指摘され、自分の個性を削るように圧力をかけられることは、多くの人にとって新しい問題じゃない。神経多様性のある人たちは、ずっとこの試練を乗り越えてきた。ペースがフラットすぎるとか、強すぎるとか、語彙が堅すぎるとかカジュアルすぎるとか、目を合わせるのが下手だとか。自分を隠すのが上手すぎて見えなくなったり、逆に自分をさらけ出して人々が何か壊れてると思ったり。著者がたどり着く苦い皮肉は、唯一人間に見える方法は自分の文章をLLMに通すことだってこと。それは多くの人がすでに経験していることに重なる。普通に見える唯一の方法は、少し自分らしくない自分を演じることなんだ。
この投稿は(私の感覚では)明らかにLLMによって作成されたものだと感じる。これを「人間的」には読めないよ。
自分たちが悪意のある(または評判の悪い)行動者じゃないことを証明するために、コミュニケーションや自己表現の仕方を変えるのは、昔からあることだよね。
> 著者がたどり着いた苦い皮肉:人間らしく見える唯一の方法は、自分の文章をLLMに通すことだ。(ちなみに、このコロンの使い方をLLM的だと考える人もいるよね。) 君の言いたいことはわかるよ。LLMの出力は平凡だけど、平均的だからこそ人間らしく読まれるみたいだね。(神経多様性を人間でないと見るのは理解できないけど、神経多様性こそが最も人間らしい特性だと思う。参照:https://quoteinvestigator.com/2022/11/05/think-alike/ 。) ChatGPTが登場するずっと前から、多くの人がGrammarlyのようなツールで「改善」するのがほぼ義務とされる文化に浸っていたみたい。最近は人々が読むことが少なくなっているように感じるし、特に書くこと自体のために良い文章を書く試みには。全体的に、自然言語コミュニケーションの技術が衰退しているのが心配だな。
チャットGPTが出る前からエムダッシュを多用していた者として、もっと人間らしく見えるように書き方を変えなきゃいけないと感じて本当に苦労してる。ダブルダッシュで満足なんだけど、多くのプログラムがそれをフルエムダッシュに自動修正しちゃうんだ。だから、人々が私をそんなに重要じゃないと思って、コミュニケーションをLLMに任せてるんじゃないかって不安になる。だから、この投稿には共感した。ウィルの「エムダッシュの開示」が好きだ: > エムダッシュ(—)、エンダッシュ(–)、ハイフン(-)が好きで、どうやって打つかも知ってる。適切な場所にある省略記号も楽しむけど、どうやって打つかは知らなかった…今まで。脚注やサイドノートはエンドノートより優れていると思っていて、時々フルーロンを楽しむし、人生のある時点ではコロフォンが何かも知っていた。> これを言いたいのは、ここの言葉、句読点、誤字、意見はすべて私のものだってこと。
書くときにもっとエムダッシュを使おうかなって考えてるんだ。だって「これ、LLMっぽい」ってコメントが面倒くさいから。素材に対して反応するか、無視するか、ペンじゃなくてね。
https://www.scottsmitelli.com/articles/em-dash-tool/ 読み手はエムダッシュで止まらないよ。少なくとも、俺はそうだね。
> 僕もいい感じのエリプシスが好きだけど、どうやって打つか知らなかった…今まで。自分の環境で調べる羽目になったよ。エムダッシュとエンダッシュのカスタム設定はしてたけど、エンダッシュをいつ使うかは全然わからなかった。実際、エムダッシュは昔は使わなかったけど、今は使うようになった。こういう鈍いヒューリスティックに頼るより、書き方の質を直感的に理解できる人とやり取りしたいな。
誰かが意図的にエムダッシュ(—)を二つのハイフン(--)にするのを見たことないな。OPがロボトを修正するために使ったコードは意外と短くて、OPが言及してるノーヴィグのスペルチェッカーと同じくらい簡潔だよ。 https://norvig.com/spell-correct.html
うん、ずっとその書き方してるけど、自動修正されちゃうんだよね。 > 非公式な文脈では、ハイフンマイナス(-)がエンダッシュの代わりに使われることが多いし、ハイフンマイナスのペア(--)がエムダッシュの代わりに使われることもある。ハイフンマイナスの記号はほとんどのキーボードで簡単に使えるからね。ワードプロセッシングソフトの自動修正機能は、これらをタイポグラフィ的に正しいダッシュの形に修正することが多い。 - https://en.wikipedia.org/wiki/Dash
いや、ノルヴィグのブログ記事を見るたびに、自分がノルヴィグじゃないことを後悔するよ。
面白いのは、僕がHacker News用に使ってるHack iOSアプリが、自動的にSafariのリーダーモードで記事を開くことなんだよね。リーダーモードだとCSSを無視するから、全部普通に見えてたんだ。読み終わってリーダーモードを解除するまで、例えばテキストは普通の初めの大文字で、ダブルハイフンはエムダッシュになってたし。