1911年版のエンサイクロペディア・ブリタニカを、クリーンで構造化されたナビゲートしやすいサイトに再構築しました: https://britannica11.org/ 具体的には: – 約37,000の記事を元の巻から再構築 – セクションレベルの構造(記事内の目次がクリック可能) – クロスリファレンスを抽出してリンク – 貢献者をインデックス化して検索可能に – 元の巻とページの参照を保持し、読んでいる間に表示 – 各ページの元のスキャンへのリンク – 付随資料(前書き、略語など)を含む – トピックインデックスを再現し、クロスリンク – 記事のメタデータ(長さ、巻など)を含む全文検索 ほとんどの作業は、見出しや複数ページの記事、表、数学、言語、脚注、図版、そしてこのような作品に出てくる小さな特殊ケースの解析と再構築にありました。目指したのは、元のものに近いけど実際に使えるものを作ることです。特にフィードバックをもらいたいのは: – 検索の質 – ナビゲーション(セクション、クロスリファレンス) – 構造的におかしく見えるもの もし質問があれば、パイプラインやデータモデルについてお答えしますよ。