ハクソク

世界を動かす技術を、日本語で。

3.4Mの太陽光パネル

概要

  • GM-SEUSデータセットv2のレビューと新機能の紹介
  • ハードウェア環境や使用ツール・アプリケーションの明示
  • データ取得・変換手順の詳細な解説
  • 各データセットのレコード数やカラム統計の提示
  • Parquet変換方法やNULL値の扱いに関する具体例

GM-SEUS v2 データセットレビュー

  • GM-SEUS(Ground-Mounted Solar Energy in the United States)データセットのv2が公開、パネル数が2.9M→3.4Mに増加
  • 新たにRooftop Arrayデータセットが追加
  • 各データセットのリフレッシュおよび拡充

作業環境

  • AMD Ryzen 9 9950X(16コア32スレッド、5.7GHz動作)のワークステーションを使用
  • DDR5 96GB RAM(4,800MT/s)、Crucial T700 4TB NVMe SSD(12,400MB/s読み込み)搭載
  • Cooler Master HAF 700ケースCorsair 1,200W電源ASRock X870E Nova 90マザーボード
  • **Ubuntu 24 LTS(Windows 11 Pro上のWSL2)**で運用
  • Nvidia GTX 1080使用理由:Windowsの方がドライバサポートが良好、ArcGIS ProはWindows専用

必要なツールのインストール

  • GDAL 3.9.3のインストール手順
    • sudo add-apt-repository ppa:ubuntugis/ubuntugis-unstable
    • sudo apt update
    • sudo apt install gdal-bin
  • DuckDB v1.5.1のインストールと拡張機能(H3, JSON, Lindel, Parquet, Spatial)の導入
    • 拡張機能自動ロード設定(~/.duckdbrcに記述)

マッピングツール

  • QGIS v4.0.1を使用
    • HCMGISプラグインでEsriベースマップ追加
    • 月間1,500万回以上の起動実績

データセットのダウンロードと準備

  • **GMSEUS v2データ(3.4GB ZIP)**のダウンロード・GeoPackage(GPKG)抽出
    • wget -O GMSEUS_v2.zip 'https://zenodo.org/records/19581821/files/GMSEUS.zip?download=1'
    • unzip -j GMSEUS_v2.zip "*.gpkg"
  • GPKGファイルの投影法
    • Albers Equal Area(AEA)を使用
    • gdalsrsinfo -o proj4 GMSEUS_RooftopArrays_2025_v2_0.gpkg

Rooftop ArrayデータセットのParquet変換

  • DuckDB v1.4.4利用(v1.5.1では例外発生のため)
  • Parquet形式への変換SQL例を提示
  • レコード数:5,822件
  • カラムごとのNULL値率・ユニーク値数・最小/最大値を集計

パネルデータセットのParquet変換

  • パネルデータ(GMSEUS_Panels_Final_2025_v2_0.gpkg)をParquet形式へ変換
  • レコード数:3,429,157件
  • 各カラムのNULL率・ユニーク値数・最小/最大値を集計

アレイデータセットのParquet変換

  • アレイデータ(GMSEUS_Arrays_Final_2025_v2_0.gpkg)のParquet変換
  • レコード数:18,980件
  • カラムごとの詳細統計情報を提供

データ分析のポイント

  • NULL値や異常値(-9999など)の適切な変換
  • 空間情報の投影変換とWKB化による可視化・分析の効率化
  • HILBERTエンコードによる空間インデックスの利用
  • **Parquet形式+高圧縮(ZSTD, 圧縮レベル22)**でストレージ効率向上

まとめ

  • GM-SEUS v2データセットは米国の太陽光発電所・パネル・屋根設置型アレイの最新・網羅的な空間データベース
  • GDAL・DuckDB・QGISなどのツールを組み合わせることで、大規模空間データの取得・前処理・変換・分析が容易
  • NULL値処理や空間変換のノウハウがデータ品質を高める鍵

Hackerたちの意見

どんな情報がパネルごとにあるのか、最初に説明してくれるといいな。それに、「NOAA、NASA、USGSの卒業生を含む研究チーム」が実際にデータをどうやって集めたのか、詳しく知りたい。
私ももっと詳しく知りたいな。
こちらで(オープンアクセスの)論文が読めるよ:https://www.nature.com/articles/s41597-025-05862-4 要約にはこう書いてある:「新しく編纂された太陽光パネルの配列とパネル列を使って、設置年、方位、マウント技術、パネル列の面積と寸法、列間の間隔、地面の被覆率、傾斜、設置容量など、既存のデータセットに付加価値属性を調和させて独立に推定します。」
方位や傾斜角のヒストグラムが見れたら面白そうだね。オランダでは、南の方を15〜30度くらいでピークにして、東西の組み合わせでちょっと低いピークがあるんじゃないかな。このデータセットではどうなるのか気になる。
おおよそ緯度と相関があるはずだよ(例外は傾斜のある屋根のパネルで、屋根の傾斜に合わせることになるけど)。
そのアイデア、めっちゃ好き!今日は特に手の込んだことをする時間がないけど、投稿の一番下に2つのビジュアライゼーションを追加したよ。
ここに役立つチャートがあるよ。君の大体の緯度に合ってるみたいだね: https://ratedpower.com/blog/solar-panel-orientation/
> 私の母国オランダでは、南向きで約15-30度のピークが見られると思う。東西の組み合わせでも低いピークがあるね。人々は異なる配置の利点と欠点を面白く探求しているよ。例えば、 > 屋根の面積が限られている場合、予算内で利用可能なエリアに最も効率的に太陽光を設置できるレイアウトは何かという質問になる。そういうシナリオでは、東西(E-W)レイアウトが南向きのレイアウトを上回ることがあるんだ。南向きのレイアウトは「より良い位置」にあるかもしれないけど、E-Wだと同じエリアにもっと多くのパネルを設置できるからね。* https://ases.org/east-west-vs-south-facing-solar-when-more-p... 基本的には、場所や屋根の条件によって「質と量」のバランスを考えてるんだ。
これを考えると、中国は毎日その3倍くらいを設置してるよね。https://reneweconomy.com.au/just-staggering-china-installs-1...
アメリカの政策がどれだけ後れを取っているかを考えると、これが未来の大きな要因になるだろうね。エネルギーコストがほとんどないエネルギー重視の使用例が、西洋の産業を追い越すことになるよ。
これは包括的なデータセットじゃないよ。アメリカは2025年に43GW_peakを設置したけど、それは約8000万枚の新しいパネルに相当する。とはいえ、中国に比べると新しい容量は桁違いに少ないけど、二桁の差ではないよ。
かなりクールだけど、ヒートマップには「これはただの人口密度マップだな」っていう感じがちょっとあるね。https://xkcd.com/1138/ 一人当たりに修正できたら面白いけど、人口密度のために任意の六角形を調整するのは本当に大変そうだな。
ポートランドがファーリーポルノマップで赤い点がないなら、xkcdのデータはおかしいよ。
テキサスやフロリダのハブの集中度が低いのは、実際に驚きだと思う。コスト/ベネフィットだけ見ても、これらの地域はもっとパネルで密集してるべきだよね。
液冷のワークステーションがあることの何がそんなに大事なの?この人のハードウェアが何か知っておくべき重要な情報なの?それに、数百万行のデータセットを処理するのに、この rig が必要って何か特別なことがあるの?
すごく90年代から2000年代初頭のテックブログっぽい感じだったね。彼のカスタムGentooビルドがないのが唯一の欠点。
彼はブログの投稿全部でこんな感じだから、深く考えない方がいいよ。テック業界には意外な癖を持った人がいっぱいだからね。
> 96 GBのDDR5 RAM ほとんどの人はこれより安い車に乗ってるよね。
液冷式コンピュータには大きな利点があるんだ。普通、コンピュータは時間が経つにつれて劣化していくけど、まだなんとか使える時期が長く続いて、もっといいものが欲しくなることがあるよね。液冷のワークステーションがあれば、そういう微妙な状態を管理する必要がなくなるんだ。突然壊れたりしないからね。
HNでコンピュータ愛好者を批判するのは良くないと思うな。彼らが自分のコンピュータに熱中するのは当然じゃん。
明らかに彼は、あなたが彼の結果を再現したい場合のために、彼らの仕様を教えてくれてるんだよね。試してみて、あなたの結果がどうだったか教えてよ。
「私のワークステーション」って見た瞬間にスキミングし始めたのが面白い。なんでそうなったのか意識してなかったけど、あなたが言ったから戻って見直したよ。脳がウェブページの信号抽出を自動化してるみたい。
最初はこの記事でのその選択が変だと思ったけど、徹底的な人を責めるつもりはないよ。おそらく付録としての方が良い選択だね。良い内容を上に持ってくるべきだと思う。でも全体的には大したことないよ。
9950Xは、手頃な価格で素晴らしいCPUだし、普通のケースに普通の空冷ヒートシンクで全然問題なく動くよ。ファンもそんなにいらないしね。TDPもそんなに高くないし。ソース:うちの9950X、空冷で幸せに動いてるよ。(恥ずかしいことに、私が気にしてるCPU負荷の作業では、ほぼ同じ性能を発揮するM4 Maxがあって、消費電力は45Wくらいなんだ。業界全体がAppleの電力効率に追いつく必要があるね。)
彼のブログに不慣れなら、データベースや拡張機能のベンチマークもたまにやってるよ。彼は毎回、セットアップの概要から始めてる。
フロリダや乾燥した/晴れた州でソーラーパネルがほとんどないのは本当に驚きだよ。フロリダでは変な法律があって設置が難しいけど、10kw以下ならまだ比較的簡単なんだ。友達が10kw未満のソーラーパネルを設置して、今は暑くて湿気の多いフロリダの気候で97%オフグリッドになってる。古い低効率のエアコン、単板ガラスの窓、悪い屋根の断熱材で、エネルギー使用量の約60%を占めてる。彼らがソーラーパネルを設置した理由は、実はお金を節約するためじゃなくて、ハリケーンの後に電力が落ちた時に備えるためなんだ。
アラバマでは、規制がひどくて、グリッドに接続されたソーラーパネルを設置するのにかかる手数料が、アラバマパワーから電気を買うより高くなっちゃうんだ。
フロリダでは、ハリケーンがあまりソーラーパネルを設置しない理由になってるのが皮肉だよ。例えば、マイアミ・デイド郡では商業用ソーラーパネルの設置には、160mph以上の風に耐えられるハリケーン認定のソーラーマウントが必要なんだ。これって、設置費用がめっちゃ高くなるってこと。家のソーラーパネルでも、多くの保険会社はハリケーンの影響で屋根にソーラーパネルがある家を保険に入れてくれないんだよね。
再生可能エネルギーがどれだけ政治的になっているか、甘く見ない方がいいよ。基本的に無料のエネルギーが自動的に売れると思うかもしれないけど、田舎のコミュニティで太陽光の話が出ると、必ず「でも、xはどうなるの?」みたいな悪意のあるコメントがたくさん出てくるからね。
カリフォルニアが太陽光パネルの購入インセンティブを減らしたのは知ってるよ。バッテリーのバックアップシステムも必要で、これがコストをかなり上げてるんだ。昼間に太陽光が多すぎて、作られたエネルギーを貯めるストレージが足りないんじゃないかな。
フロリダが太陽光発電の生産でトップ5に入ってるって確かに思ったんだけど。編集:やっぱりそうだ!3位だよ。https://seia.org/solar-state-by-state/
別のコメントでも言ったけど、南部アメリカは日照が多いのに、北部よりも太陽光発電が少ないのが驚きだよね。北部は日照時間が少ないのに、太陽光発電は多い。アメリカにおける政治の影響は本当にひどいし、悲しいことだよ。
どうやら市場にはたくさんの革新が出てきてるみたい。ペロブスカイトが実験室を出て、タンデムセルは30%を超えてるって。
一人当たりのパネル数と地域のIQの分析は面白い信号になるだろうね。パネルは40年の寿命のうち5年以内にキャッシュポジティブになるから、自分の使用量をカバーするまではほとんど最高の投資だよ。
「地域のIQ」を信じるなんて想像してみて。
この記事をスクロールしてるときに、すごく変なスタイリングの挙動を感じる人いる?CSSスタイルが読みながら動的にアンロードされたり再ロードされたりして、マージンが飛んだりフォントが変わったりするんだ。こんなの見たことないよ。ちなみに、私はiOSでBraveを使ってる。
私たちはオフグリッドで、7kwのパネルと40kwhの48vリチウムバッテリーを持ってる。バックアップ用に発電機もあるけど、電気を節約して使わないときは全部オフにするから、ほとんど使わないんだ。全部自分で設置したけど、簡単ではないけど難しくもないよ。コネクタを正しく取り付けたり、ケーブルのサイズを選んだり、ラグを正しく付けたり、アースやブレーカーについて学んだり…一つずつやっていく感じ。今、食べ物を育てるための水ポンプと灌漑用に、建物の屋根に別のシステムを設置しようとしてる。これは48Vのリチウムバッテリーが一つだけだから、もっと簡単で楽だと思う。でも、Victronの機器を使ってCerboに接続して、監視できるようにするつもり。もしこの場所を売ってグリッドのあるところに引っ越したら、最初にすることはコードを切って、自分のシステムを再設置することだね。
セットアップのプロセスを詳しく説明してるブログやリンクってある?
どんなインバーターハードウェアを使ってるの?私は、安物の120VAC 3600Wの輸入インバーターを使ってて、2つの100AH AGMバッテリーを直列につないでるんだ。これは24VDCユニットだからね。今は全部仮設で、実用より実験って感じ。インバーターは、ボルトで固定したスロット付きの角材で作ったポータブルフレームに取り付けてて、バッテリー棚が2つあって合計4つのバッテリーを置ける(今は2つだけだけど)。バッテリーには200Aの端子用ヒューズがあって、200Aのディスコネクトを通してインバーターに接続してる。ケーブルは#2 AWGを使ってるよ。インバーター、AC入力、AC出力は全部、金属フレームに接地された単一の接地バーに接続されてる。AC入力は12 AWGのコードから15Aプラグで供給されてる。AC出力は2つの15A MCCBを使ってて、それぞれが短いワイヤーでつながった単一のソケットに接続されてる。安物の2線式デジタルDCボルトメーターを直列に接続して、インバーターをオフにしてる時でもバッテリーの電圧をすぐに確認できるようにしてる。パネルは実験で庭に仮設したけど、街中だから障害物が多くて日当たりが悪いんだ。正直、2日間だけ動かして、雨が降る前にパネルを下ろしちゃったから、何も測る機会がなかった。パネルは本当に屋根に設置する必要があるけど、今のところそのつもりはないな。このシステムは、冬に風嵐で1時間半停電した時にボイラーのバックアップとして役立ったよ。家の小さなITセットアップのUPSとして使うことも考えたけど、3600Wはオーバースペックすぎるよね。