Leanstral: 信頼できるバイブコーディングのためのオープンソース基盤
概要
Leanstralは、Lean 4向けに開発された初のオープンソースコードエージェント。
高度な証明支援とコーディング自動化を効率的に実現。
OSSモデルやClaudeファミリーと比較して高効率・低コストを実現。
FLTEvalによる実践的なベンチマークで優位性を証明。
Mistral VibeやAPI経由で即利用可能、モデル重みも自由にダウンロード可能。
Leanstral:Lean 4向けオープンソースコードエージェントの登場
- Leanstralは、Lean 4用に設計された初のオープンソースコードエージェント
- Lean 4は、複雑な数学的対象やソフトウェア仕様を形式的に表現できる証明支援システム
- Leanstralは、効率性重視の6Bパラメータ設計・現実的な形式化リポジトリでの運用に特化
- 既存の証明システムと異なり、大規模汎用モデルのラッパーや単一問題特化型ではない
- Apache 2.0ライセンス下でモデル重みを公開、Mistral VibeのエージェントモードやAPI経由で利用可能
- 技術レポートやFLTEval評価スイートも公開予定、競技数学以外の評価指標を拡充
Leanstralの技術的特徴
- 高疎性アーキテクチャ採用、証明エンジニアリングに最適化
- Leanを完璧な検証器として並列推論を活用し、パフォーマンスとコスト効率を両立
- **MCP(Modular Code Protocol)**に対応、特にlean-lsp-mcpとの高い親和性
- FLTプロジェクトのPR単位で全証明・新規概念定義を完了できるかをベンチマーク指標に採用
Leanstral vs OSSモデル・Claudeファミリー
-
Leanstral-120B-A6Bは、GLM5-744B-A40BやKimi-K2.5-1T-32Bと比較し、遥かに高効率
- GLM5やKimi-K2.5はFLTEvalスコア上限が16.6・20.1程度
- Leanstralは一回のパスで両者を超えるスコア
- Qwen3.5-397B-A17Bが4パス必要な25.4を、Leanstralは2パスで26.3を達成
- Leanstralはコスト同等で29.3までスケール可能
-
Claudeファミリーとの比較
- Leanstral pass@2はスコア26.3、Sonnetを2.6ポイント上回り、コストは$36(Sonnetは$549)
- pass@16ではスコア31.9、Sonnetより8ポイント高い
- Claude Opus 4.6は品質で優位だが、コストはLeanstralの92倍($1,650)
- すべてのベンチマークはMistral Vibe上で追加改変なしで実施
| モデル | コスト($) | スコア | |:-------------|:---------|:------| | Haiku | 184 | 23.0 | | Sonnet | 549 | 23.7 | | Opus | 1,650 | 39.6 | | Leanstral | 182 | 21.9 | | Leanstral@2 | 36 | 26.3 | | Leanstral@4 | 72 | 29.3 | | Leanstral@8 | 145 | 31.0 | | Leanstral@16 | 290 | 31.9 |
ケーススタディ
-
Leanバージョン変更時のStackExchange質問対応
- Lean 4.29.0-rc6で発生したスクリプトのコンパイルエラーをLeanstralが解析
- defによる型エイリアス定義がrwタクティックでパターンマッチできない問題を特定
- abbrevへの書き換えを提案し、問題を解決
- 理由も明確に説明し、ユーザーに納得感を提供
-
プログラムの形式的検証
- Princeton大学のRocq定義(https://www.cs.princeton.edu/courses/archive/fall10/cos441/sf/Imp.html)をLean形式へ自動変換
- 独自記法の実装や、与えられた命題の証明まで自動生成
- 証明要求にも対応可能
Leanstralの利用方法
- Mistral Vibeで即利用
- Vibe内で/leanstallコマンドを入力するだけでコーディング・証明開始
- Labs API提供
- labs-leanstral-2603エンドポイントで無料・低価格APIを提供(期間限定)
- 現実的なフィードバック収集と次世代モデルへの反映を目的
- モデル重みのダウンロード可能
- Apache 2.0ライセンス下で自由に取得・ローカル運用可能
- 詳細ドキュメントやサインアップ
- Mistral Vibe公式サイトから利用登録・詳細情報取得可能
Leanstralは、証明支援とコード生成の両立を目指す現場において、高効率・低コスト・即応性を兼ね備えた新世代エージェント。
形式的検証や数理研究、ミッションクリティカルなソフトウェア開発現場での生産性向上に貢献。