2026년 3월 16일, Mistral AI가 “Leanstral”을 공개했다. Lean 4용 형식 검증 AI 에이전트로 오픈소스(Apache 2.0). AI가 생성한 코드의 정확성을 “수학적으로 증명”한다. 119B 파라미터(액티브 6.5B)의 Mixture-of-Experts 모델로, Claude Sonnet을 2.6포인트 앞서면서 비용은 93% 저렴하다. Hacker News에서 775포인트·188코멘트의 반향을 일으켰다. 이 글에서는 기술 사양·벤치마크·도입 방법·바이브코딩과의 관계를 전부 다룬다.
Leanstral이란 무엇인가
Leanstral은 코드를 생성하는 것에 그치지 않고, 그 코드가 맞다는 “수학적 증명”을 동시에 생성하는 AI 에이전트다. 생성된 증명은 Lean 4의 타입 체커가 자동으로 검증한다. 타입 체커의 커널은 약 10,000줄이며, 이 작은 커널이 증명 전체의 정확성을 보장한다. “컴파일이 통과하면 증명은 맞다”는 상태를 만든다.
Mistral은 공식 발표에서 “trustworthy vibe-coding을 위한 오픈소스 기반”이라고 포지셔닝했다. 바이브코딩으로 생성된 코드의 버그를 테스트가 아닌 수학으로 제거하는 접근이다.
기술 사양
| 항목 | 상세 |
|---|---|
| 모델명 | Leanstral-2603(Leanstral-120B-A6B) |
| 총 파라미터 | 약 119B |
| 액티브 파라미터 | 6.5B(토큰당) |
| 아키텍처 | Sparse Mixture-of-Experts(128 전문가, 4개 동시 활성화) |
| 베이스 모델 | Mistral Small 4 |
| 컨텍스트 | 256K 토큰(권장 200K) |
| 입력 | 텍스트+이미지(멀티모달) |
| 라이선스 | Apache 2.0 |
| API 가격 | $0(기간 한정 무료) |
| Hugging Face | mistralai/Leanstral-2603 |
벤치마크: FLTEval
Mistral은 기존 miniF2F 벤치마크(고립된 경시 수학 문제) 대신, Imperial College London의 페르마 마지막 정리 형식화 프로젝트(Kevin Buzzard 교수 주도, 55명 기여자, EPSRC 자금 지원 2029년까지)를 기반으로 한 “FLTEval”을 새롭게 도입했다. 임포트·라이브러리 의존성·복수 파일 구조를 갖춘 실제 리포지토리에서의 증명 능력을 평가한다.
| 모델 | 스코어 | 비용 |
|---|---|---|
| Claude Haiku | 23.0 | $184 |
| Claude Sonnet | 23.7 | $549 |
| Leanstral(pass@2) | 26.3 | $36 |
| Leanstral(pass@16) | 31.9 | $290 |
| Claude Opus 4.6 | 39.6 | $1,650 |
Leanstral(pass@2)은 Sonnet을 2.6포인트 앞서면서 비용은 93% 저렴하다($36 vs $549). 다만 Opus 4.6에는 큰 차이로 뒤진다(31.9 vs 39.6). 정확도 최우선 상황에서는 Opus가 여전히 최강이지만, 비용 효율에서는 Leanstral이 압도한다.
바이브코딩과의 관계
ACM SIGPLAN LMPL’25에서 발표된 논문 “Vibe Coding Needs Vibe Reasoning”(Mitchell & Shaaban, arXiv:2511.00202)이 이론적 기반을 제시했다. 핵심 지적 3가지.
- LLM은 바이브코딩에서 “유저 지시를 코드 일관성보다 우선시한다”
- LLM은 모순되는 제약을 조율할 수 없어 버그가 축적된다
- 형식 수법은 버그 부재를 보증하고, 설계 제약을 형식화하며, 시스템 전체의 불변 조건을 검증할 수 있다
Leanstral은 이 이론을 구현한 것이다. “코드를 생성하고 작동하기를 기도하는” 대신, 요건을 형식적으로 기술하면 Leanstral이 수학적 증명이 붙은 코드를 생성하고, Lean 4의 타입 체커가 자동 검증한다. 패러다임이 “AI 출력을 디버그한다”에서 “사양을 쓰고 증명한다”로 바뀐다.
경쟁사 비교
| 시스템 | 개발원 | 대상 | OSS |
|---|---|---|---|
| Leanstral | Mistral AI | 리포지토리 규모 증명 엔지니어링 | Apache 2.0 |
| AlphaProof | Google DeepMind | 수학 올림피아드 수준 정리 증명 | 비공개 |
| DeepSeek-Prover-V2 | DeepSeek | 경시형 고립 정리 증명 | OSS |
실제 운용 사례: Lean 4 형식 검증
- AWS Cedar: Amazon Verified Permissions를 지탱하는 인가 언어. Lean 4로 형식 검증 완료
- 영지식 증명: LambdaClass가 Lean 4로 zkVM 검증 실시(Ethereum Foundation 자금 지원)
- Microsoft SymCrypt: 형식 검증된 암호 라이브러리
- 블록체인: 컨센서스 알고리즘의 형식 검증
도입 방법
1. Mistral Vibe(가장 간단)
Mistral Vibe에서 /leanstral 커맨드를 사용하면 된다. 셋업 불필요.
2. 무료 API
엔드포인트 labs-leanstral-2603 사용. 기간 한정 무료.
3. 셀프 호스트(vLLM)
vllm serve mistralai/Leanstral-2603 \
--max-model-len 200000 \
--tensor-parallel-size 4 \
--attention-backend FLASH_ATTN_MLA \
--tool-call-parser mistral \
--enable-auto-tool-choice \
--reasoning-parser mistral
자주 묻는 질문(FAQ)
Q. Leanstral을 쓰려면 Lean 4 지식이 필요한가요?
기본 개념의 이해는 권장되지만, Leanstral 자체가 증명 구축을 도와줍니다. Mistral Vibe의 /leanstral 커맨드를 사용하면 대화형으로 진행할 수 있습니다.
Q. 일반 앱 개발에도 쓸 수 있나요?
Lean 4는 프로그래밍 언어로도 사용 가능하지만, 현시점에서는 Python이나 TypeScript의 대체라기보다 중요한 로직의 정확성을 증명하기 위한 보조 도구입니다. 인가 로직, 암호 처리, 금융 계산 등 버그가 허용되지 않는 부분에 적합합니다.
Q. 무료 API는 언제까지 쓸 수 있나요?
Mistral은 “기간 한정”이라고만 공표했으며, 구체적인 종료일은 미정입니다.
소스 리스트
- Mistral AI 공식 “Leanstral” 발표(2026년 3월 16일)
- Hugging Face: Leanstral-2603
- Mistral Documentation: Leanstral
- Hacker News: Leanstral(775pts, 188코멘트)
- arXiv: Vibe Coding Needs Vibe Reasoning
- The Register: Mistral’s new agent proofs your code
- Lean 4 공식 사이트
최종 업데이트: 2026년 3월 19일