Feynman AIリサーチエージェント論文検証から実験再現まで

Feynman AIリサーチエージェントを知っているだろうか。ChatGPTの「Deep Research」やPerplexityを使って調べものをする人は多い。だが、出てきた回答の引用元をひとつずつ開いて確認した経験があるなら、こう思ったことがあるはずだ。

「この引用、本当に合ってるのか?」

Feynman AIリサーチエージェントは、その疑問そのものを自動化するオープンソースのAIリサーチツールだ。論文を読み、ウェブを検索し、下書きを書き、実験を実行し、すべての主張に引用をつける。しかもローカルで動く。

この記事では、Feynman AIリサーチエージェントが既存のリサーチツールと何が違うのか、どう使うのか、どこに限界があるのかを整理する。

Feynman AIリサーチエージェントとは何か

Feynmanは、Companion AI(getcompanion-ai)が開発するオープンソースのCLIツールだ。

項目 内容
公式サイト feynman.is
GitHub getcompanion-ai/feynman(★3,700+)
ライセンス MIT
最新版 v0.2.16(2026年3月29日)
言語 TypeScript(68.4%)
動作環境 macOS / Linux / Windows
必要条件 Node.js 20.19.0以上

名前の由来は物理学者リチャード・ファインマン。「理解していないものは説明できない」という彼の哲学が、このツールの設計思想に直結している。根拠のない主張は出力しない

Feynman AIリサーチエージェントと既存ツールの決定的な違い

AIリサーチツールは今や数えきれないほどある。Feynman AIリサーチエージェントは何が違うのか。

機能 ChatGPT Deep Research Perplexity Feynman
ウェブ検索
論文検索 △(限定的) ○(alphaXiv統合)
引用付き出力
引用の正確性を検証 ○(Verifierエージェント)
コードと論文の整合性監査 ○(/audit)
実験の再現実行 ○(/replicate + Docker/GPU)
模擬ピアレビュー ○(/review)
ローカル実行
料金 月$20〜200 月$20 無料(OSS)

要するに、ChatGPTやPerplexityは「調べて答える」ツールだが、Feynman AIリサーチエージェントは「調べて、検証して、再現して、レビューまでする」研究パイプラインだ。

4つの専門エージェント

Feynmanの内部には4つの専門エージェントがいる。人間の研究チームをそのままソフトウェアに写し取った構成だ。

1. Researcher(リサーチャー)

論文、ウェブ、GitHubリポジトリ、ドキュメントから証拠を収集する。alphaXivを使って学術論文を横断検索し、複数のソースタイプを照合する。

2. Reviewer(レビュアー)

収集された知見に対して模擬ピアレビューを実行する。主張の強度をFATAL / MAJOR / MINORの3段階で評価し、根拠が弱い部分、文脈が欠けている部分、ソース間の矛盾をフラグする。

3. Writer(ライター)

リサーチノートを構造化された出力にまとめる。文献レビュー、リサーチブリーフ、要約を、コンセンサス・不一致・未解決の問いというセクションで整理する。重要なルール:根拠のない主張を創作することは禁止されている

4. Verifier(ベリファイア)

出力内のすべての引用をクロスチェックする。デッドリンク、引用の不正確さ、論文とコードの不一致をフラグする。ここが他のツールにない最大の特徴だ。

この4エージェントはファイルシステムを介してやり取りする。コンテキストのオーバーフローを避けるため、リードエージェントがサブエージェントを呼び出し、結果をディスクから読み取る設計になっている。

FEYNMAN MULTI-AGENT ARCHITECTURE
Lead Researcher

タスク配分 → サブエージェント呼び出し → 結果統合
↓ ↓ ↓ ↓
Researcher
論文・ウェブ・GitHub・ドキュメントから証拠を収集。alphaXivで学術横断検索。
Reviewer
模擬ピアレビュー。FATAL/MAJOR/MINORの3段階で主張の強度を評価。
Writer
リサーチノートを構造化。コンセンサス・不一致・未解決の問いで整理。
Verifier
全引用をクロスチェック。デッドリンク・不正確な引用をフラグ。
↓ ↓ ↓ ↓
引用検証済みリサーチブリーフ
全主張にソースURL付き・信頼度評価付き・デッドリンクなし

Feynman AIリサーチエージェントの4つの専門エージェント構成図
Feynman AIリサーチエージェントの4つの専門エージェントが協働するアーキテクチャ

Feynman AIリサーチエージェントの9つのワークフロー

Feynmanはスラッシュコマンドで研究ワークフローを実行する。

コマンド 内容 使いどころ
/deepresearch マルチエージェント調査。論文・ウェブ・コードを並列探索 新しいテーマの全体像を把握したい時
/lit 文献レビュー。一次ソースからコンセンサスをマッピング 先行研究の合意と論争点を整理したい時
/review 模擬ピアレビュー。重大度スコアと修正提案を出力 自分の論文・レポートを投稿前にチェックしたい時
/audit 論文対コード監査。再現性を検証 「この論文の結果、本当にコードで再現できるの?」と疑問に思った時
/replicate 再現計画の作成+Dockerコンテナでサンドボックス実行 気になる実験を自分の環境で実際に動かしたい時
/compare ソース同士の比較。一致/矛盾のマトリクスを作成 複数の論文やレポートの主張を照合したい時
/draft 論文スタイルの出力。インライン引用付き 調査結果をフォーマルな文書にまとめたい時
/autoresearch 自律研究ループ(仮説→実験→測定→繰り返し) 探索的なリサーチを自動で回したい時
/watch 定期モニタリング。新しい論文・コード・製品更新を追跡 特定テーマの最新動向を継続的にキャッチしたい時

特に注目すべきは /audit/replicate だ。「論文に書いてあることが、実際のコードと一致しているか?」を自動で検証できるツールは、2026年4月時点でもほとんど存在しない。

FEYNMAN 9 WORKFLOWS
調査系
/deepresearchマルチエージェント並列調査 → 引用検証済みブリーフ
/lit文献レビュー → コンセンサスマッピング
/compareソース比較 → 一致/矛盾マトリクス

検証系
/review模擬ピアレビュー → 重大度スコア + 修正提案
/audit論文 vs コード監査 → 再現性フラグ

実行系
/replicate再現計画 + Docker/GPU サンドボックス実行
/autoresearch自律研究ループ(仮説→実験→測定→繰り返し)

出力・監視系
/draft論文スタイル出力 → インライン引用付き
/watch定期モニタリング → 新論文・コード・更新を追跡

インストールと初期設定

セットアップは1行で完了する。

macOS / Linux

curl -fsSL https://feynman.is/install | bash

Windows(PowerShell)

irm https://feynman.is/install.ps1 | iex

インストール後の初期設定:

feynman setup    # ガイド付きウィザードが起動
feynman doctor   # 環境診断
feynman status   # 現在のモデル・alphaXiv接続状態を確認

設定ファイルは ~/.feynman/ に保存される。

ファイル 内容
settings.json デフォルトモデル、思考レベル、パッケージ
auth.json 暗号化されたAPIキーとOAuthトークン
web-search.json 検索プロバイダー設定
sessions/ 過去のセッション記録

対応モデル(優先順)

  1. Claude Opus 4.6
  2. Claude Opus 4.5
  3. Claude Sonnet 4.5
  4. GPT-5.4
  5. GPT-5

自分のAPIキーを使うため、Feynman自体の利用料金はゼロだ。ただし、API利用料とクラウドGPU(Modal / RunPod)の費用は別途かかる。

実際の使い方:3つのシナリオ

シナリオ1:新しいテーマの全体像を掴む

feynman deepresearch "LLMのスケーリング則に関する最新の知見"

4つのエージェントが並列で論文・ウェブ・GitHubを調査し、引用検証済みのリサーチブリーフを出力する。

シナリオ2:気になる論文を監査する

feynman
> /audit arxiv:2401.xxxxx against https://github.com/author/repo

論文の主張とコードの実装を照合し、不一致をリストアップする。

シナリオ3:特定テーマを継続監視する

feynman
> /watch "multimodal reasoning" --interval weekly

毎週、新しい論文・コード・製品更新をチェックして差分レポートを生成する。

計算基盤との連携

Feynmanは単なる「テキスト検索→まとめ」ツールではない。実験を実際に動かすためのGPU基盤との連携が組み込まれている。

基盤 用途 特徴
Docker ローカル実験 サンドボックス化された安全な実行環境
Modal サーバーレスGPU 必要な時だけGPUを起動、従量課金
RunPod 常駐GPU SSHアクセス付きの永続GPUポッド

/replicate コマンドでこれらの環境に実験コードをデプロイし、論文の結果を再現できる。

触ってみた所感:引用の質が段違い

最初は「また新しいAIツールか」と思った。Deep Researchの類似品が毎週のように出てくる2026年、いちいち全部試している暇はない。

でも、Feynmanは違った。

feynman deepresearch "LLMエージェントのメモリ設計"と打って数分待つ。返ってきたのは、テーマごとに整理されたリサーチブリーフだった。要約、主要な知見、各主張のソースURL、そして知見ごとの信頼度評価。30秒でざっくりした概要が出て、数分で本格的な文献レビューに近いものが仕上がる。

一番驚いたのは引用の質だ。返ってきたURLを片っ端から開いてみた。全部つながる。実在する論文やドキュメントにちゃんとリンクしている。ChatGPTのDeep Researchで同じことをやると、3割くらいは「それっぽいけど存在しないURL」が混ざる。Feynmanにはそれがなかった。

開発者のAdvait Paliwalは「Claude Code for research」と表現している。言い得て妙だ。Claude Codeがコーディングを「対話しながら進める体験」に変えたように、Feynmanはリサーチを「エージェントに任せて検証する体験」に変える。

もう一つ面白いのが、FeynmanのスキルをそのままClaude Codeに統合できる点だ。フルインストールしなくても、リサーチスキルだけをClaude Codeに追加して、普段のコーディングワークフローの中でリサーチ機能を使える。これは既にClaude Codeを使い込んでいる人にとって大きい。

GitHub上のコミュニティの反応も熱い。公開から数週間で3,700スターを超えた。issue trackerを見ると、ユーザーが実際の研究ワークフローに組み込んで使っていることがわかる。「ツールとして面白い」ではなく「仕事で使っている」というフェーズに入りつつある。

ただ、v0.2.xだ。毎日のメインツールにするにはまだ早い。設定ファイルの仕様が変わったり、特定のワークフローでエラーが出ることもある。あくまで「将来のメインリサーチツール候補」として、今のうちに手に馴染ませておく——そういう距離感がちょうどいい。

知っておくべき限界

Feynmanは強力だが、万能ではない。

1. APIキーが必要

Claude / OpenAIのAPIキーが必要。無料で使えるのはFeynman本体だけで、裏で動くLLMの利用料は自分持ちになる。deepresearchを1回走らせると、モデルとトピックの複雑さによっては数ドルかかることもある。

2. Node.js環境が前提

Node.js 20.19.0以上が必要。プログラミング環境のセットアップに慣れていない人にはハードルになる。

3. 引用検証は完璧ではない

Verifierがチェックしてくれるとはいえ、デッドリンクや一時的にアクセスできないソースは見逃す可能性がある。最終確認は人間が行うべきだ。

4. 日本語対応は限定的

CLI自体は英語。日本語の論文やウェブソースを扱えるかはバックエンドのLLMの能力に依存する。

5. バージョン0.2.x

まだ初期段階のプロジェクトだ。破壊的変更やバグは織り込んで使う必要がある。

どんな人に向いているか

こんな人 おすすめ度
論文を日常的に読む研究者・大学院生 ★★★★★
技術ブログで正確な情報を発信したいライター ★★★★☆
競合調査や市場リサーチをする実務者 ★★★★☆
プログラミング経験のない一般ユーザー ★★☆☆☆
簡単な質問にすぐ答えが欲しい人 ★☆☆☆☆

Feynmanは「速く答えが欲しい」人のためのツールではない。「正しい答えが欲しい」人のためのツールだ。

まとめ:リサーチの定義が変わる

2026年、AIリサーチツールの基準が変わりつつある。

  • 「検索して要約する」だけでは不十分
  • 「引用を検証する」ことが当たり前になる
  • 「実験を再現する」ところまでがリサーチになる

Feynman AIリサーチエージェントはその最前線にいる。オープンソースで、ローカルで動き、4つの専門エージェントが研究チームのように協働する。

興味があるなら、まず /deepresearch で自分の研究テーマを投げてみてほしい。引用検証済みのリサーチブリーフが返ってくるその瞬間、「AIリサーチ」の意味が変わる。

毎週月曜日、AIトレンドニュースレター配信中

会員登録すると、毎週月曜日に「今週のAI・バイブコーディング最新情報」をお届けします。
バナー広告なし・本当に役立つ情報だけを厳選するクリーンなAI専門メディアです。

無料で会員登録する(30秒)→

Feynman AIリサーチエージェントのよくある質問

Q. Feynmanは無料で使えますか?

Feynman本体はMITライセンスの無料ソフトウェアです。ただし、バックエンドで動くLLM(Claude / GPT)のAPI利用料と、GPU実験に使うModal / RunPodの費用は別途かかります。

Q. ChatGPTのDeep Researchとは何が違いますか?

最大の違いは「引用検証」と「実験再現」です。ChatGPTは調べて要約しますが、引用が正しいかどうかの自動検証は行いません。Feynmanは専用のVerifierエージェントが全引用をクロスチェックし、/replicateで実験の再現まで実行できます。

Q. プログラミング経験がなくても使えますか?

CLIツールなので、ターミナル操作とNode.jsのインストールが必要です。GUIはありません。コマンドライン操作に慣れていない場合は、まずChatGPTやPerplexityの方が使いやすいです。

Q. 日本語で使えますか?

CLI自体は英語ですが、バックエンドのLLM(Claude Opus等)は日本語のプロンプトを受け付けます。ただし、日本語論文の検索精度はalphaXivのカバレッジに依存します。

Q. どのLLMモデルがおすすめですか?

Claude Opus 4.6が最優先で自動選択されます。研究の精度を重視するならClaude系、速度を重視するならGPT系を選ぶといいでしょう。

会員登録(無料)で毎週月曜ニュースレターを受け取る →


ソースリスト:


著者: VibeCoding Tailor(Lovable公式アンバサダー)
運営: テイラーの隠れ家(shuntailor.net)

JAKO