하네스 (harness)

에이전트

하네스 (harness)

LLM 주변을 감싸는 틀. 도구·루프·권한·컨텍스트 관리를 묶어 '에이전트를 성립시키는 뼈대'.

1줄 정의

LLM 주변을 감싸는 틀. 도구·루프·권한·컨텍스트 관리를 묶어 ‘에이전트를 성립시키는 뼈대’.

전체 시스템에서 맡는 역할

“하네스” 는 말 장구나 안전 벨트를 가리키는 영어로, 그 뉘앙스가 그대로 기술 용어로 옮겨왔다. 모델 본체를 고정해서 날뛰지 않게 하면서 의도한 방향으로 작용시키기 위한 장구 라는 이미지다.

LLM 혼자서는 그저 질문에 답하는 기계에 그친다. 거기에 다음 층을 더하면 agent 가 된다.

  • Tools: 파일 조작, API 호출, 검색, 명령 실행
  • Loop: 판단 → 실행 → 결과 읽기 → 다시 판단, 의 제어
  • Permissions: 어디까지 허가할지, 어디서 사람 확인을 끼울지
  • Context management: 과거 대화나 결과를 어떻게 기억시키고 어떻게 잊게 할지
  • Error handling: 도구 실패 시 재시도·강등·에스컬레이션

이 일습이 하네스. Claude Code 의 Claude Agent SDK 가 대표 예로, 하네스 부분을 분리 제공한다.

LLM 과 하네스의 관계를 집과 건자재로 비유하면, LLM 이 목재, 하네스가 기둥·벽·지붕의 조립 방식이다. 같은 목재라도 설계에 따라 전혀 다른 집이 된다. 그래서 “어느 모델을 쓸까” 보다 “어떤 하네스를 짜느냐” 가 제품 품질을 크게 좌우한다 — 이게 최근 agent 엔지니어링의 핵심 깨달음이다.

흔한 오해

  • 오해 1: 하네스 = 프롬프트 템플릿, 으로 좁게 여겨지기 쉽다.

– 실제로 하네스는 프롬프트보다 넓은 개념. 프롬프트 설계는 하네스의 한 요소지만 도구 구현, 루프 제어, 권한 정책 등을 포함한다. 프롬프트만 갈고 닦아도 하네스는 안 된다.

  • 오해 2: 하네스 설계는 한 번 하면 끝이다, 라고 여겨지기 쉽다.

– 실제로는 모델 거동·유스케이스·실패 패턴을 보며 지속적으로 조정하는 운영물. 초기 릴리스 뒤의 “하네스 개선” 이 제품의 진짜 승부가 된다.

  • 오해 3: 강한 모델이면 하네스는 필요 없다, 라고 기대되기 쉽다.

– 실제로는 모델이 강해질수록 도구 호출 선택지가 늘어나고, 하네스에서 뭘 허용하고 뭘 제한할지의 설계가 오히려 중요해진다. “똑똑하니까 풀어둬도 된다” 는 운영 사고의 전형.

이 용어가 중요한 이유

하네스를 설계 단위로 다룰 수 있게 되면 자사 제품에 AI 를 넣을 때 판단이 한 단계 깊어진다. 이게 T1 으로서의 가치.

설계 회의에서 나오는 질문의 질이 달라진다.

  • 이 하네스는 어떤 유스케이스에 최적화되어 있는가
  • 도구 호출의 입자는 어디서 끊었는가
  • 위험 조작 확인 다이얼로그는 어느 타이밍에 띄울 것인가
  • 서브에이전트와의 경계는 어디인가
  • Skills 나 Commands 같은 사용자 확장 지점을 둘 것인가

이런 것에 구체적인 답을 가질 수 있는 팀은 AI 제품의 차별화를 설계 단계에서 만들 수 있다. 하네스라는 개념이 없는 팀은 “ChatGPT Wrapper” 를 벗어나지 못한다.

Claude Code 초기에 Boris Cherny 등의 발언에 있듯이, “prompt engineering 에서 harness engineering 으로” 라는 구호가 퍼지고 있다. 이 이행을 자기 안에서 해냈느냐가 앞으로의 개발자 실력을 가른다.

이 용어가 나오는 기사

  • 하네스 엔지니어링, Claude Code, 에이전트 설계 관련 기사 다수

다음에 읽을 용어 3개

  • agent — 하네스가 감싸는 대상.
  • Claude Code — 하네스의 대표 구현.
  • tool use — 하네스의 핵심 기능.
最終更新: 2026-04-18 · shuntailor.net テイラー百科事典

ハーネス (harness)

エージェント

ハーネス (harness)

LLM の周辺を固める枠組み。ツール、ループ、権限、コンテキスト管理をまとめた「エージェントを成立させるための骨格」。

一行定義

LLM の周辺を固める枠組み。ツール、ループ、権限、コンテキスト管理をまとめた「エージェントを成立させるための骨格」。

全体システムの中での役割

「ハーネス」は馬具や安全帯を指す英語で、そのニュアンスがそのまま技術用語に転用されている。モデル本体を固定して暴れないようにしつつ、意図した方向に作用させるための装具 というイメージだ。

LLM 単体では、ただ質問に答える機械にすぎない。そこに次の層を足すと agent になる。

  • Tools: ファイル操作、API 呼び出し、検索、コマンド実行
  • Loop: 判断 → 実行 → 結果読み → 再判断、を回す制御
  • Permissions: どこまで許可するか、どこで人間確認を挟むか
  • Context management: 過去の会話や結果をどう記憶させ、どう忘れさせるか
  • Error handling: ツール失敗時のリトライ、降格、エスカレーション

これら一式をまとめたものがハーネス。Claude Code の Claude Agent SDK が代表的な例で、ハーネス部分を独立して提供している。

LLM とハーネスの関係を家と建材で例えると、LLM が材木、ハーネスが柱・壁・屋根の組み立て方。同じ材木でも設計次第で全く違う家になる。だから「どのモデルを使うか」より「どんなハーネスを組むか」が製品品質を大きく左右する、というのが近年の agent エンジニアリングの中心的な気づきだ。

よくある誤解

  • 誤解 1:ハーネス = プロンプトテンプレート、と狭く取られがち。

– 実際には、ハーネスはプロンプトより広い概念。プロンプト設計はハーネスの一要素ではあるが、ツール実装、ループ制御、権限ポリシーなどを含む。プロンプトだけ磨いてもハーネスにはならない。

  • 誤解 2:ハーネス設計は一度やれば終わり、と思われがち。

– 実際には、モデルの挙動・ユースケース・失敗パターンを見ながら継続的に調整する運用物。初期リリース後の「ハーネス改善」が製品の本当の勝負になる。

  • 誤解 3:強いモデルならハーネスは要らない、と期待されがち。

– 実際には、モデルが強くなるほどツール呼び出しの選択肢が増え、ハーネスで何を許すか・何を制限するかの設計がむしろ重要になる。「賢いから野放しにしていい」は運用事故の典型。

この用語が重要な理由

ハーネスを設計単位として扱えるようになると、自社プロダクトに AI を組み込む時の判断が一段深くなる。これが T1 としての価値。

設計会議で聞かれる問いの質が変わる。

  • このハーネスはどのユースケースに最適化されているか
  • ツール呼び出しの粒度はどこで切ったか
  • 危険操作の確認ダイアログはどのタイミングで出すか
  • サブエージェントとの境界はどこか
  • Skills や Commands のようなユーザー拡張点を設けるか

これらに具体的な答えを持てるチームは、AI プロダクトの差別化を設計段階で作れる。ハーネスという概念を持たないチームは、「ChatGPT Wrapper」から抜け出せない。

Claude Code 初期の Boris Cherny らの発言にあるように、「prompt engineering から harness engineering へ」という合言葉が広がっている。この移行を自分の中でできているかどうかが、これからの開発者の腕を決める。

この用語が登場する記事

  • ハーネスエンジニアリング、Claude Code、エージェント設計関連記事多数

次に読むべき用語 3 つ

  • agent — ハーネスが包む対象。
  • Claude Code — ハーネスの代表的実装。
  • tool use — ハーネスの中核機能。
最終更新: 2026-04-18 · shuntailor.net テイラー百科事典
JAKO