벡터 DB (vector database)

검색·RAG

벡터 DB (vector database)

embedding 된 chunk 를 저장하고 빠른 유사 검색을 제공하는 전용 데이터베이스. RAG 의 표준 인프라.

1줄 정의

embedding 된 chunk 를 저장하고 빠른 유사 검색을 제공하는 전용 데이터베이스. RAG 의 표준 인프라.

전체 시스템에서 맡는 역할

chunkembedding 으로 벡터화한 다음 어디에 두고 어떻게 꺼낼 것인가 를 담당하는 게 vector DB.

일반 RDB (MySQL, PostgreSQL) 는 완전 일치 검색은 잘하지만 “벡터끼리의 가까움” 고속 검색은 약하다. vector DB 는 ANN (Approximate Nearest Neighbor) 알고리즘을 넣어, 수백만~수억 벡터에서 “가까운 상위 k 개” 를 밀리초 단위로 돌려준다.

대표 선택지: Pinecone, Weaviate, Qdrant, Chroma, pgvector (PostgreSQL 확장). 용도·스케일·셀프호스트 가능 여부로 고른다.

흔한 오해

  • 오해 1: RAG 를 하려면 반드시 vector DB 가 필요하다, 라고 여겨지기 쉽다.

– 실제로 소규모면 PostgreSQL + pgvector 로 충분. 그리고 agentic retrieval 처럼 grep/ripgrep 기반으로 끝내는 설계도 있다.

다음에 읽을 용어 3개

  • chunk — vector DB 에 저장되는 단위.
  • embedding — vector DB 에 저장되는 형식.
  • RAG — vector DB 를 쓰는 상위 틀.
最終更新: 2026-04-18 · shuntailor.net テイラー百科事典

ベクトル DB (vector database)

検索・RAG

ベクトル DB (vector database)

embedding 化された chunk を保存し、高速な類似検索を提供する専用データベース。RAG の標準インフラ。

一行定義

embedding 化された chunk を保存し、高速な類似検索を提供する専用データベース。RAG の標準インフラ。

全体システムの中での役割

chunkembedding でベクトル化したあと、どこに置いて、どう引くか を担当するのが vector DB。

普通の RDB(MySQL, PostgreSQL)は完全一致検索が得意だが、「ベクトル同士の近さ」の高速検索は不得意。vector DB は ANN(Approximate Nearest Neighbor)アルゴリズムを実装して、数百万〜数億のベクトルから「近いもの上位 k 件」を数ミリ秒で返せる。

代表的な選択肢:Pinecone、Weaviate、Qdrant、Chroma、pgvector (PostgreSQL 拡張)。用途やスケール、セルフホスト可否で選ぶ。

よくある誤解

  • 誤解 1:RAG をやるなら必ず vector DB が必要、と思われがち。

– 実際には、小規模なら PostgreSQL + pgvector で十分。また agentic retrieval のように grep/ripgrep ベースで済む設計もある。

次に読むべき用語 3 つ

  • chunk — vector DB に保存される単位。
  • embedding — vector DB に保存される形式。
  • RAG — vector DB を使う上位枠組み。
最終更新: 2026-04-18 · shuntailor.net テイラー百科事典
JAKO