임베딩 (embedding)
문장·이미지를 '의미가 가까우면 근처에 놓이는' 벡터 공간에 배치해, 검색·비교·분류를 계산 가능하게 만드는 기초층.
1줄 정의
문장·이미지를 ‘의미가 가까우면 근처에 놓이는’ 벡터 공간에 배치해, 검색·비교·분류를 계산 가능하게 만드는 기초층.
전체 시스템에서 맡는 역할
LLM 관련 기술 글에서 “벡터 DB”, “유사 검색”, “semantic search” 같은 말이 당연한 듯 나온다. 그 바탕에 embedding 이 있다.
embedding 은 일종의 변환기다. 문장을 입력하면 대개 수백~수천 차원의 벡터 (숫자의 나열) 로 돌려준다. 이 변환의 핵심은 의미가 가까운 문장끼리 벡터 공간에서 가까운 위치에 놓이도록 훈련되어 있다는 점.
이 성질 덕분에 retrieval 이 갑자기 계산 가능한 일이 된다.
- 질문과 후보 문서를 같은 변환기에 통과시킨다
- 각각 벡터가 된다
- 질문 벡터에 가까운 후보 벡터를 찾는다 (cosine 유사도 등으로)
- 가까운 순으로 상위 k 개 꺼낸다
RAG 4층 지도에서 보면 embedding 은 최하층, 즉 기초 검색층 (1층) 에 해당한다. 그 위에 있는 GraphRAG 도 agentic retrieval 도 많은 구현에서 내부적으로 embedding 을 쓴다. 그래서 embedding 은 유행의 반대편에 있는 기초 설비다. 겉으로 잘 안 보일 뿐 모든 층이 밟고 있다.
이 층이 빠지거나 품질이 낮으면 어떻게 되는지, 경험자라면 눈에 선할 것이다. 위 레이어를 아무리 화려하게 꾸며도 retrieval 이 이상해진다. 엉뚱한 chunk 가 올라오고, 관련 없는 정보가 섞인다. 원인은 대개 chunk 분할 아니면 embedding 모델 선정이다.
흔한 오해
embedding 은 구조가 단순한 만큼 다룰 때 방심이 생기기 쉬운 용어이기도 하다.
- 오해 1: embedding 은 낡은 기술이다, 라고 받아들여지기 쉽다.
– 실제로는 agentic retrieval 이나 GraphRAG 가 화제가 돼도 그 아래에서 embedding 은 여전히 돌고 있다. 기초 설비는 낡아서 사라지는 층이 아니라 너무 당연해서 설명에서 빠지는 층이다. 모델이나 학습 데이터가 새로워질수록 embedding 의 정밀도도 계속 올라가고 있다.
- 오해 2: embedding 모델은 ‘어느 거나 비슷비슷’ 이라고 여겨지기 쉽다.
– 실제로는 도메인 적합도 (일반 문서 vs 코드 vs 의료), 언어 (일본어·한국어 같은 동아시아 언어 대응 품질), 차원 수, 비용에 따라 동작이 크게 달라진다. 영어 벤치마크 상위여도 한국어에서 놓치는 모델이 드물지 않다.
- 오해 3: embedding 정밀도 = retrieval 정밀도, 로 동일시되기 쉽다.
– 실제로 retrieval 품질을 결정하는 건 embedding 정밀도만이 아니라 chunk 를 어떻게 자르느냐 가 그만큼 영향을 준다. 너무 큰 chunk 는 의미가 뿌옇고, 너무 작은 chunk 는 맥락을 잃는다. embedding 모델을 바꾸기 전에 chunk 전략을 다시 볼 때가 더 효과적인 경우가 많다.
이 용어가 중요한 이유
embedding 을 한 발짝 더 이해해 두면 retrieval 이 망가졌을 때 원인 분리가 빨라진다. 이게 이 용어를 아는 실무적 가치다.
retrieval 이 잘 안 될 때 증상은 위아래 어느 층에서 봐도 비슷해 보인다. “엉뚱한 답이 돌아온다”, “관련 없는 문서가 나온다”, “같은 코퍼스인데 질문마다 품질이 들쭉날쭉하다”. 여기서 “상위 레이어를 바꿔 보자” 며 agentic retrieval 이나 GraphRAG 에 손대고 싶어진다.
하지만 많은 경우, 문제는 1층에 있다. 그걸 제일 먼저 의심할 눈이 있는지에 따라 디버깅 시간이 며칠 단위로 달라진다.
내가 다루는 AI 도구나 자사 제품의 retrieval 이 어떤 embedding 모델로 돌고 있는지, chunk 는 어떻게 자르고 있는지. 이 두 가지만 즉답할 수 있어도 트러블슈팅 대화가 확 짧아진다. 반대로 여기가 블랙박스로 남으면, 상위 레이어를 아무리 만져도 원인에 도달하지 못한다.
이 용어가 나오는 기사
- 당신의 병목은 RAG 가 아니라, retrieval 의 어느 층에 있는가 (※ 발행 후 실제 URL 로 교체)
다음에 읽을 용어 3개
- GraphRAG — embedding 위에 올라앉아 관계를 더하는 층.
- agentic retrieval — embedding 검색을 도구로 만들어 모델이 직접 부르게 하는 층.
- RAG — embedding 이 기초로 받치고 있는 상위 틀.