ChatGPT는 왜 모르는 걸 자신있게 지어낼까. LLM의 다섯 가지 한계부터, 그중 지식·환각을 검색으로 메우는 RAG, 벡터와 내적으로 문단을 찾는 원리, 파인튜닝·시스템 프롬프트의 자리까지.
AI 공부 지도
COURSE A · AI 공부 지도 (전 22편)LLM·Transformer·RAG·Agent·Auto Research까지 AI 전체 흐름을 순서대로 읽는 기초 지도.엔트리 맵부터 시작하기
COURSE B · LLM 이론 집중코스 (전 8편 · NEW)LLM만 뽑아서 진짜 쉽고·깊고·재밌게 다루는 추천 코스. 가중치·벡터·학습·추론·Attention·Transformer·RAG를 순서대로.LLM 집중코스 보기
COURSE C · 바이브코더 CS심화코스 (전 9편 · NEW)AI 도구로 앱 만드는 사람이 한 번은 부딪히는 네트워크·DB·보안·인프라를 처음부터 끝까지 쉽고 깊고 재미있게. 첫 트랙 네트워크편 9편부터 시작 (시리즈 전체 약 42편 · 약 131시간 · 단행본 5권 분량).CS심화코스 보기
📚 순서대로 읽으면 가장 깊이 남아요. 각 섹션 안에서 왼쪽→오른쪽이 권장 순서. 데스크탑은 화살표, 모바일은 스와이프로.
🆕 바이브코더 CS심화코스 · 네트워크편(5편)
🔥 NEW · 전 9편 (네트워크편) · 시리즈 전체 약 30편 예정 · AI 도구로 앱 만드는 사람이 한 번은 부딪히는 네트워크·DB·보안·인프라를 순서대로
← 옆으로 스크롤 →
CS0
CS-DEEP-DIVE
바이브코더 네트워크 9편 시리즈의 서문. AI로 앱을 만드는 사람이 코드 바깥에서 일어나는 일을 한 번은 정공법으로 보기 시작하는 첫 글. CS심화코스 첫 트랙.
CS1
CS-DEEP-DIVE
인터넷 네트워크 차이를 5단 동심원으로 풀어가는 첫 글. 같은 LAN 두 기기·사설IP/공인IP·traceroute로 동심원을 직접 본다 — AI로 앱 만드는 사
CS2
CS-DEEP-DIVE
IP 주소 192.168.0.10이 32비트 정수의 사람용 표기라는 사실부터, MAC 주소가 공장 출하 시 칩에 박힌 281조 가지 영구 식별자라는 자리까지. 패
CS4
CS-DEEP-DIVE
와이파이 비번 입력 후 5 초 동안 무슨 일이 일어나는가. 공유기 안의 작은 Linux 컴퓨터가 NAT·DHCP·ARP 세 가지 일을 한꺼번에 처리하는 풍경. 마
CS5
CS-DEEP-DIVE
공유기 한 대를 살 때 무엇을 봐야 하는가. 작은 집 한 채로 보면 다섯 자리가 한꺼번에 풀린다. 학교 와이파이가 카페보다 오래 걸리는 진짜 이유, 스타벅스가 1
🆕 LLM 이론 집중코스 · 추천(8편)
🔥 NEW · 전 7편 (본편 6 + 추론의 진화 3.5편) · LLM만 뽑아서 진짜 쉽고·깊고·재밌게 다루는 추천 코스
← 옆으로 스크롤 →
L1
LLM-DEEP-DIVE
LLM이 어떻게 작동하는지 가중치·벡터·토큰·임베딩까지 직관으로 끝까지 파헤치는 LLM 이론 집중코스 1편.
L2
LLM-DEEP-DIVE
LLM학습을 산 내려가기 비유로 끝까지 따라간다. 경사하강법·역전파·자기지도학습·미니배치·학습률까지 직관으로 잡는 LLM 이론 집중코스 2편.
L3
LLM-DEEP-DIVE
ChatGPT 작동 원리는 한 줄로 요약되지 않아요. autoregressive·KV 캐시·GPU·VRAM·양자화·Temperature·컨텍스트 윈도우·JSON
L3-5
LLM-DEEP-DIVE
AI 추론 모델 (o1·GPT-5.4 Pro·Claude Extended Thinking) 작동 원리. 23×47도 못 풀던 LLM이 60년 미해결 Erdős 수
L4
LLM-DEEP-DIVE
LLM 디코딩이란 무엇인가. Beam search가 왜 ChatGPT엔 안 쓰이는지, Min-P·Repetition Penalty·Stop Sequences·Co
L5
LLM-DEEP-DIVE
Attention이 무엇인가. ChatGPT·Claude가 '그 단어'가 문장 속 누구를 가리키는지 아는 원리를 Q·K·V 검색과 softmax(Q·K^T/√d_
L6
LLM-DEEP-DIVE
Attention 한 번을 멀티헤드·위치인코딩·FFN으로 묶고 층층이 쌓으면 ChatGPT가 된다. Encoder/Decoder·Masked·Cross-atten
L7
LLM-DEEP-DIVE
ChatGPT는 왜 모르는 걸 자신있게 지어낼까. LLM의 다섯 가지 한계부터, 그중 지식·환각을 검색으로 메우는 RAG, 벡터와 내적으로 문단을 찾는 원리, 파
입구 · ENTRY(2편)
← 옆으로 스크롤 →
기초 · FOUNDATION(8편)
← 옆으로 스크롤 →
F0
FOUNDATION
AI ML 딥러닝 LLM 차이 — AI, ML, 딥러닝, 신경망, Transformer, LLM — 뉴스마다 섞여 나오는 용어들의 크기와 관계를 러시아 인형 비유
F1
FOUNDATION
ChatGPT·Claude 2~3년째 쓰는데도 "LLM이 뭐예요?"에 막히는 분을 위한 해설. 다음 토큰 예측, 토큰, 파라미터, 학습/추론, 환각까지 비유 하나
F2
FOUNDATION
ChatGPT·Claude 안에는 다 Transformer가 들어 있다. 근데 Transformer가 정확히 뭐냐고 물으면 다들 얼버무린다. RNN 한계부터 at
F3
FOUNDATION
2017년 Transformer는 번역용 encoder+decoder 두 덩어리였다. 지금 쓰는 ChatGPT·Claude·Gemini·Llama는 거의 다 de
F4
FOUNDATION
2017년 Transformer 논문 \"Attention is All You Need\"를 수식 하나(scaled dot-product attention)와 비
F5
FOUNDATION
왕 - 남자 + 여자 = 여왕. 이 이상한 뺄셈이 실제로 돌아간다는 사실이 AI의 모든 검색·추천·RAG의 뿌리다. 단어를 고차원 공간의 점으로 옮기는 embed
F6
FOUNDATION
모델 학습 gradient descent — \"모델을 학습시킨다\"는 말이 마법처럼 들리지만, 실제로는 \"예측을 점점 덜 틀리게 파라미터를 조금씩 고치기\"다
F7
FOUNDATION
70B, 405B, 671B 라는 숫자가 대체 뭘 의미하는지. FP16 × 2B 규칙, MoE 활성/총 파라미터, Chinchilla 법칙, 그리고 GPT·Cla
다리 · BRIDGE(3편)
← 옆으로 스크롤 →
B1
BRIDGE
AI 에이전트 — Agent·에이전틱·AI employee가 뉴스마다 뜨지만 정작 agent가 LLM과 어디서 갈라지는지 말할 수 있는 사람은 드물다. 목표·상태
B2
BRIDGE
프롬프트 엔지니어링은 문장 작법이 아니라 확률 분포를 기울이는 기술이다. Zero-shot·Few-shot·Chain-of-Thought가 왜 작동하는지, \"L
B3
BRIDGE
Fine-tuning RAG Prompt — 회사에 AI 붙이려는데 fine-tuning 해야 할지, RAG 만들어야 할지, 프롬프트만 잘 쓰면 되는지 막막한 실
실무 · PRACTICE(10편)
← 옆으로 스크롤 →
M1
PRACTICE
RAG 4층 구조 — RAG를 한 덩어리로 보면 뉴스가 전부 흐리다. Embedding 기초검색·GraphRAG·Agentic retrieval·Memory ad
M2
PRACTICE
긴 컨텍스트와 기억 — Claude 1M 토큰, Gemini 2M이라는 헤드라인이 \"AI 기억력 향상\"으로 들리지만 사실 context window·sessi
M3
PRACTICE
AI 에이전트 구조 — Agent를 tool use·state·planning·reflection·multi-agent 5층으로 뜯어보면 Claude Code·C
M4
PRACTICE
AI 에이전트 하네스 — 같은 Claude·GPT를 써도 agent 품질이 천차만별인 진짜 원인은 하네스다. System prompt·AGENTS.md·skill
M5
PRACTICE
\"AI가 좋아졌다\"는 말은 기준 없이는 공허하다. LLM 평가 최적화를 benchmark·task-specific·production eval 3층으로 분해하
M6
PRACTICE
Autoresearch를 \"AI가 혼자 연구하는 기계\"로 읽으면 놓치는 핵심이 있다. 가설·행동·관찰·해석·업데이트 다섯 가지가 반복 구조로 들어간 시스템이라
M7
PRACTICE
Meta-Harness를 \"AI가 자기 프롬프트를 고치는 기술\"로 읽으면 놓치는 층위 변화가 있다. 개선 대상을 답변에서 하네스(AGENTS.md/CLAUDE
M8
PRACTICE
OMX OMC — OMX(Oh My Codex) / OMC(Oh My Claude Code)를 자기개선 AI로 읽으면 과장이다. 현재 검증된 건 runtime/w
M9
PRACTICE
\"RAG는 죽었냐\"라는 질문에 태일러가 자기 말로 답한다. 죽은 건 1층(단순 embedding + 일회성 retrieval)뿐이고 2~4층(GraphRAG·
M10
PRACTICE
Meta-Harness 실무 — Meta-Harness는 실무적으로 뭐냐 — 태일러가 자기 말로 답한다. 학계 미래형 용어가 아니다. 당신이 매일 CLAUDE.m
응용 · PRODUCT(6편)
🎓 22편을 독파하신 분께 · 응용과 비교
← 옆으로 스크롤 →
P1
PRODUCT
Claude Opus 4.7이 Sonnet 4.6·Haiku 4.5와 기술적으로 뭐가 다른가, 4.6에서 4.7로 넘어가며 Anthropic이 실제로 바꾼 6가지
P2
PRODUCT
LLM API를 호출한다는 게 기술적으로 뭔지 — HTTP POST 한 번, SSE 스트리밍, tool use 라운드트립, 토큰 경제학까지 공식 문서를 일차 소스
P3
PRODUCT
오픈소스 LLM과 클라우드 LLM을 라이선스·VRAM·H100 시간당 비용·추론 엔진까지 수학으로 비교한다. 월 2억 토큰 경계선, vLLM·TensorRT-LL
P4
PRODUCT
벤치는 수렴했는데 회사는 다 다른 곳을 보고 있다. OpenAI·Anthropic·Google·xAI의 훈련 방법·아키텍처·가격 전략을 엔지니어 눈높이로 비교.
P5
PRODUCT
Meta Llama 4·Alibaba Qwen·DeepSeek — 오픈소스 LLM 3강이 왜 각자 다른 방향으로 가는지, MoE·Sparse Attention·라
P6
PRODUCT
Ollama·LM Studio·vLLM·llama.cpp ― 로컬 LLM 스택을 엔지니어 눈높이로 분해. GGUF 양자화 수학, 모델 사이즈별 VRAM, KV c