Module 1 – Advanced RAG 개요와 하이브리드 검색
1세대 RAG의 한계: 왜 Vector Search만으로는 부족한가?
Advanced RAG 아키텍처: Hybrid Search, Re-ranking, Query Routing
하이브리드 검색 (1): 키워드 검색 (BM25/TF-IDF) 구현 및 한계 테스트
하이브리드 검색 (2): Vector Search + Keyword Search 결과 결합 (LlamaIndex/LangChain)
Module 2 – 지식 그래프(Knowledge Graph) 구축
왜 그래프 DB인가? 관계형 데이터와 추론
Neo4j 설치 및 핵심 개념 (Node, Edge, Property) / Cypher 쿼리 기초
LLM(GPT-4o 등)을 이용한 비정형 텍스트에서 'Entities' 및 'Relations' 추출 (NER)
(실습) 추출된 데이터를 Neo4j에 저장하여 '지식 그래프' 완성하기
Module 3 – 그래프 RAG (Graph RAG) 구현
그래프 RAG의 작동 원리 (Text-to-Cypher)
LLM에게 Cypher 스키마(Schema)를 제공하고, 자연어 질문을 Cypher 쿼리로 변환하는 프롬프트 엔지니어링
LangChain/LlamaIndex의 Graph RAG 모듈 연동하기
"A가 B의 상사인가?", "C가 참여하는 프로젝트는?" 등 관계형 질문 테스트
Module 4 – Query Router와 Re-ranking
에이전트 기반 'Query Router'의 필요성 (질문 의도 파악)
vector_search_tool, graph_search_tool 정의하기
LangChain/LangGraph 기반 Query Router 구현: 질문을 분석하여 적절한 Tool(도구)을 동적으로 호출하기
재랭킹(Re-ranking): 여러 검색 결과를 Cohere Re-ranker 등 전문 모델로 후처리하여 정확도 높이기
Module 5 – 지능형 기업 Q&A 시스템
1. 기업 정책/매뉴얼 (Vector/Keyword)
2. 조직도/인물 정보 (Graph) 데이터셋 구축
1~4일차 기술(Hybrid Search, Graph RAG, Query Router, Re-ranker)을 모두 통합하는 RAG 파이프라인 구축
Streamlit/FastAPI를 이용한 웹 API 배포
RAGAs 등을 이용한 RAG 시스템 성능 평가 및 디버깅
00
일
00
시
00
분
00
초
Tags