PDF RAG 챗 서비스 구축 가이드 : Claude Skill을 활용한 단계별 실전 매뉴얼
PDF RAG 챗 서비스 구축 가이드 Claude Skill을 활용한 단계별 실전 매뉴얼 🎯 목표 PDF 문서를 기반으로 RAG(Retrieval-Augmented Generation) 시스템을 만들어 LLM 챗 서비스 구축 📋 전체 프로세스 [1단계] 프로젝트 초기화 및 계획 ↓ [2단계] PDF 파싱 (PDF Skill 활용) ↓ [3단계] 데이터 전처리 및 청크화 ↓ [4단계] 벡터 DB 구축 ↓ [5단계] RAG 검색 시스템 ↓ [6단계] 챗 인터페이스 구축 ↓ [7단계] 배포 및 최적화 1단계: 프로젝트 초기화 📝 Claude에게 요청하기 안녕! PDF 문서들을 읽고 질문에 답변하는 챗봇을 만들고 싶어. 프로젝트 정보: - PDF 파일: 약 50개 (의학/생명과학 논문) - 언어: 한국어와 영어 혼용 - 사용자: 연구원 10명 정도 - 배포: 로컬 서버 (인터넷 연결됨) - 예산: 무료 도구 선호하지만 필요시 유료 가능 전체 시스템 아키텍처와 단계별 계획을 제안해줘. ✅ Claude가 제공할 것들 1. 시스템 아키텍처 다이어그램 각 컴포넌트 역할 설명 데이터 흐름 기술 스택 추천 2. 단계별 작업 계획 각 단계별 예상 소요 시간 필요한 skill 목록 체크포인트 3. 파일 시스템 구조 /home/claude/pdf-rag-chatbot/ ├── data/ │ ├── raw/ # 원본 PDF │ ├── processed/ # 파싱된 데이터 │ └── embeddings/ # 벡터 인덱스 ├── src/ │ ├── parsers/ # PDF 파싱 │ ├── embeddings/ # 임베딩 생성 │ ├── search/ # 검색 엔진 │ └── chat/ # 챗 인터페이스 ├── tests/ ├── config/ └── requir...