Technical Deep Dive - 고성능 RAG 시스템과 멀티 에이전트 설계 전략

<aside> ✏️

대형 언어 모델(LLM)의 한계를 극복하고 특정 도메인에서 신뢰할 수 있는 답변을 생성하기 위해서는 단순한 프롬프트를 넘어선 정교한 아키텍처가 필요하다. 본 글에서는 검색 증강 생성(RAG) 파이프라인의 고도화와 자율적 태스크 수행을 위한 멀티 에이전트 설계의 핵심 기술적 요소를 다룬다.

</aside>

1. RAG 파이프라인의 핵심: 검색의 질(Quality of Retrieval)

RAG의 성능은 ' 얼마나 정확한 데이터를 검색해 오는가'에 수렴한다.

이를 위해 데이터 전처리부터 재정렬까지의 단계를 세밀하게 설계해야 한다.

데이터 엔지니어링 및 정교한 청킹(Chunking)

단순히 글자 수 기반으로 텍스트를 자르는 것은 문맥을 파괴하는 주범이다.

따라서 문서의 구조를 이해하는 Semantic Splitting이나 마크다운 구조를 활용한 Recursive Character Splitting 전략을 채택해야 한다.

또한, 검색 시 문맥 손실을 방지하기 위해 각 청크 간의 Overlap Size를 최적화하는 과정이 필수적이다.

하이브리드 검색(Hybrid Search)과 메타데이터 활용

**의미 기반의 벡터 검색(Semantic Search)**은 고유 명사나 전문 용어 검색에서 취약할 수 있다.

이를 보완하기 위해 키워드 기반의 BM25 검색을 결합한 하이브리드 방식을 적용한다.

이때, 문서의 메타데이터(발행일, 카테고리, 저자 등)를 기반으로 한 Pre-filtering 단계를 추가하면 검색의 범위와 정확도를 동시에 잡을 수 있다.