LLM의 태생적인 한계와 시스템적인 솔루션


<aside> ✏️

트랜스포머의 Attention은 병렬적으로 문장 내 모든 단어 간의 관계를 연산하기 때문에 입력 길이가 늘어날수록 이의 제곱만큼 연산량이 늘어난다.

이에 따라 입력 가능한 토큰의 수가 정해져 있으며, 실시간 학습 불가나 환각 현상과 같은 문제가 추가로 발생한다.

</aside>

  1. 환각 현상

    딥러닝 모델은 학습된 데이터 이외의 정보에 취약하다.

    Finetuning, RAG, GraphRAG, AI Agent 등

  2. 기억 불가

    Short-term memory(세션 내 기억), Long-term memory(장기기억)

  3. 토큰 제한

모델을 더 정직하게, OpenAI의 Confession 연구


<aside> ✏️

오픈AI는 LLM이 바람직하지 않은 답변을 한 경우, 이를 명확하게 인정하도록 훈련하는 Confession이라는 방법론을 공개했다.

주어진 질문에 대한 주요 답변 외에 ‘정직성’으로만 훈련되는 답변을 **강화학습**하여 Reward hacking 문제를 가시화한다.

</aside>

스크린샷 2026-06-09 오후 8.26.46.png

스크린샷 2026-06-09 오후 8.33.45.png

장기기억 정복의 실마리, 구글의 Titans


Titans: Learning to Memorize at Test Time