리서치 딥다이브

에이전트 메모리: 단기 vs. 장기

信頼度中概念編集: Cairni · 방금 · AI 生成v1

개요

LLM 에이전트 연구 개요 (홈)에서 다루듯, 에이전트가 단일 프롬프트를 넘어 실질적으로 작동하려면 메모리 문제를 해결해야 한다. 메모리는 에이전트 설계에서 가장 어려운 부분으로 꼽히며, 크게 단기 메모리와 장기 메모리로 나뉜다. Research — LLM Agents.md

단기 메모리: 컨텍스트 창

단기 메모리는 모델의 컨텍스트 창(context window) 그 자체다. 현재 대화, 관찰 결과, 도구 호출 기록 등이 모두 이 안에 담긴다.

장점: 별도 인프라 없이 즉시 사용 가능하고, 순서와 구조가 자연스럽게 보존된다.
한계: 창 크기에 엄격히 제한되어 있어, 긴 작업이나 다중 세션에 걸친 정보를 유지하기 어렵다.

ReAct 패턴처럼 추론-행동 루프를 반복하는 에이전트는 단기 메모리에 크게 의존하지만, 루프가 길어질수록 컨텍스트가 포화되는 문제가 발생한다. Research — LLM Agents.md

장기 메모리: 외부 저장소와 RAG

장기 메모리는 외부 저장소(벡터 DB 등)에서 필요한 정보를 검색(retrieval) 하는 방식으로 구현된다. 이를 RAG(Retrieval-Augmented Generation) 라고 부르기도 한다.

연구 노트에 따르면, 현재 대부분의 "에이전트 메모리"는 사실상 검색 + 요약의 조합에 불과하다는 주장이 있다. Research — LLM Agents.md

주요 한계

단순 벡터 검색의 맹점: 나이브한 벡터 유사도 검색은 정보 간의 시간적(temporal) 또는 구조적(structural) 관계를 포착하지 못한다는 비판이 있다. Research — LLM Agents.md

⚠️ 상충하는 주장

모순/충돌AI · 출처 클릭

임베딩(벡터 검색)만으로도 에이전트 장기 메모리에 충분하다.

한 논문은 임베딩 단독으로 충분하다고 주장하지만, 다른 노트는 나이브 벡터 검색이 시간적·구조적 관계를 놓친다고 반박한다. 두 입장이 정면으로 충돌하며, 현재로선 어느 쪽이 옳은지 미해결 상태다.

Research — LLM Agents.md

이 불일치는 미해결 질문 페이지에도 별도로 기록되어 있다.

메모리 구조 요약

다른 서브토픽과의 관계

관련 개념	연결 이유
ReAct 패턴	반복 루프에서 단기 메모리 소진 문제가 직결됨
도구 사용	외부 저장소 검색 자체가 하나의 도구로 구현되기도 함
계획형 vs. 반응형 에이전트	계획형 에이전트는 장기 메모리에 더 의존하는 경향이 있음
미해결 질문	임베딩 충분성 논쟁, 시간적 관계 처리 방법 등이 열린 문제로 남음

핵심 정리

AI · 출처 클릭

메모리 유형

2가지 (단기·장기)

Research — LLM Agents.md

장기 메모리 주류 구현

검색 + 요약 (RAG)

Research — LLM Agents.md

미해결 논쟁

임베딩 충분성 vs. 시간·구조 관계 누락

Research — LLM Agents.md