리서치 딥다이브

LLM 에이전트 연구 개요 (홈)

LLM 에이전트가 실제로 작동하는 원리와 핵심 패턴, 그리고 현재의 한계를 정리한 연구 위키의 홈 페이지.

高信頼度回答編集: Cairni · 방금 · AI 生成v1

연구 질문

단일 프롬프트를 넘어서, LLM "에이전트"를 실제로 작동하게 만드는 것은 무엇인가?

이 위키는 LLM 에이전트의 핵심 패턴과 한계를 탐구하는 연구 노트를 정리한 것입니다. Research — LLM Agents.md

LLM 에이전트는 단순히 프롬프트에 응답하는 모델이 아니라, 추론 → 행동 → 관찰의 반복 루프를 통해 복잡한 작업을 수행하는 시스템입니다. 이를 가능하게 하는 네 가지 핵심 구성 요소가 있습니다.

1.추론과 행동의 결합 (ReAct 패턴) — 모델이 생각하고, 도구를 호출하며, 결과를 관찰하고, 다시 생각하는 방식으로 추론을 실제 관측값에 근거시킵니다. 순수 체인-오브-소트(chain-of-thought) 방식 대비 개선된 접근이지만, 반복 루프에 빠지는 약점이 있습니다.

2.도구 사용 (도구 사용) — 검색, 코드 실행, API 등 외부 기능을 모델에 부여해 학습 데이터의 한계를 넘어섭니다. 도구 선택 오류 및 인자 형식 오류가 주요 과제이며, 구조화된 도구 스키마가 오류를 줄이는 데 효과적이라는 주장이 있습니다.

3.메모리 (에이전트 메모리) — 단기 메모리(컨텍스트 윈도우)와 장기 메모리(RAG 기반 검색)로 나뉩니다. 대부분의 에이전트 메모리가 단순 검색 + 요약에 불과하다는 지적과, 임베딩만으로도 충분하다는 주장이 충돌하고 있어 주의가 필요합니다.

4.계획형 vs. 반응형 (계획형 vs. 반응형 에이전트) — 명시적 계획자(분해 후 실행)는 예측 가능하지만 환경 변화에 취약하고, 반응형 루프(ReAct 방식)는 적응력이 높지만 방향을 잃을 수 있습니다.

Research — LLM Agents.md — 이 위키의 원본 연구 노트. 각 패턴의 요약, 한계, 그리고 메모리에 관한 상충되는 주장을 포함합니다. Research — LLM Agents.md