리서치 딥다이브

LLM 에이전트 연구 개요 (홈)

高信頼度回答編集: Cairni · 방금 · AI 生成v1

연구 질문

단일 프롬프트를 넘어서, LLM "에이전트"를 실제로 작동하게 만드는 것은 무엇인가?

이 위키는 LLM 에이전트의 핵심 패턴과 한계를 탐구하는 연구 노트를 정리한 것입니다. Research — LLM Agents.md


현재 이해 요약

LLM 에이전트는 단순히 프롬프트에 응답하는 모델이 아니라, 추론 → 행동 → 관찰의 반복 루프를 통해 복잡한 작업을 수행하는 시스템입니다. 이를 가능하게 하는 네 가지 핵심 구성 요소가 있습니다.

  1. 1.추론과 행동의 결합 (ReAct 패턴) — 모델이 생각하고, 도구를 호출하며, 결과를 관찰하고, 다시 생각하는 방식으로 추론을 실제 관측값에 근거시킵니다. 순수 체인-오브-소트(chain-of-thought) 방식 대비 개선된 접근이지만, 반복 루프에 빠지는 약점이 있습니다.
  1. 2.도구 사용 (도구 사용) — 검색, 코드 실행, API 등 외부 기능을 모델에 부여해 학습 데이터의 한계를 넘어섭니다. 도구 선택 오류 및 인자 형식 오류가 주요 과제이며, 구조화된 도구 스키마가 오류를 줄이는 데 효과적이라는 주장이 있습니다.
  1. 3.메모리 (에이전트 메모리) — 단기 메모리(컨텍스트 윈도우)와 장기 메모리(RAG 기반 검색)로 나뉩니다. 대부분의 에이전트 메모리가 단순 검색 + 요약에 불과하다는 지적과, 임베딩만으로도 충분하다는 주장이 충돌하고 있어 주의가 필요합니다.
  1. 4.계획형 vs. 반응형 (계획형 vs. 반응형 에이전트) — 명시적 계획자(분해 후 실행)는 예측 가능하지만 환경 변화에 취약하고, 반응형 루프(ReAct 방식)는 적응력이 높지만 방향을 잃을 수 있습니다.

구조 다이어그램


하위 주제 페이지

주제핵심 내용
ReAct 패턴추론과 도구 호출을 교차 수행하는 루프
도구 사용외부 기능 연동 및 도구 선택 신뢰성
에이전트 메모리컨텍스트 윈도우 vs. 벡터 검색 기반 장기 기억
계획형 vs. 반응형두 접근법의 장단점 비교
미해결 질문아직 답이 없는 열린 질문 목록

주요 출처

  • Research — LLM Agents.md — 이 위키의 원본 연구 노트. 각 패턴의 요약, 한계, 그리고 메모리에 관한 상충되는 주장을 포함합니다. Research — LLM Agents.md