리서치 딥다이브
ReAct 패턴 (추론 + 행동)
Medium confidenceconceptedited by Cairni · 방금 · AIv1
개요
ReAct(Reason + Act)는 LLM이 단순히 한 번의 프롬프트로 답하는 대신, 추론 → 도구 호출 → 관찰 → 추론의 루프를 반복하는 에이전트 패턴이다. 이 방식은 순수한 체인-오브-쏘트(Chain-of-Thought) 방식과 달리, 실제 외부 관찰 결과로 추론을 보완한다는 점에서 차별화된다. LLM 에이전트 연구 개요의 핵심 하위 주제 중 하나이다. Research — LLM Agents.md
동작 원리
ReAct의 한 사이클은 아래의 세 단계로 구성된다.
- 1.추론 (Thought) — 현재 상황을 분석하고 다음 행동을 결정한다.
- 2.행동 (Action) — 검색, 코드 실행, API 호출 등 도구를 선택하고 호출한다.
- 3.관찰 (Observation) — 도구의 반환 결과를 읽고, 이를 다음 추론 단계의 입력으로 삼는다.
이 루프는 목표가 달성될 때까지 반복된다. Research — LLM Agents.md
순수 체인-오브-쏘트와의 비교
| 항목 | 체인-오브-쏘트 | ReAct |
|---|---|---|
| 추론 방식 | 내부 추론만 사용 | 외부 관찰로 추론을 보완 |
| 도구 호출 | 없음 | 있음 (검색, 코드, API 등) |
| 사실 근거성 | 학습 데이터에 의존 | 실시간 관찰에 근거 |
| 오류 수정 가능성 | 낮음 | 관찰 결과로 수정 가능 |
Research — LLM Agents.md
강점
약점 및 한계
관련 주제
- LLM 에이전트의 도구 사용 — ReAct의 '행동' 단계에서 핵심적으로 사용된다.
- 에이전트 메모리: 단기 vs. 장기 — 긴 ReAct 루프는 메모리 관리 문제를 야기한다.
- 계획형 vs. 반응형 에이전트 — ReAct는 반응형 진영의 대표 패턴이다.
- 미해결 질문 — 루프 탈출 조건, 최적 루프 길이 등이 아직 열린 질문으로 남아 있다.