Fable 5 trace 해부 · 프런티어 에이전트의 실행 궤적 분석

프런티어 에이전트는 어떻게
사고하고 도구를 쓰는가

공개 3일 만에 접근이 차단된 단명(短命) 프런티어 모델 claude-fable-5가 Claude Code(에이전트 코딩 CLI)에서 수행한 자율 코딩 실행 궤적(trace) 데이터셋을 조사·정량분석·행동분석하고, 교육·콘텐츠 산출물로 정리했습니다. 도구가 Claude Code 네이티브 툴이라 실제 에이전트 행동을 step-by-step으로 들여다볼 수 있는 드문 1차 사료입니다.

4,665

실행 스텝 (행)

에이전트 세션

81.4%

tool_use 액션

31종

사용 도구

87%

코드→검증 (10스텝 내·중앙값 2)

데이터의 3대 한계

⚠ 한계 1

사고(CoT)는 합성이다

Fable 5는 Claude Code에서 사고를 저장하지 않아, 데이터 저자가 최종 출력을 보고 gpt-oss:120b로 사후 생성했습니다. 진짜 Fable 산출물은 액션(output)뿐 — "Fable의 추론을 증류"한다는 표현은 과장입니다.

⚠ 한계 2

라이선스 AGPL-3.0

강한 카피레프트. 이 데이터로 학습한 모델·서비스를 배포하면 의무가 전염될 수 있습니다. 상업적 distillation·제품화 전 라이선스 검토 필수. 교육·연구·내부 실험은 자유.

⚠ 한계 3

작고·단일모델·재현 불가

4,665행은 단독 사전학습엔 작습니다(SFT 보강·행동 해부용). 단일 모델이라 모델 비교엔 부적합하나 행동 해부엔 최적. 모델 자체가 차단되어 재수집 불가 — 희소가치의 원천.

데이터셋 소개

각 행은 에이전트가 한 스텝에서 지금까지의 맥락(context)을 보고 → 속으로 추론(cot)하고 → 다음 단일 액션(output: 도구 호출 또는 텍스트)을 내는 단위입니다.

도구의 89%가 파일·셸 조작(Bash·Edit·Read·Write)에 집중된 코딩/개발 에이전트 trace이며, 웹 검색·브라우저 미리보기로 결과물을 실제 playtest·검증하는 end-to-end 개발 행동까지 담겨 있습니다. 3D 게임(레이트레이싱 FPS), 물리 시뮬레이션, 풀스택 앱, 데이터/ML 등 도메인이 다양합니다.

한 세션은 짧게는 1스텝, 길게는 439스텝에 이르는 초장기 자율 작업이며, "코드를 쓴 직후 곧 검증한다"는 패턴이 강하게 나타납니다(코드→검증 3스텝 내 57% / 5스텝 내 63% / 10스텝 내 87%, 중앙값 2스텝).

데이터셋Glint-Research/Fable-5-traces

규모4,665행 / 60세션

모델claude-fable-5

출시 → 차단2026-06-09 → 06-12

CoT합성 (gpt-oss:120b)

라이선스AGPL-3.0

프런티어 에이전트는 어떻게
사고하고 도구를 쓰는가

열어보기

인터랙티브 trace 뷰어

'에이전트 사고 해부' 덱

에이전트 행동 인포그래픽

데이터의 3대 한계

사고(CoT)는 합성이다

라이선스 AGPL-3.0

작고·단일모델·재현 불가

데이터셋 소개