공개 3일 만에 접근이 차단된 단명 프런티어 모델이 Claude Code 위에서 수행한 자율 코딩 4,665스텝. 한 행 = 한 스텝의 [맥락 → 사고 → 다음 액션] 기록.
에이전트는 사용자에게 설명하기보다 직접 도구를 호출해 작업을 밀어붙인다. 대화형 챗봇과 가장 다른 지점.
Bash+Edit+Read+Write+PowerShell = 3,394건(전체 tool_use의 89%). 압도적으로 코딩/개발 에이전트. *Preview MCP = 브라우저 직접 검증 계열 합산
코드를 작성한 뒤 직접 실행하고, 브라우저로 playtest하며(Preview MCP 112건) 결과를 보고 고치는 검증 내장 루프가 관찰된다.
웹/3D 게임(FPS 클론·WebGL 레이트레이서), 물리 시뮬, 디지털 트윈 지구, 풀스택 앱까지 — 빌드→실행→검증 end-to-end 개발이 주류.
| 현재 ↓ / 다음 → | Bash | Edit | Read | Write | PowerShell | Preview/기타 |
|---|---|---|---|---|---|---|
| Bash | .66 | .11 | .11 | .04 | · | .05 |
| Edit | .24 | .66 | .02 | .02 | .03 | .03 |
| Read | .27 | .21 | .43 | .04 | · | .05 |
| Write | .23 | .13 | .02 | .50 | .08 | .04 |
| PowerShell | · | .11 | .17 | .21 | .45 | .06 |
대각선(같은 도구 반복)이 가장 진하다 — 한 종류 작업을 연달아 처리하는 "배치" 성향. 그다음으로 진한 칸은 Edit→Bash(.24)·Read→Bash(.27)·Read→Edit(.21), 즉 "고치거나 읽은 뒤 곧장 실행"으로 가는 경로다. 같은 도구 반복을 걷어낸 전환 흐름으로 보면 Bash→Edit→Bash(141)·Edit→Bash→Edit(104)가 1·2위 — 수정↔실행을 끈질기게 오가는 디버그 루프다(대표 4연속 Edit→Bash→Edit→Bash 94회).