바이브 코딩 다음은 AI 에이전트 팀 오케스트레이션이다

최근 Andrej Karpathy가 8개의 AI 에이전트로 연구 조직을 시뮬레이션한 실험을 공유했다. 결과는 아직 실패였지만 그가 제시한 ‘조직 프로그래밍’ 개념은 바이브 코딩 이후의 다음 패러다임을 명확히 보여준다.

Karpathy는 4개의 Claude와 4개의 Codex 에이전트에게 각각 GPU 하나를 할당하고 nanochat 학습 실험을 맡겼다. 목표는 logit softcap을 제거하면서도 성능을 유지하는 것이었다. 그는 다양한 조직 구조를 시도했다. 8명의 독립 연구자 구조로도 진행하고, 1명의 수석 과학자가 8명의 주니어 연구자에게 일을 분배하는 구조도 테스트했다.

인프라는 Git 브랜치를 연구 프로그램으로 사용하고 worktree로 격리했다. 파일 기반 통신을 채택했고 Docker나 VM은 생략했다. tmux 창 그리드로 각 에이전트의 작업을 실시간으로 시각화해서 필요할 때 개입할 수 있게 했다.

그러나 결과는 좋지 않았다. 에이전트들이 창의적인 아이디어를 내지 못했다. 실험 설계도 엉성했다. 통제 변수를 고려하지 않았고 베이스라인 비교도 제대로 하지 않았다. FLOPs 계산도 없었다. 한 에이전트는 히든 레이어 크기를 키우니 검증 loss가 좋아진다고 '발견’했는데 이는 더 큰 네트워크가 더 오래 학습해서 당연한 결과였다. 에이전트는 스스로 이 사실을 알아내지 못했다.

그럼에도 Karpathy가 강조한 핵심은 중요하다. 이제 우리는 '조직을 프로그래밍’하는 시대에 접어들었다는 것이다. 소스코드는 더 이상 클래스와 함수만이 아니다. 프롬프트와 스킬과 도구와 프로세스의 합이다. 아침의 데일리 스탠드업조차 '조직 코드’의 일부가 되는 것이다. 그는 새로운 벤치마크를 제시했다. 임의의 태스크를 주었을 때 내 연구 조직이 얼마나 빨리 진전을 만드는가.

나는 이 관점에 전적으로 동의한다. 바이브 코딩이 개인의 코딩 방식을 바꿨다면 다음 단계는 분명히 AI 에이전트 팀을 어떻게 잘 오케스트레이션할 수 있느냐가 될 것이다. 실제로 Elvis Sun이라는 개발자는 에이전트 오케스트레이션으로 하루 94개의 커밋을 만들어내고 월 1,400만 원짜리 PR 에이전시를 대체했다. 그의 Zoe 오케스트레이터는 Obsidian에서 정밀 프롬프트를 생성하고 Git worktree로 격리된 환경에서 Codex와 Claude Code와 Gemini를 동시에 돌린다. 3중 AI 리뷰를 거쳐 Telegram으로 결과를 알려준다.

Karpathy의 실험이 보여준 것은 명확하다. 에이전트는 잘 정의된 아이디어를 구현하는 데는 능숙하지만 창의적으로 아이디어를 생성하지는 못한다. 따라서 인간의 역할은 오케스트레이터가 되는 것이다. 어떤 에이전트에게 어떤 태스크를 줄 것인가. 어떤 도구를 제공할 것인가. 어떤 프로세스로 검증할 것인가. 이것이 바로 '조직 프로그래밍’이다.

이 역량은 단순히 읽고 이해하는 것으로 얻어지지 않는다. 많은 실험이 필요하다. Karpathy도 인정했듯이 아직은 실패 단계다. 그러나 이런 실험들이 쌓이면서 조직을 프로그래밍하는 방법론이 정립될 것이다. 나 역시 vCoding이라는 에이전트 파이프라인 프로젝트를 진행하며 비슷한 깨달음을 얻었다. 멀티모델 검증과 파일 기반 통신의 중요성을 체감했다.

결국 개발자의 핵심 경쟁력은 더 이상 코드를 얼마나 빨리 치느냐가 아니다. AI 에이전트 팀을 어떻게 설계하고 운영하느냐가 될 것이다. 이는 마치 예전에 개발자가 메모리 관리와 CPU 사이클을 신경 쓰다가 언어와 프레임워크에 맡기고 비즈니스 로직에 집중하게 된 것과 비슷한 패러다임 전환이다.

바이브 코딩은 시작에 불과하다. 진짜 변화는 에이전트 팀 오케스트레이션에서 온다.

바이브 코딩 다음은 AI 에이전트 팀 오케스트레이션이다

https://futurecreator.github.io/2026/02/28/ai-agent-team-orchestration-next-step/

Author

futureCreator

Posted on

2026/02/28

Updated on

2026/02/28

Licensed under

Comments