코드 깎는 노인들은 이제 쉬셔도 좋습니다: 'agency-agents'가 증명한 서브 에이전트 시대의 도래

Posted Mar 14, 2026

Old Prompt Crafters Can Rest Now: The Dawn of the Sub-Agent Era Proven by 'agency-agents'

15 min read

1. 프롤로그: 혼자 다 하려는 천재 AI의 한계, 그리고 피로감

안녕하세요. 10년 차 개발자이자, 밤마다 깃허브 트렌딩을 뜯어보며 커피를 축내는 테크 칼럼니스트입니다. 요즘 현업에서 AI 코딩 어시스턴트 쓰시다 보면 이런 생각 들지 않으시나요?

“GPT-4나 Claude 3.5 Sonnet이 확실히 똑똑해지긴 했는데, 막상 복잡한 프로젝트를 통째로 던져주면 꼭 어디선가 사고를 친다.”

처음엔 스크립트 하나 짜주는 것만으로도 감동이었죠. 그런데 이제 우리는 AI에게 프론트엔드 컴포넌트도 짜라고 하고, 백엔드 API도 붙이라고 하고, 내친김에 DB 스키마 설계에 QA까지 시킵니다. 결과는 어떨까요? 문맥 오염(Context Bleeding)이 발생합니다. CSS 버그를 고쳐달라고 했더니 뜬금없이 데이터베이스 연결 로직을 건드려놓거나, 보안은 전혀 고려하지 않은 채 돌아가기만 하는 누더기 코드를 뱉어내기 일쑤입니다. 한 명의 천재(단일 LLM 세션)에게 회사의 모든 부서 일을 다 시켰으니 당연한 결과죠.

이런 피로감에 시달리던 중, 최근 깃허브에서 무려 수만 개의 별을 받으며 급상승한 레포지토리 하나를 발견했습니다. 바로 msitarzewski/agency-agents입니다. 그런데 이걸 열어보고 저는 적잖이 당황했습니다. LangChain이나 AutoGen 같은 복잡한 파이썬 코드가 있을 줄 알았는데, 그저 120여 개의 마크다운(.md) 파일만 덩그러니 놓여 있었기 때문입니다. 이게 대체 왜 열광적인 반응을 얻고 있는 걸까요?

2. TL;DR: 핵심은 ‘프롬프트’가 아니라 ‘역할극의 구조화’다

결론부터 말씀드리자면, agency-agents는 파이썬 기반의 전통적인 에이전트 프레임워크가 아닙니다. 이 레포지토리는 Claude Code나 Cursor 같은 최신 AI CLI/IDE 도구와 결합하여, 내 로컬 환경에 120명의 전문가로 구성된 가상의 외주 개발 에이전시를 차리게 해주는 ‘고도로 구조화된 페르소나 모음집’입니다. 여러분은 더 이상 복잡한 프롬프트를 짤 필요 없이, 그저 필요한 전문가(서브 에이전트)를 호출하기만 하면 됩니다.

3. Deep Dive: 아키텍처의 본질을 파헤치다

이 프로젝트가 흥미로운 이유는, 최근 AI 씬의 트렌드가 ‘하드코딩된 에이전트 오케스트레이션’에서 ‘컨텍스트 엔지니어링(Context Engineering) 기반의 서브 에이전트’ 모델로 넘어가고 있음을 완벽하게 보여주기 때문입니다.

기존의 CrewAI나 LangGraph 같은 프레임워크들은 강력하지만 무겁습니다. 에이전트끼리 어떻게 통신할지 파이썬 코드로 일일이 그래프를 그리고 노드를 연결해야 했죠. 반면 agency-agents는 완전히 다른 접근을 취합니다. 바로 오케스트레이터(Orchestrator)의 추론 능력을 극대화하기 위한 ‘초정밀 직무 기술서’를 제공하는 것입니다.

마크다운 파일 하나의 구조를 뜯어보면 단순한 프롬프트 그 이상입니다.

Identity Layer (정체성 부여): “당신은 15년 차 시니어 프론트엔드 장인입니다. 타협 없는 픽셀 퍼펙트 UI를 추구합니다.”처럼 강렬한 자아를 부여합니다. 흥미롭게도 LLM은 이런 구체적이고 까다로운 페르소나를 덮어쓸수록, 자신이 학습한 데이터의 고품질 공간(High-quality latent space)에 머물 확률이 기하급수적으로 높아집니다.
Core Capabilities & Skills (핵심 역량): 막연히 코드를 짜라고 하지 않고, 상태 관리(Zustand), Core Web Vitals 최적화 등 사용할 수 있는 무기를 정확히 제한합니다.
Decision Framework (의사결정 프레임워크): 코드를 작성하기 전 스스로 검증해야 할 체크리스트를 주입합니다. “모바일 우선주의를 지켰는가?”, “불필요한 리렌더링은 없는가?” 같은 질문들이죠.

이 마크다운 파일들이 Claude Code 같은 도구에 물리는 순간, 마법이 일어납니다. 오케스트레이터인 Claude는 사용자의 명령을 분석한 뒤, 자신의 거대한 컨텍스트 윈도우를 쪼개어 독립된 서브 에이전트들을 병렬로 띄웁니다. 프론트엔드 에이전트에게는 UI 관련 컨텍스트만, 보안 검수 에이전트에게는 인증 로직만 격리해서 던져주기 때문에 앞서 말한 문맥 오염(Context Bleeding) 현상이 원천적으로 차단되는 아키텍처적 우위를 점하게 됩니다.

4. Hands-on: 당장 내 프로젝트에 어떻게 적용할까?

이론은 충분하니, 월요일 아침 실무에 당장 써먹는 시나리오를 그려봅시다. 준비물은 간단합니다. Claude Code(또는 지원되는 AI IDE)와 터미널뿐입니다.

터미널을 열고 여러분의 작업 디렉토리 하위에 에이전트들을 클론합니다. git clone https://github.com/msitarzewski/agency-agents.git ~/.claude/agents/
이제 프로젝트 폴더에서 Claude Code를 실행하고, 디렉터(Director)처럼 명령을 내립니다.
“신규 회원가입 랜딩 페이지를 만들 거야. ‘Frontend Wizard’ 에이전트를 불러서 메인 React 컴포넌트를 작성하게 하고, 완료되면 ‘SEO Specialist’ 에이전트를 통해 시맨틱 태그와 구조화된 데이터 포맷을 적용해줘. 마지막으로 ‘QA Engineer’를 병렬로 띄워서 접근성(a11y) 테스트 결과를 리포팅해.”

터미널 창을 가만히 보고 있으면 경이로운 장면이 펼쳐집니다. Claude가 스스로 판단하여 세 명의 가상 전문가(서브 에이전트)에게 작업을 라우팅하고, 그들이 서로 결과물을 주고받으며 코드를 수정합니다. 프론트엔드 에이전트가 놓친 aria-label 속성을 QA 에이전트가 지적하고, 다시 프론트엔드가 이를 수정해 커밋하는 과정을 커피 한 잔 마시며 지켜보기만 하면 됩니다. 바야흐로 내 밑에 실력 있는 팀원 3명을 갈아 넣는 묘한 쾌감이 터미널에서 느껴지는 순간이죠.

5. Honest Review: 화려함 뒤에 숨겨진 진짜 한계점 (Trade-offs)

하지만 산전수전 다 겪은 시니어답게, 칭찬만 하고 넘어갈 수는 없습니다. 이 시스템을 로컬 환경에 도입해 며칠간 굴려보며 느낀 뼈아픈 한계점들을 짚어드리겠습니다.

첫째, 극악의 토큰 폭식증 (Token Gluttony)입니다. 이 마크다운 파일들은 용량이 꽤 큽니다. 에이전트가 호출될 때마다 이 거대한 직무 기술서가 매번 시스템 프롬프트로 주입됩니다. 병렬로 에이전트 3개를 띄우고 티키타카를 몇 번 거치다 보면? 여러분의 Anthropic API 크레딧 잔고가 아이스크림 녹듯 사라지는 기적을 보게 될 겁니다. 비용 최적화에 대한 고민 없이 프로덕션에 도입했다가는 재무팀의 호출을 받기 십상입니다.
둘째, 그들은 매일 아침 기억을 잃습니다 (Stateless Amnesia). 이 에이전트들은 영구적인 기억(Persistent Memory)을 지원하는 자체 Vector DB가 없습니다. 세션이 종료되면 그 똑똑하던 시니어 개발자들은 모든 문맥을 잃어버립니다. 우리 팀만의 독특한 코딩 컨벤션이나 도메인 지식을 어제 알려줬어도, 오늘 또 새로운 세션에서 주입해 주어야 합니다. 흡사 매일 아침 영화 ‘첫 키스만 50번째’를 찍는 기분이랄까요.
셋째, 오케스트레이터의 지능에 극도로 종속됩니다. 이 레포지토리 자체는 결국 ‘잘 쓰인 텍스트 파일 묶음’일 뿐입니다. 라우팅을 담당하는 Claude Code나 내부 모델의 지능이 떨어지면, 디자인 수정을 백엔드 에이전트에게 맡겨버리는 식의 할루시네이션 라우팅이 발생합니다. 아직은 “알아서 해”라고 방치하기엔 매니저(오케스트레이터)의 역량이 완벽하지 않아, 개발자의 지속적인 마이크로 매니징이 필수적입니다.

6. Closing Thoughts: 코더(Coder)에서 디렉터(Director)로

agency-agents는 단순히 유행하는 깃허브 레포지토리 하나가 아닙니다. 이는 개발자라는 직업의 본질이 변하고 있다는 강력한 시그널입니다. 복잡한 파이썬 프레임워크를 구축하지 않아도, 그저 ‘역할을 완벽하게 정의하고 맥락을 분리하는 것’만으로 얼마나 강력한 AI 협업이 가능한지 증명해 냈으니까요.

이제 우리의 경쟁력은 ‘for문을 얼마나 아름답게 짜느냐’에 있지 않습니다. ‘어떤 전문가(에이전트)에게 어떤 맥락(Context)을 쥐여주고, 이들을 어떻게 충돌 없이 협업시킬 것인가’를 설계하는 오케스트레이션 능력으로 무게 중심이 이동하고 있습니다.

오늘 저녁, 수많은 프롬프트를 일일이 깎던 노고는 잠시 내려놓고 여러분의 로컬 터미널에 120명의 특급 전문가들을 출근시켜 보는 건 어떨까요? 물론, 야근 수당이나 커피는 여러분만 챙기셔도 무방합니다. 앞으로 다가올 서브 에이전트 시대에, 여러분만의 완벽한 에이전시를 구축하시길 응원합니다.

References

https://github.com/msitarzewski/agency-agents
https://docs.anthropic.com/en/docs/claude-code

Tech

This post is licensed under CC BY 4.0 by the author.