Post

이걸 왜 이제 알았을까? 바이트댄스가 작정하고 푼 미친 리서치 AI, Deer-Flow 2.0 솔직 리뷰

이걸 왜 이제 알았을까? 바이트댄스가 작정하고 푼 미친 리서치 AI, Deer-Flow 2.0 솔직 리뷰

💡 TL;DR (한 마디로?)

  • 정체: 바이트댄스가 오픈소스로 푼 LangGraph 기반 다중 에이전트(Multi-Agent) 딥 리서치 프레임워크.
  • 특징: 검색 ➡️ 코드 실행 ➡️ 데이터 분석 ➡️ 보고서(심지어 팟캐스트) 생성까지 알아서 다 해줌. 2.0부터는 아예 ‘슈퍼 에이전트’ 샌드박스로 진화함.
  • 결론: 단순 RAG나 챗봇 시대는 끝났음. 이제는 AI가 직접 ‘연구’하고 ‘실행’하는 Agentic Workflow가 대세. 안 써보면 무조건 손해!

안녕하세요! 요즘 하루가 멀다 하고 쏟아지는 AI 트렌드 따라가느라 다들 카페인 수치 한껏 올라가 있으시죠? 저도 마찬가지입니다. ☕️

며칠 전 주말에 늘 그렇듯 깃허브(GitHub) 트렌딩을 멍때리며 넘기고 있었는데, 별이 무려 2만 개가 넘게 박힌 레포지토리 하나가 눈에 확 띄더라고요. 이름하여 Deer-Flow(디어플로우). 바이트댄스(ByteDance)에서 만든 오픈소스 프로젝트인데, 소개 문구를 읽자마자 “와, 이걸 왜 이제 알았을까?” 싶어 바로 로컬에 세팅해 보고 밤을 샜습니다.

OpenAI가 DeepResearch를 내놓으면서 전 세계 개발자들이 경악했던 게 엊그제 같은데, 중국 빅테크와 오픈소스 진영의 반격이 정말 매섭습니다. 오늘은 단순한 공식 문서 번역이 아니라, 현직 개발자 입장에서 이 녀석이 왜 물건인지, 기존 툴들과 뭐가 다른지, 그리고 실제로 써보며 느낀 찐 아쉬운 점까지 가감 없이 털어보려고 해요.


🚀 단순한 챗봇이 아니다: Deer-Flow의 진짜 정체

이름부터 짚고 넘어갈게요. Deer-Flow는 Deep Exploration and Efficient Research Flow의 약자입니다.

기존에 우리가 쓰던 ChatGPT나 Claude는 “이거 찾아줘” 하면 자기가 아는 선에서, 혹은 단순 웹 검색 한두 번 돌리고 답변을 뱉어내잖아요? 하지만 Deer-Flow는 다릅니다. 이 녀석은 질문을 받으면 ‘연구 계획(Plan)’을 세우고, 서브 에이전트들을 부려먹습니다.

가장 흥미로운 건 이 시스템이 LangGraph 기반의 상태 기계(State Machine) 아키텍처로 돌아간다는 거예요.

비교 항목기존 ChatGPT / 단순 RAGDeer-Flow (Agentic Deep Research)
작업 방식단일 프롬프트 ➡️ 단일 답변 생성목표 분해 ➡️ 다중 에이전트 협업 ➡️ 결과 검증
도구 활용제한적인 내장 브라우징웹 크롤러, Python REPL, MCP(통합 도구), 로컬 샌드박스 제어
Human-in-the-loop중간 개입 불가 (답변 끝날 때까지 대기)기획(Planning) 단계에서 인간이 방향 수정 가능
최종 결과물텍스트 답변논문급 노션 마크다운, PPT, 음성 팟캐스트(TTS) 등 멀티모달 아웃풋

표만 봐도 감이 오시죠? 이건 단순한 LLM 래퍼(Wrapper)가 아닙니다. 연구원(Researcher), 프로그래머(Coder), 리포터(Reporter)라는 각기 다른 전문성을 가진 AI 팀을 내 컴퓨터에 고용하는 것과 같아요.

게다가 최근 Deer-Flow 2.0으로 메이저 업데이트가 되면서 단순한 ‘리서치 프레임워크’를 넘어 완전한 슈퍼 에이전트 하네스(SuperAgent Harness)로 진화했더라고요. 샌드박스 환경에서 스스로 코드를 짜고, 런타임을 돌리고, 장기/단기 기억(Memory)까지 유지합니다. 진짜 미쳤어요.


💻 개발자라면 못 참는 쉽고 강력한 세팅 (Hands-on)

“아키텍처가 복잡하면 세팅하다가 시간 다 보내는 거 아니야?” 저도 처음엔 그렇게 생각했습니다. Python 3.12+에 Node.js 22+ 환경을 요구해서 살짝 쫄았는데, 공식 문서에서 제공하는 Docker 세팅이나 uv를 활용한 패키지 관리가 너무 깔끔하게 잘 되어 있어서 감탄했습니다.

1
2
3
4
5
6
7
8
9
10
# 1. 레포지토리 클론
git clone https://github.com/bytedance/deer-flow.git
cd deer-flow

# 2. 초기 설정 파일 생성 (이거 진짜 편함!)
make config

# 3. .env 파일에 OpenAI (또는 DeepSeek 등) API 키와 검색 API 세팅 후
# 도커로 한 방에 띄우기 (강력 추천)
make docker-init && make docker-start

브라우저에서 localhost:2026으로 접속하면 깔끔한 Web UI가 뜹니다.

과연 성능은 어땠을까요? 제가 던진 프롬프트는 이거였습니다. “최근 3년간의 양자 컴퓨팅이 암호화폐 보안에 미치는 영향을 분석하고, Python으로 간단한 시뮬레이션 코드를 작성한 뒤, 일반인도 이해할 수 있는 보고서와 팟캐스트 대본으로 만들어줘.”

결과는 충격적이었습니다.

  1. Coordinator가 제 질문을 받고 Planner에게 넘깁니다.
  2. Planner가 연구 로드맵을 짭니다 (1. 양자 컴퓨팅 동향 검색 2. 암호화폐 취약점 분석 3. 시뮬레이션 코드 작성 등).
  3. Researcher가 Tavily, Arxiv 등을 뒤져 최신 논문과 기사를 긁어옵니다.
  4. Coder가 격리된 샌드박스(Python REPL)에서 암호 해독 시간 비교 시뮬레이션 코드를 짜고 직접 실행해서 결과를 봅니다.
  5. 마지막으로 Reporter가 이 모든 걸 종합해 깔끔한 마크다운 보고서와 TTS 엔진용 오디오 대본을 뽑아냅니다.

무엇보다, 중간에 Planner가 로드맵을 짰을 때 제가 “야, 이 부분은 팟캐스트 대본 비중을 더 늘리고 유머러스하게 가자”라고 자연어로 개입(Feedback)할 수 있다는 점이 진짜 최고였습니다. 워크플로우를 완벽하게 통제하고 있다는 쾌감이 들더라고요.


🤔 솔직한 리뷰: 완벽하지만은 않은 현실적인 한계들

물론 찬양만 할 수는 없죠. 현업에 바로 도입하려고 뜯어보니 공식 문서에서는 잘 안 보이는 뼈아픈 단점들도 분명 있었습니다. 사실 이 부분이 진짜 중요해요.

  1. LLM 지능에 대한 극단적인 의존성 파이프라인이 아무리 훌륭해도, 결국 각 노드(에이전트)를 굴리는 건 기반 LLM입니다. GPT-4o나 Claude 3.5 Sonnet, 혹은 DeepSeek-R1 같은 최고 티어 모델을 쓰지 않으면 Planner가 헛소리를 하거나 Coder가 무한 에러 루프에 빠지는 참사가 발생합니다. 로컬 랩탑에서 작은 오픈소스 모델로 돌려보려다 답답해 죽는 줄 알았습니다.
  2. API 비용의 압박 검색 한 번 하고 끝나는 게 아니라, 에이전트들끼리 수십 번 핑퐁을 치며 컨텍스트를 주고받습니다. 토큰 소비량이 어마어마해요. 넋 놓고 복잡한 주제 리서치 몇 번 돌리다 보면 API 빌링 알람이 울릴 수도 있습니다. 💸
  3. 동적 워크플로우의 불안정성 정해진 순서대로만 도는 정적(Static) 워크플로우가 아니다 보니, 가끔 검색 결과가 부실할 때 에이전트가 “어? 자료가 없네? 다시 검색할까?” 하면서 계속 웹의 바다를 표류하며 시간을 낭비하는 현상(Hallucination loop)이 발생하더라고요. 이럴 땐 Human-in-the-loop 기능으로 멱살 잡고 끌고 와야 합니다.

🎯 한 마디로 정리해볼게요

아쉬운 점들도 있지만, Deer-Flow 2.0은 현재 오픈소스 AI 씬에서 가장 압도적이고 실용적인 프레임워크 중 하나입니다.

단순히 지식을 묻고 답하는 챗봇의 시대는 저물어가고 있습니다. 이제는 목표를 던져주면 도구를 사용해 스스로 탐색하고(Search), 추론하고(Reasoning), 코드를 실행하는(Execution) ‘행동하는 AI(Agentic Deep Research)’의 시대입니다. 바이트댄스가 이런 수준 높은 아키텍처를 MIT 라이선스로 전부 오픈했다는 건, 정말 우리 같은 개발자들에겐 축복이자 큰 자극이네요.

사내 지식 베이스를 활용한 딥 리서치 자동화, 매일 아침 특정 도메인의 최신 논문을 분석해주는 봇, 혹은 자동화된 주식 데이터 분석기 등을 구상 중이시라면 당장 Deer-Flow를 클론해 보세요.

기술의 발전 속도가 무섭게 느껴질 때도 있지만, 이런 미친 장난감을 가지고 놀 수 있는 시대에 개발자로 살고 있다는 게 참 짜릿하기도 합니다. 이번 주말, 커피 한 잔 내려두고 내 컴퓨터 안에 나만의 무적의 연구팀을 꾸려보는 건 어떨까요? 분명 시간 가는 줄 모르실 겁니다! 🔥

References

  • https://github.com/bytedance/deer-flow
  • https://deerflow.tech/
  • https://arxiv.org/abs/2507.05495
This post is licensed under CC BY 4.0 by the author.