Beyond Code Suggestions, Taking the Keyboard: Dissecting Block's Open Source AI Agent 'Goose'

코드 추천을 넘어 직접 키보드를 잡다: Block이 만든 오픈소스 AI 에이전트, 'Goose' 해부하기

코드 추천을 넘어 직접 키보드를 잡다: Block이 만든 오픈소스 AI 에이전트, ‘Goose’ 해부하기 1. The Hook: “AI 조수님, 훈수 그만두고 직접 좀 치시죠?” 요즘 개발자들 모이면 십중팔구 AI 코딩 어시스턴트 이야기입니다. 저 역시 현업에서 Copilot, Cursor, ChatGPT 없이는 이제 코딩하기가 버거울 정도니까요....

Mar 15, 2026 Tech

[2026-03-12] [XSkill] 모델 재학습은 하수나 하는 짓? 파라미터 업데이트 없이 스스로 진화하는 멀티모달 에이전트 해부

layout: post title: “[XSkill] 모델 재학습은 하수나 하는 짓? 파라미터 업데이트 없이 스스로 진화하는 멀티모달 에이전트 해부” date: 2026-03-15 author: Cynical Tech Lead tags: [LLM, Multimodal, Agent, XSkill, Continual Learning] — 딥러닝 모델의 ...

Mar 15, 2026 tech

[2026-03-12] [ShotVerse] 아직도 프롬프트로 카메라 워킹을 기도하시나요? 텍스트를 3D 궤적으로 컴파일하는 'Plan-then-Control' 패러다임

Link: arxiv:2603.11421 Authors: ShotVerse Team Date: March 2026 어제 최신 비디오 생성 모델 테스트를 하다가 키보드를 부술 뻔했습니다. 프롬프트에 분명히 “피사체를 중심으로 360도 오빗(Orbit) 회전한 뒤, 타이트한 클로즈업 샷으로 컷 전환(Cut)”이라고 적었는데, 결과물은 어땠을까요? 카메라...

Mar 14, 2026 tech

[Hermes Agent Deep Dive] For those tired of amnesic AI: The dawn of a truly 'remembering' and 'evolving' agent

[Hermes Agent 심층 리뷰] 매번 리셋되는 AI에 지친 당신을 위해: '기억'하고 '성장'하는 진짜 에이전트의 등장

10년 차 개발자로 살면서 수많은 도구의 명멸을 지켜봤습니다. 최근 몇 년간은 그야말로 AI의 시대였죠. 코딩하다 막히면 챗봇 창을 띄우고, 에러 로그를 복붙하고, 때로는 코드 리뷰도 맡깁니다. 그런데 언제부턴가 깊은 피로감이 몰려오더라고요. 이유는 단순합니다. 우리가 쓰는 AI는 매일 아침 기억상실증에 걸리는 천재 인턴 같기 때문입니다. 어제 하루...

Mar 14, 2026 Tech

Old Prompt Crafters Can Rest Now: The Dawn of the Sub-Agent Era Proven by 'agency-agents'

코드 깎는 노인들은 이제 쉬셔도 좋습니다: 'agency-agents'가 증명한 서브 에이전트 시대의 도래

1. 프롤로그: 혼자 다 하려는 천재 AI의 한계, 그리고 피로감 안녕하세요. 10년 차 개발자이자, 밤마다 깃허브 트렌딩을 뜯어보며 커피를 축내는 테크 칼럼니스트입니다. 요즘 현업에서 AI 코딩 어시스턴트 쓰시다 보면 이런 생각 들지 않으시나요? “GPT-4나 Claude 3.5 Sonnet이 확실히 똑똑해지긴 했는데, 막상 복잡한 프로젝트...

Mar 14, 2026 Tech

[2026-03-12] [AI 논문 해부] 미쳐버린 Reward Model을 구출하라: 이미지 편집/생성 RLHF를 위한 FIRM-8B의 등장

Metadata Block Paper ID: 2603.12247 Paper Title: Trust Your Critic: Robust Reward Modeling and Reinforcement Learning for Faithful Image Editing and Generation Project Page: https://firm-rew...

Mar 14, 2026 tech

[2026-03-12] [비디오 생성] 캐릭터 두 명 넣었다고 얼굴 융합되는 현상, VAE 건너뛰는 잠재 공간(Latent) RL로 해결한 DreamVideo-Omni 해부하기

[Metadata] Paper: DreamVideo-Omni: Omni-Motion Controlled Multi-Subject Video Customization with Latent Identity Reinforcement Learning ID: Arxiv 2603.12257 Category: Video Generation, Diffu...

Mar 13, 2026 tech

[Review] The End of GUI and the Dawn of Agent-Native: A Deep Dive into CLI-Anything Architecture

[리뷰] GUI의 종말과 Agent-Native의 서막: CLI-Anything 아키텍처 딥다이브

안녕하세요. 산전수전 다 겪으며 서버 뒷단에서 아키텍처를 깎고 있는 10년 차 백엔드 개발자입니다. 최근 개발자 커뮤니티나 X(트위터)를 보면 AI 에이전트(AI Agent)라는 단어가 숨 쉴 틈 없이 쏟아집니다. Claude Code, Cursor, OpenClaw 같은 도구들이 터미널과 에디터를 넘나들며 코드를 짜는 걸 보면 경이롭기까지 하죠. ...

Mar 13, 2026 Tech

No More Copy-Paste: A 10-Year Dev's Deep Dive into the Autonomous Agent 'Cline'

복붙 셔틀은 이제 그만: 10년 차 개발자가 뜯어본 자율형 에이전트 'Cline'의 진짜 민낯

최근 코딩하실 때 모니터 화면이 어떻게 분할되어 있나요? 아마 한쪽에는 VS Code나 IntelliJ 같은 IDE가 띄워져 있을 테고, 다른 한쪽에는 브라우저를 열어 ChatGPT나 Claude 창을 서너 개씩 띄워두셨을 겁니다. 에러 로그가 터지면 터미널에서 로그를 드래그해서 복사하고, 브라우저로 넘어가서 프롬프트 창에 붙여넣고, AI가 뱉어낸 코...