BiRefNet: 고해상도 이미지 세분화를 위한 최첨단 AI 모델
BiRefNet: 고해상도 이미지 세분화를 위한 최첨단 AI 모델 📖 논문: https://arxiv.org/abs/2401.03407v6 🖥️ 깃허브: https://github.com/ZhengPeng7/BiRefNet 🤖 데모 실행: https://fal.ai/models/fal-ai/birefnet/v2 🔍 연구 기관: ...
BiRefNet: 고해상도 이미지 세분화를 위한 최첨단 AI 모델 📖 논문: https://arxiv.org/abs/2401.03407v6 🖥️ 깃허브: https://github.com/ZhengPeng7/BiRefNet 🤖 데모 실행: https://fal.ai/models/fal-ai/birefnet/v2 🔍 연구 기관: ...
SWE-Lancer: LLM이 실제 소프트웨어 엔지니어링으로 돈을 벌 수 있을까? 📖 논문: https://arxiv.org/abs/2502.12115v2 🖥️ 깃허브: https://github.com/openai/SWELancer-Benchmark 🤖 프로젝트: https://github.com/openai/SWELancer-Benc...
OmniParser: GUI 자동화를 위한 순수 비전 기반 에이전트 📖 논문: https://arxiv.org/abs/2408.00203v1 🖥️ 깃허브: https://github.com/microsoft/OmniParser 🤖 프로젝트: https://microsoft.github.io/OmniParser/ 🔍 연구 기관: ...
VideoLLaMA 3: 최첨단 멀티모달 비디오 이해 모델 🔍 개요 📄 논문: https://arxiv.org/abs/2501.13106 🛠️ GitHub: https://github.com/DAMO-NLP-SG/VideoLLaMA3 VideoLLaMA 3는 이미지 및 비디오 이해를 위한 최신 멀티모달 기반 모델로, 시간적 특성을 반영한 비...
Grok 3: 차세대 AI 모델의 도약 “우주의 본질을 이해하는 것” – xAI의 미션 Grok 3는 Elon Musk의 xAI가 개발한 최신 대규모 언어 모델(LLM)로, 강력한 추론 능력, 대규모 학습 데이터, 그리고 고급 계산 인프라를 활용하여 AI의 한계를 또 한 번 확장한 모델입니다. Colossus 슈퍼컴퓨터에서 학습된 Grok...
논문: RAFT: Adapting Language Model to Domain Specific RAG 저자: Tianjun Zhang, Shishir G. Patil, Naman Jain, Sheng Shen, Matei Zaharia, Ion Stoica, Joseph E. Gonzalez 소속: UC Berkeley 코드: https:/...
논문: Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models GitHub: https://github.com/lichao-sun/SoraReview WebSite: https://sora.com/ 🔍 Sora란? So...
Website: https://deepmind.google/technologies/veo/veo-2/ 최근 AI 영상 생성 분야에 혁신을 불러온 Veo 2는 DeepMind가 선보인 최첨단 비디오 생성 모델입니다. 🔍 Veo 2란? Veo 2는 DeepMind가 개발한 최첨단 비디오 생성 모델로, 단순한 텍스트 프롬프트만으로도 사실적인 모션과...
Whisk: https://labs.google/fx/tools/whisk Google Labs 블로그: Whisk: Visualize and remix ideas using images and AI 서론 ✨ Google Whisk는 구글 랩스에서 선보인 최신 생성형 AI 실험 도구로, 사용자가 복잡한 텍스트 프롬프트 없이 이미지...
🔍 Data Formulator 2란? Data Formulator 2는 AI를 활용하여 데이터 변환과 시각화 과정을 자동화하고 최적화하는 최신 데이터 분석 도구입니다. 기존 데이터 시각화 툴과 달리 사용자 인터페이스(UI)와 자연어 입력(NL)을 결합하여 보다 직관적인 데이터 분석 환경을 제공합니다. 특히, 반복적인 데이터 변환과 차트 생성이 필요한...