Grok 3: 차세대 AI 모델의 도약
Grok 3: 차세대 AI 모델의 도약 “우주의 본질을 이해하는 것” – xAI의 미션 Grok 3는 Elon Musk의 xAI가 개발한 최신 대규모 언어 모델(LLM)로, 강력한 추론 능력, 대규모 학습 데이터, 그리고 고급 계산 인프라를 활용하여 AI의 한계를 또 한 번 확장한 모델입니다. Colossus 슈퍼컴퓨터에서 학습된 Grok...
Grok 3: 차세대 AI 모델의 도약 “우주의 본질을 이해하는 것” – xAI의 미션 Grok 3는 Elon Musk의 xAI가 개발한 최신 대규모 언어 모델(LLM)로, 강력한 추론 능력, 대규모 학습 데이터, 그리고 고급 계산 인프라를 활용하여 AI의 한계를 또 한 번 확장한 모델입니다. Colossus 슈퍼컴퓨터에서 학습된 Grok...
논문: RAFT: Adapting Language Model to Domain Specific RAG 저자: Tianjun Zhang, Shishir G. Patil, Naman Jain, Sheng Shen, Matei Zaharia, Ion Stoica, Joseph E. Gonzalez 소속: UC Berkeley 코드: https:/...
논문: Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models GitHub: https://github.com/lichao-sun/SoraReview WebSite: https://sora.com/ 🔍 Sora란? So...
Website: https://deepmind.google/technologies/veo/veo-2/ 최근 AI 영상 생성 분야에 혁신을 불러온 Veo 2는 DeepMind가 선보인 최첨단 비디오 생성 모델입니다. 🔍 Veo 2란? Veo 2는 DeepMind가 개발한 최첨단 비디오 생성 모델로, 단순한 텍스트 프롬프트만으로도 사실적인 모션과...
Whisk: https://labs.google/fx/tools/whisk Google Labs 블로그: Whisk: Visualize and remix ideas using images and AI 서론 ✨ Google Whisk는 구글 랩스에서 선보인 최신 생성형 AI 실험 도구로, 사용자가 복잡한 텍스트 프롬프트 없이 이미지...
🔍 Data Formulator 2란? Data Formulator 2는 AI를 활용하여 데이터 변환과 시각화 과정을 자동화하고 최적화하는 최신 데이터 분석 도구입니다. 기존 데이터 시각화 툴과 달리 사용자 인터페이스(UI)와 자연어 입력(NL)을 결합하여 보다 직관적인 데이터 분석 환경을 제공합니다. 특히, 반복적인 데이터 변환과 차트 생성이 필요한...
논문: InternVideo: General Video Foundation Models via Generative and Discriminative Learning GitHub: InternVideo 공식 저장소 Papers with Code Benchmarks: Kinetics-400 Something-Somet...
논문: End-to-End Semi-Supervised Object Detection with Soft Teacher GitHub 코드: SoftTeacher 공식 저장소 Papers with Code Benchmarks: COCO 1% COCO 5% COCO 10% ...
논문: HunyuanVideo: A Systematic Framework for Large Video Generative Models GitHub: https://github.com/Tencent/HunyuanVideo Demo: HunyuanVideo Playground Hugging Face 모델: HunyuanVideo on Huggi...
논문: LLMs can see and hear without any training Github: https://github.com/facebookresearch/MILS 🔍 MILS란? MILS (Multimodal Iterative LLM Solver)은 추가 학습 없이 대형 언어 모델(LLM)을 활용하여 이미지, 비디오, 오디오 캡션 ...