标签:开源

MiniMax-M1:开源突破,百万 token 长上下文的新标杆
AI资讯**MiniMax-M1:开源突破,百万 token 长上下文的新标杆** 中国 AI 独角兽 MiniMax 推出开源 LLM「MiniMax‑M1」,刷新了长上下文与训练效率的新纪录: * **百万 token 超长上下文**:支持 1 000 000 token 输入、80 000 token 输出,是目前开源模型中最长上下文窗口。 * **混合专家模型 + Lightning Atte...

腾讯混元开源 HunyuanVideo-Avatar:照片秒变会说话的数字人
AI资讯**腾讯混元开源 HunyuanVideo-Avatar:照片秒变会说话的数字人,支持多人对口型** **一、HunyuanVideo-Avatar 模型正式开源** 2025年5月28日,腾讯混元与腾讯音乐联合发布并开源了语音驱动数字人模型 HunyuanVideo-Avatar。该模型支持用户上传一张人物照片和一段音频,自动生成具有自然表情、唇形同步及全身动作的动态视频,实现照片“开口说话...

Google三款新模型发布:AI在医疗、无障碍和动物语言领域的应用前景
AI资讯**Google发布三款基于Gemma模型的变体:MedGemma、SignGemma与DolphinGemma** **一、MedGemma:面向医疗领域的多模态与文本推理模型** Google推出的MedGemma是基于Gemma 3架构的医疗AI模型,分为两个版本: * **MedGemma 4B**:多模态模型,结合了SigLIP图像编码器和语言模型,专为处理医学图像与文本任务设计。...

字节跳动开源的统一多模态推理模型BAGEL
AI资讯**BAGEL:字节跳动开源的统一多模态推理模型,挑战GPT-4o与Gemini 2.0** **一、BAGEL简介:统一的多模态理解与生成模型** BAGEL(ByteDance Adaptive Generalized Expert Learner)是字节跳动Seed团队在2025年5月开源发布的多模态大模型。该模型以统一的架构支持文本、图像、视频等多模态数据的理解与生成,具备与GPT-4...
AI资讯
更多- 1 Kiro:The Three Stages of Kiro
- 2 从 Copilot 到 Kiro:AI 编码的新一代工作流革新
- 3 Kimi K2模型性能大比拼:为何成为开源Agentic AI新标杆?
- 4 马斯克Grok 4大模型全球首秀,本周三四大亮点提前剧透!
- 5 Hunyuan3D-PolyGen让3D美术效率飙升10倍
- 6 不会做大项目?用“小而快”法则,1小时也能练AI开发硬功!
- 7 80B大模型不再专属高显存!腾讯Hunyuan-A13B让3GB显卡也能跑
- 8 灵感一秒变成作品?星流AI全能创作工具彻底解放你的创造力
- 9 零样本抗体发现,Chai-2让实验提速100倍!分子设计进入即想即得时代
- 10 专业医生平均20%,AI却能85%诊断疑难病?MAI-DxO刷屏医疗圈