AI资讯

Grok 3.5被爆即将发布:多模态AI模型的新突破
AI资讯**Grok 3.5 API即将发布:xAI新模型“grok-3-5-api-2k-p2”曝光,支持灵活输入** **一、Grok 3.5即将上线,API接口现踪迹** 近日,xAI正在为即将发布的Grok 3.5模型做准备。在最新的Web构建中,发现了一个新的模型引用“grok-3-5-api-2k-p2”,以及“grok 3.5 flexible input”的提及。这表明Grok 3.5...

字节跳动开源的统一多模态推理模型BAGEL
AI资讯**BAGEL:字节跳动开源的统一多模态推理模型,挑战GPT-4o与Gemini 2.0** **一、BAGEL简介:统一的多模态理解与生成模型** BAGEL(ByteDance Adaptive Generalized Expert Learner)是字节跳动Seed团队在2025年5月开源发布的多模态大模型。该模型以统一的架构支持文本、图像、视频等多模态数据的理解与生成,具备与GPT-4...

AI 视频生成的未来:Veo 3 引领的技术变革
AI资讯**Google Veo 3 正式发布:AI 视频生成进入音画同步新时代** 在 2025 年的 Google I/O 开发者大会上,Google DeepMind 正式发布了其最新一代 AI 视频生成模型 Veo 3。该模型不仅能够根据文本或图像提示生成高质量的视频,还首次实现了音频与画面的同步生成,包括背景音效、环境音、音乐以及角色对白,标志着 AI 视频生成从“无声电影时代”迈入“音画同步...

从工具到智能体:OpenAI Responses API 的演进路径
AI资讯**OpenAI Responses API 功能大升级:支持图像生成、代码解释器、远程 MCP 等新工具** OpenAI 近日对其开发接口 Responses API 进行了重大功能升级,新增图像生成、代码解释器、远程 MCP 连接和文件搜索增强功能。这些新特性大幅提升了模型能力,使开发者在构建智能体(Agent)与企业级应用时拥有更强的工具链支持。 **一、远程 MCP 支持:连接企业级...

Magentic-UI 与 Puppeteer 对比:智能代理的新选择
AI资讯**微软开源 Magentic-UI:可控网页智能代理系统,重塑人机协作体验** 微软近日正式开源了 Magentic-UI,一个面向网页复杂任务的智能代理系统。不同于传统自动化工具,Magentic-UI 强调用户的“完全可控性”,不仅可以自动执行点击、填表、读文件、写代码等任务,更支持任务计划编辑、人工干预、操作授权等特性,开创了“用户驱动+智能代理”的人机协作新范式。 **一、Magen...
AI资讯
更多- 1 阿里推出最强翻译模型 Qwen3-MT:支持92种语言
- 2 Kiro:The Three Stages of Kiro
- 3 从 Copilot 到 Kiro:AI 编码的新一代工作流革新
- 4 Kimi K2模型性能大比拼:为何成为开源Agentic AI新标杆?
- 5 马斯克Grok 4大模型全球首秀,本周三四大亮点提前剧透!
- 6 Hunyuan3D-PolyGen让3D美术效率飙升10倍
- 7 不会做大项目?用“小而快”法则,1小时也能练AI开发硬功!
- 8 80B大模型不再专属高显存!腾讯Hunyuan-A13B让3GB显卡也能跑
- 9 灵感一秒变成作品?星流AI全能创作工具彻底解放你的创造力
- 10 零样本抗体发现,Chai-2让实验提速100倍!分子设计进入即想即得时代