🌐 Microsoft的开放式智能代理网络愿景
2025年05月20日 | AI日报
欢迎各位人工智能爱好者
微软刚刚在Build 2025大会上开启了备受期待的AI周活动,通过发布大量新工具和平台,分享了其"开放式智能代理网络"的愿景。
随着Google、Anthropic和(很可能)OpenAI也将在未来几天带来重磅消息,AI行业的下一次重大加速可能已正式拉开序幕。
在今天的人工智能概述中:
- 微软的开放式智能代理网络愿景
- 微软加速科研研发的新AI工具
- 即时将照片转换为会说话的视频
- AI耳机实现3D人群翻译
阅读时间: 5分钟
最新动态
🌐 微软的开放式智能代理网络愿景
概要: 微软在Build 2025大会上介绍了其"开放式智能代理网络"愿景,发布了大量AI驱动的新工具和升级,包括改进的GitHub Copilot、Copilot Studio、Azure Foundry、AI浏览器代理等。
详细信息:
- GitHub Copilot从编辑器助手升级为异步工作的代理,微软还开源了VS Code中的Copilot Chat。
-
- 微软发布了Magentic-UI,这是一个面向人机协作网络代理的开源研究原型,专注于用户协作和控制。
-
- 公司还将xAI的Grok 3和Grok 3 mini模型加入Azure AI Foundry,使开发者可选择超过1,900种模型。
-
- 名为NLWeb的新开源项目旨在成为智能代理网络的HTML,使网站轻松添加对话式UI。
-
- Copilot扩展了新调优功能,允许组织在公司数据上训练模型,同时支持多代理协作处理业务任务。
重要性: 微软在Build大会上开启了AI领域的重要一周,虽然"AI代理之年"尚未如许多人预期的那样实用,但发展方向是正确的——正如科技巨头大量发布的开源产品所证明的,行业正在向开源转变。
- Copilot扩展了新调优功能,允许组织在公司数据上训练模型,同时支持多代理协作处理业务任务。
🔬 微软加速科研研发的新AI工具
概要: 微软还在Build大会上推出了Discovery,这是一个新的企业平台,通过让科学家与专门处理数据和运行实验的AI代理合作,加速科学研究,将发现时间从数年缩短到数小时。
详细信息:
- Discovery使用AI"博士后"代理和基于图的知识引擎帮助研究人员形成假设、模拟实验和分析结果。
-
- 微软展示了其强大功能,在大约200小时内发现了一种新型非PFAS数据中心冷却剂原型,这一任务通常需要数月或数年。
-
- Discovery旨在普及超级计算,让科学家使用自然语言而无需深厚的编码技能。
-
- GSK、雅诗兰黛、NVIDIA和Synopsys等大公司已排队将Discovery整合到从制药到芯片设计的研发中。
重要性: Discovery可以通过消除科学家与先进工具之间的技术障碍,压缩各行业的研发时间线。虽然之前的AI科学计划往往未能兑现承诺,但微软将AI代理与超级计算能力相结合的方法可能有助于弥合炒作与现实之间的差距。
- GSK、雅诗兰黛、NVIDIA和Synopsys等大公司已排队将Discovery整合到从制药到芯片设计的研发中。
🎧 AI耳机实现3D人群翻译
概要: 华盛顿大学的研究人员刚刚开发了一种AI驱动的耳机系统,可以同时翻译多个说话者,同时保留空间位置和独特的语音特征。
详细信息:
- "空间语音翻译"系统使用配备额外麦克风的现成降噪耳机来捕捉周围对话。
-
- AI算法然后分离个体说话者,实时翻译语音并播放——保留语音质量和空间位置。
-
- 该设备像雷达一样360度扫描以检测和跟踪多个说话者,即使主体或佩戴者移动。
-
- 该技术目前适用于西班牙语、德语和法语,延迟2-4秒,可在使用Apple M2芯片的设备上本地运行。
重要性: 翻译应用在AI时代已经变得更好,但仍然经常在嘈杂和繁忙的现实场景中挣扎。这种空间方法是实用的游戏规则改变者——如果将其集成到AirPods等日常设备中,将彻底改变我们跨越语言障碍的互动方式。
- 该技术目前适用于西班牙语、德语和法语,延迟2-4秒,可在使用Apple M2芯片的设备上本地运行。
快速浏览
- 📝 Notion AI Enterprise Search - 提供跨3倍连接应用、PDF和数据库的搜索能力*
-
- ⚙️ Codex - OpenAI的代理,可同时处理多个编码任务
-
- 📊 Grok - xAI的高级AI模型,现在能够生成可视化图表
-
- 🤖 Agent Neo - Flowith的新型自主、百万上下文创作代理
-
- Elon Musk在Build大会上分享了更多关于Grok 3.5的信息,称它将从第一原理推理,并在所有推理线上应用物理学,以最小误差保持真实。
-
- 苹果前AI主管John Giannandrea据报游说公司与Google的Gemini而非ChatGPT合作,原因是担心可信度。
-
- OpenAI首席产品官Kevin Weil表示,AI代理从初级开发人员到高级架构师的进步最终将导致人类监督AI工程经理。
-
- Nvidia在Computex 2025上推出了NVLink Fusion,这一新计划开放其生态系统,允许竞争对手的CPU和GPU与Nvidia硬件连接。
-
- Google发布了其热门信息工具NoteBookLM的Android应用,允许用户通过移动设备生成AI播客、学习指南、简报文档等。