AlphaEvolve:A coding agent for scientific and algorithmic discovery
前言
这是又是一篇来自DeepMind 组的论文,被命名为了 AlphaEvolve,可见这份工作是 DM组继AlphaGo,AlphaFold 之后的一件被认为是具有同等影响的工作(我认为是更为胜之,如果他是能做到他说的这样😋我还没看,看完再谈)。
这里我们就一起来看看Google 他们发布的关于 AlphaEvolve的White Paper。
Abstract
Google 的 DeepMind 提出这个 AlphaEvolve 目的是为了可以持续增强大模型的处理更高难度的任务的能力,比如去处理开放性的科学问题或者是优化关键的计算基础设施。
AlphaEvolve 负责协调 LLM 的自主流水线,其任务是通过直接修改代码来改进算法。 ———— 通过使用一个可进化的方法,并通过持续接受一个或多个评估器的反馈,AlphaEvolve会迭代的提升算法,以及潜移默化的让学习导向一个新科学和实用性的发现。
目前,谷歌声明,他们使用这个 AlphaEvolve 实现了:
- 为 Google 的数据中心开发了一种高效的调度算法;
- 为TPU的的算术逻辑电路设计找到了一种功能等同的简化方法;
- AlphaEvolve 可以优化数学与计算机领域算法,eg:Strassen 算法
- 甚至还加速了支持 AlphaEvolve 本身的LLM 的训练。
Google同样声明,在数学与计算机领域,这个 AlphaEvolve 找到了一些新颖的算法和解决方案,并超过了现有最先进的解决方案与算法。
AlphaEvolve 开发了一种搜索算法,找到了一个使用 48 次标量乘法来相乘两个 4×4 复数矩阵的计算过程;这是在这一问题上,时隔 56 年后首次超越 Strassen 算法的成果。
DM 相信AlphaEvolve 和这种类似的代码代理的方法会产生一个显著的影响对于跨多领域科学以及计算领域的解决方案的提升。
Introduction
发现一个高价值知识的过程:想法的构思–>探索–>不被看好的假设的回溯–>实验–>验证
目前有些研究,想通过 LLM 的强大能力去自动化的实现上面的这些关键步骤。
成功的希望源于近年来大型语言模型(LLMs)所展现出的惊人能力,它们能够通过测试时计算(test-time compute)来增强自身能力,同时也得益于将**语言生成与行动相结合的智能体(代理)**的兴起。
<