人工智能大战 电脑都学会高级数学了 绝望的滋味 没路可走

人工智能
后台-插件-广告管理-内容页头部广告(手机)

这篇文章是我们对 AI 研究论文是评论的一部分,这是一系列探索人工智能最新发现的文章。

DeepMind 研究人员最近发表的一篇论文显示,深度学习可以帮助发现逃避人类科学家的数学关系。与Alphabet旗下人工智能实验室的许多内容一样,这篇题为“通过人工智能引导人类直觉来推进数学”的论文受到了科技媒体的广泛关注。

一些数学家和计算机科学家称赞 DeepMind 的努力和论文中的发现是突破性的。其他人则持怀疑态度,并认为论文及其在大众媒体的报道中可能夸大了在数学中使用深度学习的情况。

尽管如此,结果仍然令人着迷,并且可以扩展科学家发现和证明数学定理的工具箱。

通过机器学习进行数学发现的框架

在他们的论文中,DeepMind 科学家们建议人工智能可用于“在数学研究的前沿帮助发现定理和猜想”。他们提出了一个“通过机器学习中强大的模式识别和解释方法来增强标准数学家工具包的框架”。

 

在数学发现中使用机器学习的框架。深度思维

数学家首先对两个数学对象之间的关系做出假设。为了验证这一假设,他们使用计算机程序为这两种类型的对象生成数据。接下来,受监督的机器学习模型算法会处理数字并尝试调整将一种类型的对象映射到另一种类型的参数。

研究人员写道:“机器学习在这个回归过程中的关键贡献是在给定足够数量的数据的情况下可以学习的广泛的可能的非线性函数。”

如果经过训练的模型比随机猜测的表现更好,则可能表明这两个数学对象之间确实存在可发现的关系。使用各种机器学习技术,研究人员可以找到与问题更相关的数据点,修改他们的假设,生成新数据并训练新模型。通过重复这些步骤,他们可以缩小合理猜想的范围,并加快最终解决方案的步伐。

DeepMind 的科学家将该框架描述为“直觉的试验台”,可以快速验证“关于两个量之间关系的直觉是否值得追求”,并提供有关它们如何相关的指导。

使用这个框架,DeepMind 研究人员使用深度学习实现了“两个基本的新发现,一个是拓扑学,另一个是表示理论。”

这项工作的一个有趣方面是它不需要已经成为 DeepMind 研究所的大量计算能力。根据该论文,这两个发现中使用的深度学习模型可以“在具有单个图形处理单元的机器上几个小时内”进行训练。

结和表示

 

结是维度空间中的闭环,可以通过多种方式定义。随着交叉点数量的增加,它们变得更加复杂。研究人员想看看他们是否可以使用机器学习来发现代数不变量和双曲不变量之间的映射,这两种定义节点的方式根本不同。

研究人员写道:“我们的假设是,结的双曲不变量和代数不变量之间存在一种未被发现的关系。”

使用 SnapPy 软件包,研究人员生成了“签名”、一个代数不变量和 12 个有希望的双曲不变量,用于 170 万节,最多 16 个交叉点。

接下来,他们创建了一个具有三个隐藏层的全连接前馈神经网络,每个隐藏层有 300 个单元。他们训练深度学习模型将双曲不变量的值映射到签名。他们的初始模型能够以 78% 的准确率预测签名。进一步的分析将他们带到了预测签名的双曲不变量中的一组较小的参数。研究人员完善了他们的猜想,生成了新数据,重新训练了他们的模型,并得出了最终定理。

研究人员将该定理描述为“连接结的代数和几何不变量的首批结果之一,并具有各种有趣的应用。”

“我们预计这种新发现的自然坡度和特征之间的关系将在低维拓扑中具有许多其他应用。令人惊讶的是,在一个已被广泛研究的领域中,这种简单而深刻的联系却被忽视了,”研究人员写道。

 

论文中的第二个结果也是对称性的两个不同视图的映射,这个问题比结复杂得多。

在这种情况下,他们使用一种神经网络 (GNN)来查找 Bruhat 区间图和 Kazhdan-Lusztig (KL) 多项式之间的关系。GNN 的好处之一是它们可以计算和学习非常大且难以独立管理的图书。深度学习模型以区间图为输入,尝试预测对应的 KL 多项式。

同样,通过生成数据、训练深度学习模型和重新调整过程,科学家们能够制定一个可证明的猜想。

对 DeepMind 数学 AI 的反应

谈到 DeepMind 在结理论中的发现,内布拉斯加大学林肯分校的结理论家 Mark Brittenham 告诉《自然》杂志,“作者已经证明这些不变量是相关的,而且以一种非常直接的方式,向我们表明存在我们在该领域还没有完全理解的一些非常基本的东西。” Brittenham 补充说,与将机器学习应用于结的其他努力相比,DeepMind 的技术在发现令人惊讶的联系方面具有新颖性。

以色列特拉维夫大学的数学家 Adam Zsolt Wagner 也接受了 Nature 采访,他说 DeepMind 提出的方法可以证明对某些类型的问题很有价值。

拥有将机器学习应用于数学的经验的瓦格纳说:“如果没有这个工具,数学家可能会浪费数周或数月的时间试图证明一个最终会被证明是错误的公式或定理。” 但他也补充说,目前尚不清楚其影响将有多大。

持怀疑态度的理由

 

继 DeepMind 在 Nature 上的工作发表后,纽约大学计算机科学教授 Ernest Davis发表了自己的论文,其中提出了一些关于 DeepMind 对结果的框架以及将深度学习应用于一般数学的局限性的一些重要问题。

在 DeepMind 论文中提出的第一个结果中,戴维斯观察到的结论并不是深度学习通常优于其他机器学习或统计方法的那种问题。

“DL 的优势在于在视觉或文本等情况下,每个实例(图像或文本)都有大量低级输入特征,很难可靠地识别高级特征,以及将输入特征与答案相关联的功能就任何人而言,这是非常复杂的,输入特征的任何一个小子集都是决定性的,”戴维斯写道。

结果只有十二个输入特征,其中只有三个被证明是相关的。并且输入特征和目标变量之间的数学关系很简单。

“很难理解为什么具有 200,000 大多数的神经网络会成为首选方法;简单的、传统的统计方法或支持向量机会更合适,”戴维斯写道。

戴维斯指出,在第二个项目中,深度学习的作用更为重要。“与使用通用 DL 架构的理论项目不同,神经网络经过精心设计,以适应有关该问题的深入数学知识。此外,深度学习的效果要好得多,预处理数据的错误率大约是原始数据的 1/40,”他写道。

Davis 指出,一方面,反对有关难以将领域知识融入深度学习的批评。“另一方面,深度学习的爱好者经常称赞深度学习是一种‘即插即用’的学习方法,无论遇到什么问题,都可以使用原始数据;这违背了这种赞美,”他写道。

戴维斯还指出,将深度学习应用于这些任务的成功可能在很大程度上取决于训练数据的生成方式和数学结构的编码方式。这表明该框架可能适用于一小类数学问题。

“找到生成和编码数据的最佳方法涉及理论、经验、艺术和实验的混合。所有这一切的重担都落在了人类专家身上,”他写道。“深度学习可以是一种强大的工具,但它并不是一个强大的工具。”

戴维斯警告说,在当前围绕深度学习大肆炒作的气氛中,“有一种不正当的动机将 DL 的作用集中在这项研究中,不仅对 DeepMind 的 ML 专家如此,对数学家也是如此。”

戴维斯总结道,正如论文中所使用的,深度学习最好被视为“实验数学工具箱中的另一种分析工具,而不是一种全新的数学方法。”

值得注意的是,原始论文的作者还指出了他们框架的一些局限性,包括“它需要能够生成对象表示的大型数据集,并且需要能够在示例中检测到模式可计算的。此外,在某些领域,在这种范式中可能难以学习感兴趣的功能。”

深度学习和直觉

 

争议的话题之一是该论文声称深度学习是“指导直觉”。戴维斯将这种说法描述为“对数学家从这种深度学习系统的使用中获得或希望获得的帮助的严重不准确的描述。”

直觉是人类和人工智能之间的主要区别之一。这是做出比随机猜测更好的决定的能力,并且可以在大多数情况下引导您朝着正确的方向前进。迄今为止,人工智能的历史表明,在大量数据中发现的无数预定义规则或模式中并没有捕捉到直觉。

“在数学环境中,‘直觉’这个词意味着一个概念或证明可以基于一个人对熟悉领域的根深蒂固的感觉,例如数量、空间、时间或运动,或者以其他方式‘有意义’ '或'似乎正确'的方式不涉及明确的计算或逐步推理,”戴维斯写道。

戴维斯认为,虽然获得对数学概念的直观理解通常需要通过多个具体的例子,但这不是统计相关性的工作。换句话说,您无法通过运行数百万个示例并观察某些模式重复出现的百分比来获得直觉。

这意味着并不是深度学习模型让科学家们对他们定义的概念、他们证明的定理以及他们提出的猜想有直观的理解。

戴维斯写道,“深度学习所做的就是给他们一些建议,让他们知道问题的哪些特征看起来很重要,哪些看起来不重要。这不应该被小看,但也不应该被夸大。”

后台-插件-广告管理-内容页尾部广告(手机)
标签:

评论留言

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。