Perceptron盘点过去几周人工智能领域的最新发现
据TechCrunch报道,机器学习和人工智能领域的研究,现在几乎是每个行业和公司的关键技术,其数量太多,任何人都无法全部阅读。Perceptron专栏旨在收集一些最相关的最新发现和论文--特别是在人工智能领域,但不限于此--并解释它们为什么重要。
在过去的几周里,科学家们开发了一种算法,以发现月球上光线暗淡--在某些情况下漆黑一片--的小陨石坑的迷人细节。在其他地方,麻省理工学院的研究人员在教科书上训练了一个人工智能模型,看看它是否能独立地找出一种特定语言的规则。DeepMind和微软的团队研究了运动捕捉数据是否可以用来教机器人如何执行特定的任务,如行走。
随着阿尔忒弥斯1号(Artemis 1)任务即将发射,月球科学再次成为人们关注的焦点。然而,具有讽刺意味的是,月球上最黑暗的区域才可能是最有趣的,因为它们可能藏有水冰,可以用于无数的用途。要发现黑暗是很容易的,但是里面有什么呢?一个由图像专家组成的国际小组将ML应用于这个问题,并取得了一些成功。
虽然陨石坑位于最深的黑暗中,但月球勘测轨道器仍然从里面捕捉到了偶尔的光子,该团队用《地球物理研究快报》中描述的 “基于物理学的、深度学习驱动的后处理工具”将这些曝光不足(但不是完全黑色的)的年数放在一起。其结果是,“现在可以设计出进入永久阴影区域的可见路线,大大降低了阿尔忒弥斯1号宇航员和机器人探险家的风险,”月球和行星研究所的David Kring说。
无论多么有用,把稀疏的数据变成图像并不神秘。但是在语言学的世界里,人工智能正在对语言模型如何以及是否真的知道它们所知道的东西进行迷人的探索。在学习一种语言的语法方面,麻省理工学院的一项实验发现,一个在多本教科书上训练的模型能够建立自己的模型,了解一种特定的语言是如何工作的,以至于它对波兰语的语法,比如说,能够成功地回答关于它的教科书问题。
“语言学家们认为,为了真正理解人类语言的规则,为了理解是什么让系统运转,你必须是人类。”麻省理工学院的 Adam Albright在一份新闻稿中说:“我们想看看我们是否可以模仿人类(语言学家)带给我们的各种知识和推理。这方面的研究非常早期,但很有希望,因为它表明微妙或隐藏的规则可以在没有明确指令的情况下被人工智能模型‘理解’。”
但该实验并没有直接解决人工智能研究中的一个关键的、开放的问题:如何防止语言模型输出“有毒的”、歧视性的或误导性的语言。DeepMind的新工作确实解决了这一问题,采取了一种哲学方法来解决使语言模型与人类价值观相一致的问题。
该实验室的研究人员认为,没有“一刀切”的途径来获得更好的语言模型,因为这些模型需要根据其部署的环境体现出不同的特征。例如,一个旨在协助科学研究的模型最好只做真实的陈述,而一个在公共辩论中扮演主持人角色的代理人将行使宽容、文明和尊重等价值观。
那么,如何将这些价值观灌输给一个语言模型呢?DeepMind的合著者们并没有提出一个具体的方法。相反,他们暗示模型可以通过他们称之为语境构建和阐释的过程,随着时间的推移培养出更加"稳健"和"尊重"的对话。正如合著者们所解释的:“即使一个人没有意识到支配特定对话实践的价值观,代理人仍然可以通过在对话中预示这些价值观来帮助人类理解这些价值观,使沟通的过程对人类说话者来说更加深入和富有成效。”
筛选出最有希望的方法来调整语言模型需要大量的时间和资源--财政和其他方面。但是在语言以外的领域,特别是科学领域,这种情况可能不会持续太久,这要归功于美国国家科学基金会(NSF)授予芝加哥大学、阿贡国家实验室和麻省理工学院的一个科学家团队的350万美元拨款。
在国家科学基金会的资助下,获奖者计划建立他们所说的"模型园",或人工智能模型库,以解决物理、数学和化学等领域的问题。储存库将把这些模型与数据和计算资源以及自动测试和屏幕联系起来,以验证其准确性,最好是让科学研究人员更简单地在自己的研究中测试和部署这些工具。
参与该项目的Globus实验室数据科学研究员Ben Blaiszik在一份新闻稿中说:“用户可以来到‘模型园’,一目了然地看到所有这些信息。他们可以引用该模型,他们可以了解该模型,他们可以联系作者,他们可以在领导的计算设施或自己的计算机上的网络环境中自己调用该模型。”
与此同时,在机器人领域,研究人员不是用软件,而是用硬件--确切地说,是用神经形态硬件--为人工智能模型构建一个平台。英特尔声称,其最新一代的实验性Loihi芯片可以使一个物体识别模型"学会"识别一个它以前从未见过的物体,所使用的功率只有该模型在CPU上运行时的功率的1/175。
神经形态系统试图模仿神经系统中的生物结构。传统的机器学习系统要么速度快,要么功率大,而神经形态系统通过使用节点处理信息和节点之间的连接,利用模拟电路传输电信号,实现了速度和效率。这些系统可以调节节点之间的电力流量,允许每个节点进行处理--但只在需要的时候。
英特尔和其他公司认为,神经形态计算在物流方面有应用,例如,为帮助制造过程而制造的机器人供电。在这一点上,它是理论上的--神经形态计算有其缺点--但也许有一天,这种设想会实现。
更接近现实的是DeepMind最近在"具身智能"方面的工作,即利用人类和动物的动作来教机器人运球、搬箱子,甚至踢足球。该实验室的研究人员设计了一个设置,从人类和动物佩戴的运动追踪器中记录数据,人工智能系统从中学习推断如何完成新的动作,如如何以圆周运动方式行走。研究人员声称,这种方法很好地转化为现实世界的机器人,例如,允许一个四条腿的机器人像狗一样行走,同时运球。
巧合的是,微软今年夏天早些时候发布了一个动作捕捉数据库,旨在刺激对能够像人类一样行走的机器人的研究。该库被称为MoCapAct,包含动作捕捉片段,当与其他数据一起使用时,可用于创建敏捷的双足机器人--至少在模拟中。
这项工作的合著者在一篇博文中写道:“(创建这个数据集)在许多配备GPU的(服务器)上花费了相当于50年的时间......这证明了MoCapAct为其他研究人员消除了计算上的障碍。我们希望社区能够以我们的数据集为基础,努力在仿人机器人的控制方面进行令人难以置信的研究。”
科学论文的同行评审是宝贵的人类工作,人工智能不太可能接管那里,但它实际上可能有助于确保同行评审真正有帮助。一个瑞士研究小组一直在研究基于模型的同行评议评价,他们的早期结果是好坏参半--以一种好的方式。没有一些明显的好或坏的方法或趋势,出版物影响评级似乎不能预测评论是否彻底或有用。
最后,对于任何关心这个领域的创造力的人来说,这里有一个Karen X. Cheng的个人项目,它显示了一点聪明才智和努力工作是如何与人工智能相结合,产生真正的原创性的东西。