2025-04-03 02:40来源:本站
虽然怀疑论者可能会说,人工智能革命看起来只是关于聊天机器人和令人惊叹(如果奇怪的话)的数字艺术创作,但实际上幕后还有更多的事情在发生。谷歌刚刚用它的人工智能机器人愉快地展示了这项技术的潜力。作为一个研究项目的一部分,一些长相明显不像人类的机器人正在谷歌(Google)人工智能部门DeepMind的走廊上漫游,忙着学习如何导航,以及如何与它们遇到的谷歌员工互动。如果你相信一些著名的未来学家的话,这个实验让我们有机会一窥那些可能构成一场迫在眉睫的机器人革命的机器,当它们被投入我们的家庭、工厂和办公室工作时,它们的能力将达到数百万甚至数十亿。
在一篇研究论文中,谷歌解释说,它一直在研究“使用长上下文vlm和拓扑图的多模态指令导航”。在技术术语背后,这一切都归结为使用人工智能在谷歌办公室的空间里移动,并通过“长上下文”提示与人类互动。长上下文非常重要——它关系到人工智能模型Gemini 1.5 Pro在一次输入会话中使用自然语言可以接收和处理多少信息。从本质上讲,这是为了给机器人一种环境感,这样它就能记住很多与人互动的细节,以及他们说了什么或要求机器人做什么。想想看,你问了一个非常简单的人工智能(比如亚马逊的Alexa)一个问题,过了一会儿才意识到她“忘记”了这个问题,无法进行类似人类的对话——这就是谷歌实验正在解决的问题之一。
TechCrunch网站指出,在记录该项目的视频中,谷歌展示了一些人工智能机器人如何在工作场所发挥作用的例子。其中一个例子显示,用户要求机器人带他去一个可以画画的地方——过了一会儿,机器人就会把这个请求与它所知道的可以画画的物体及其位置相匹配,然后把谷歌人带到一块白板上。
虽然听起来很简单,但这实际上是一个更高层次的推理,比许多早期的人工智能/机器人系统所能做到的更像人类。Alexa的例子也很好:Alexa很聪明,但只能理解非常具体的命令,如果你使用过她的自然语言系统,当她抱怨她不理解时,你会遇到Alexa非常有限的推理,直到你调整措辞。
谷歌项目的另一部分是教机器人了解它们将要导航的环境。早期的机器人系统可能是通过非常精确地输入办公室或工厂车间的地图来训练的,甚至最初是由人类在空间周围远程操作,以便它们的传感器了解周围环境的布局,而新的谷歌机器人是通过让它们的人工智能“观看”智能手机上的行走视频来训练的。视频显示,人工智能机器人可以识别物体,如家具或电源插座,记住它们在哪里,然后在用户要求机器人时推断出用户的意思,例如,帮助他们给智能手机充电。或者,更聪明的是,当用户要求更多的“这个”时,它们知道该怎么做,指着这个人桌子上的汽水罐,知道它应该去检查办公室冰箱里是否有供应。
虽然视频中的谷歌机器人看起来非常人工(TechCrunch指出,这些机器本身实际上是早期研究项目遗留下来的),而且有一个明确的延迟问题,在机器人接收请求到采取行动之间,需要多达一分钟的“思考时间”,但谷歌的项目仍然是一个令人兴奋的潜在预览。最近有消息称,另一家初创公司skill筹集了3亿美元的资金,用于为各种机器人构建通用的人工智能大脑。它也支持了像比尔·盖茨、杰夫·贝佐斯和埃隆·马斯克这样的机器人技术爱好者的想法,他们确信我们很快就会购买人工智能驱动的人形机器人,并准备好欢迎它们进入我们的家庭和工作场所。
不过,自20世纪中期以来,每年都有这样的承诺。还记得机器人罗比吗?他会对谷歌的细长、思维缓慢的机器人说些精辟的话。