5620亿参数！谷歌发布史上最大“通才”AI模型，可让机器人更自主

2023-03-16 18:46:46 人工智能 ℃

后台-插件-广告管理-内容页头部广告（手机）

北京时间3月7日，谷歌和柏林工业大学的团队重磅推出了史上最大的视觉语言模型——PaLM-E，参数量高达5620亿（GPT-3的参数量为1750亿）。

作为一种多模态具身视觉语言模型（VLM），PaLM-E不仅可以理解图像，还能理解、生成语言，可以执行各种复杂的机器人指令而无需重新训练。

根据谷歌的说法，当给出一个高级命令时，比如“把抽屉里的薯片拿给我”，PaLM-E可以为一个有手臂的移动机器人平台（由谷歌机器人开发）生成一个行动计划并执行自己的行动。

谷歌研究人员计划探索PaLM-E在现实世界场景中的更多应用，例如家庭自动化或工业机器人。他们希望PaLM-E能够激发更多关于多模态推理和具身AI的研究。（澎湃新闻记者邵文）

后台-插件-广告管理-内容页尾部广告（手机）

标签：

上一篇：免费学习人工智能全球最火的10大网站

下一篇：阿里语言AI技术排名全球第二创中国企业历史最佳成绩

评论留言

我要留言