6个回答

大模型火爆发展的过程中,蕴藏着哪些值得关注的创业机会?

孙建新
1个点赞 👍

3月月份,Google Deepmind 发表论文,推出了拥有 5620 亿参数的多模态具象化视觉语言模型 (VLM):PaLM-E。PaLM-E 是具备视觉能力、且不需要特殊训练就能引导机器人的 AI 模型,是有史以来规模最大的VLM,无需重新训练即可执行各种任务。谷歌的研究论文解释了 PaLM-E 是如何将指令转化为动作的:给出指令“我把饮料给弄洒了,你能给我拿点东西来清理一下吗?”后,机器人需要规划一个包含有“1. 找到海绵;2. 捡起海绵;3. 拿海绵给用户;4. 放下海绵”的动作序列。PaLM-E 也已经展示出了涌现能力,比如多模式思维链推理与多图像推理。

目前,大模型已被证明可以执行复杂任务,而大模型与机器人的结合,也将让人类距离 AGI 更进一步。在此基础之上,我们可以开发结合大模型的通用机器人助手,也可以开发如同手机做操作系统一的机器人的操作系统平台,并且可以可以在这个平台上做逐渐形成一个产业生态。在未来,这其中的想象空间非常大。

孙建新
自由评论 (0)
分享
Copyright © 2022 GreatFire.org