设为首页收藏本站深网首页深坛首页问政

开启辅助访问切换到窄版新手指南

百宝箱

深圳论坛»论坛 › 罗湖论坛 › 天天有话说 › 吸收AI画画全技能视觉版ChatGPT来了

发新帖

查看: 4367|回复: 0

上一主题

下一主题

吸收AI画画全技能视觉版ChatGPT来了

章仔摩托

1448 主题	0 好友	1万积分

御侮校尉[7级]

Rank: 7 Rank: 7 Rank: 7 Rank: 7

跳转到指定楼层

1

发表于 2023-3-14 13:00 |只看该作者 |倒序浏览

马上注册，知更多事，识更多人，玩转大深圳！

您需要登录才可以下载或查看，没有账号？注册

x

记者对ChatGPT说：“请生成一张机器人图片。”话音刚落，图片立刻生成。这就是由MSRA资深研究人员提出的视觉版ChatGPT（Visual ChatGPT），同时，它也看得懂图，有理解能力。

OpenAI 重磅推出的聊天对话模型ChatGPT，短短几个月席卷社会各个领域。ChatGPT会的东西五花八门，现如今，Visual ChatGPT将ChatGPT和一系列可视化基础模型连接起来，以支持在聊天过程中发送和接收图像。

从头训练一个多模态模型，工作量非常大。于是，研究人员想到可以在ChatGPT的基础上，结合一些视觉模型来达到目的。而想要达到这一目的，需要一个中间站，由此他们提出了提示管理器的概念。相关报道称，提示管理器可以明确告诉ChatGPT每个视觉模型的作用，并指定好输入输出格式；转换不同的视觉信息，如将PNG图像、深度图像、掩码矩阵等转换为语言格式，方便ChatGPT理解。它能处理视觉模型的历史生成结果，以及不同模型的调用优先级、规避冲突等，让ChatGPT能够以迭代的方式接收视觉模型的生成内容，直到输出用户满意的结果。

与此同时，研究人员也提到了这项工作目前还存在一些局限性：生成结果的质量，主要取决于视觉模型的性能；使用大量的提示工程，会一定程度上影响生成结果的速度；此外，在输入图片的隐私安全上，还需要做进一步升级保护。

来源：深圳商报

收藏0 【点赞】0 【反对】0

使用道具举报

回复

发新帖

快速回复主题

111返回顶部