一个令人惊艳的ChatGPT项目，开源了-花粉乐享

> 乐学堂 > > 一个令人惊艳的ChatGPT项目，开源了

一个令人惊艳的ChatGPT项目，开源了

来源：CodeSheep

2023-04-15 13:07:12

296

管理

最近在GitHub上发现了一个爆火的开源项目。

好家伙，凑近一看，居然还是由微软开源，并且和最近炙手可热的ChatGPT息息相关。

项目的名字叫做：Visual ChatGPT。

https://github.com/microsoft/visual-chatgpt

ChatGPT具备强大的会话能力，可以理解文字、聊天、写小说、解答问题、编写代码... 但是目前还并不能直接处理或生成图像。

而Visual ChatGPT这个项目则可以把ChatGPT和一系列视觉基础模型（VFM，Visual Foundation Model）给联系起来，以便实现在ChatGPT聊天的过程中来发送和接收图像，也使得ChatGPT能够处理更为复杂的视觉任务。

讲白了，就是通过Visual ChatGPT，可以把一系列视觉基础模型给接入ChatGPT，使得ChatGPT能胜任更为复杂的视觉处理任务。

Visual ChatGPT的整体技术架构图如上所示，我们可以清楚地看到ChatGPT和视觉基础模型（VFM，Visual Foundation Model）分别位于其中的位置。

一方面，ChatGPT(或LLM)作为一个通用接口，继续发挥它本身的优势，提供对不同话题的智能理解。另一方面，基础视觉模型VFM则通过提供特定领域的深入知识来充当领域专家，它们通过交互管理模块（Prompt Manger）进行连接和适配。

这样聊可能比较抽象，我们可以拿官方给的一个例子来进行说明：

1、首先是用户：输入一张黄色的向日葵图片，并且要求ChatGPT根据该图像预测深度来生成一朵红花，然后再一步一步将其做成卡通画。

2、接着是交互管理模块（Prompt Manger）发挥作用，在它的协调和控制下，VFM模块开始发挥作用：

首先需要运用深度估计模型来预测并生成图像的深度信息；然后需要运用深度图像模型来生成对应空间深度的红花图像；最后运用Stable Diffusion的风格迁移模型来完成图像风格的变换。

3、最后Visual ChatGPT系统再将最终结果返回给用户，完成本次对话。

说到这里，有兴趣的小伙伴可以可以看看微软给出的一篇有关Visual ChatGPT的论文。

里面关于这部分的流程解释得非常详细，而且还给出了多轮对话的案例、以及实验结果，有兴趣的小伙伴可以看看。

好了，今天的分享就到这里了，感谢大家的收看，我们下篇见。

花粉社群VIP加油站

1

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与花粉乐分享无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非花粉乐分享）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@hflfx.com

面对ChatGPT，各国和地区如何应对

2023-04-15 13:08

多国要调查ChatGPT ，TA碰了什么红线？

2023-04-15 13:02

相关推荐

不一样的聊天体验——用chatgpt让你的聊天更有趣

用自己的手机也能查看别人的聊天记录，操作简单，一学就会

“你聊天，我聊天，明年补考教室见……”

和ChatGPT一起了解骨科手术机器人

人工智能聊天机器人：ChatGPT和Bard，谁更厉害？

关于作者

吵架没输过..(采蜜高手)

文章

518

主题

5

关注

0

粉丝

0

点击领取今天的签到奖励!

54个圈友 0个话题

华为手机随手拍，记录生活点滴之美好

51个圈友 0个话题

这里是华为P30pro手机交流圈，欢迎华为P30pro用户进群交流

60个圈友 2个话题

华为花粉体验官，体验官专属的交流群

登录后查看您创建的圈子

现在登陆

登录后查看您创建的圈子

现在登陆

猜你喜欢

标签云

@杭州百翼科技有限公司

杭州互联网违法和不良信息举报平台网络110报警服务

浙ICP备17046585号

1

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索