“最强AI”GPT-4推出后,全球网民把它玩出了花。有人用它建网站,有人靠它作弊,还有人让它设计理财方案。以上这些都发生在电脑上,意味着GPT-4的真身只存在于赛博空间里。但外国小哥麦凯·瑞克利(Mckay Wrigley)不走寻常路。他想给GPT-4一双“眼睛”,让它自己看到现实空间里的一切,成为他的家庭生活助手。
想要让GPT-4看到家里的一切,需要经历两个步骤,一个是拍摄,一个是视觉分析。首先,瑞克利用苹果手机拍摄视频,视频直播到电脑上。接着,他使用电脑上的视觉模型YOLOv8来检测目标。为了确保准确性,他需要先将房间内所有物品的图像输入进去,形成自己的数据集。
“请记住,眼前这个AI没有任何先验知识,它只能通过摄像头拍到的物品来获得信息。” 瑞克利在视频开头说,“大家可以看到,屏幕上有很多框,这就是它在识别物品。”“除此外,它还可以在网上搜索关于物品的信息。”瑞克利按下运行按钮,GPT-4用专业的女声说:“我有什么能帮您的吗?”
之后,他关上冰箱,对观众们解释:“当我离开冰箱的时候,它就明白我不想继续展示了。冰箱门一关,它开始处理信息,整个识别过程很快。”过了几秒钟,GPT-4说:“看起来,你家里有牛排、菠菜、黄油、牛油果和柠檬。这些都是很棒的生酮食物。”瑞克利举了个大拇指说:“干得好,这就是我想让你做的。接下来我要你去网上搜菜谱,看看我能用这些食物做什么晚餐。”
瑞克利用到的技术不算复杂,但让GPT-4直接和现实交互,有点未来世界的样子。推特评论区里,很多人已经等不及要试了,瑞克利鼓励大家“它做起来比看起来容易100倍”。上个月,瑞克利做过“GPT之眼”简易版,效果也很不错。他拿着可乐,问GPT-4这是什么,它很快回答“这是一罐可乐”。
接着,他问里面有多少卡路里。虽然光线模糊,距离也不算近,GPT-4看出来(准确地说是视觉模型看出来)这是健怡可乐,回答“它不含有任何卡路里”。GPT-4还搜索出这款可乐的成分,给出网站链接。
瑞克利又拿出自己的牙刷,问它这是什么,同时要求它找到在亚马逊上的购买链接。
GPT-4回答“这根牙刷售价6.66美元,有14712人留下评分,星级评分为4.7”。接着,它给出购买链接。瑞克利点进去后发现犯了点小错,GPT-4给的不是原价,而是折后价,大概是因为它登录了自己的亚马逊账号。
在最后的测试,瑞克利拿出一张电影海报,问GPT-4这个男人是谁,给出关于他的信息。
GPT-4很快找到他是约翰·维克,《疾速追杀》里的角色。“约翰·维克是基努·里维斯在一部新黑色动作惊悚片中扮演的角色。约翰是一名传奇杀手。在一群人闯入他的家,偷走他的车,杀掉他已故妻子送的小狗后,他寻求复仇,重新回到犯罪的地下世界。这使他和曾经所属的国际杀手组织产生的冲突。”维基百科的链接也贴心附上了。
现在,瑞克利在兴奋地期待AR眼镜,把它和GPT-4结合后,整个人就像生活在科幻小说里。
而这仅仅只是开始。
也许机器人管家会普及化,
也许人们会找出更神奇的功能,做出更不可思议的产品,算是AI降生后给人的小小期盼吧……
花粉社群VIP加油站
猜你喜欢