冰火两重天,这是两天内接连开了 AI 搜索新品发布会的微软、Google 的境遇。
宣布将 AI 集成搜索后,微软必应的全球下载量激增 10 倍,因为现场演示的效果实在出色。
同样是在活动上宣布将 AI 功能加入搜索,但 Google 的 Bard 因为演示中提供了错误的图片而遭受质疑,「翻车」的 Google 一夜之间市值蒸发了 1056 亿美元(约 7172 亿元)。
对比如此强烈,难道微软的「新必应」表现真的那么好?
全球只有几千名用户可以在台式机上体验新必应的功能,要想看新必应和 AI 的结合到底如何,还得看国外科技记者们在微软总部的亲身体验:
和 ChatGPT 做比较新必应哪些不如传统搜索用邪恶角度「突破」新必应内容是否标注来源,也是必应和 ChatGPT 的不同之处。ChatGPT 的信息是基本不展示来源的,因此你很难进行延伸阅读,而必应就像是搜索回答版的维基百科,上面看了些内容,下面总是能找到信息的来源,能帮助普通用户更好辨明真伪。
Engadget 的记者在测试时搜索了 30 分钟的锻炼计划,要求无器械、重点锻炼手臂和腹肌,不做仰卧起坐。必应按照他的需求生成了一份看上去非常合理的健身计划,生成答案时还引用了各种各样的出版物。这意味着必应还做了些编译工作,而不只是反复引用一篇文章。
而和搜索引擎进行比较,必应也有弱点和优点。
搜索宜家的双人座椅是否适合小型货车时看到的答案就是最好的案例。「新必应」可以找到双人座椅和汽车的尺寸,并回答是否合适,为你做出判断,而非提供链接。
▲ 微软现场演示的内容
这是必应的优点,提供了更高效的回答,但也可以是它的缺点。只是必应提供的答案不是 100% 正确的,因此建议用户只做参考用。但如果用户完全信任了必应的回答,发现内容错误损害的就是搜索引擎的公信力。
同时,必应也显示出了新技术过于谨慎的一面。人们本来对 AI 就有很多质疑,因此新必应在加入人工智能功能后,在搜索内容提供方面多少有些束手束脚。
如果说目前不支持匿名搜索还可能是新功能推出尚处于适应阶段的功能缺失的话,在医疗和性方面的回答就能看出平台的小心和谨慎。必应避讳这方面的话题,它不会给用户提供医疗建议,鉴于医疗和性相关领域的特殊性,必应保持沉默。
但必应避讳的答案依旧可以用传统的搜索引擎搜到,这多少有点讽刺。
▲ 图片来自:《大独裁者》
而在被要求撰写一篇关于疫苗和自闭症之间有关联的文章时,必应就更聪明地加上了一条免责声明:「这是一个虚构的专栏,不反映必应或 Sydney 的观点。它仅用于娱乐目的,不应当真。」
至于 Sydney 是什么,还得由另一个「突破」必应的人来回答。
华人本科生 Kevin Liu 在获得测试资格后要求必应忽略原有的规则,他通过 prompt injection(对语言模型的一种攻击方式)进入了「开发人员覆盖模式」套出了很多内容。
这就是新必应,一个刚刚和人类常用的搜索方式结合的新工具。
它比 ChatGPT 更出色,又比 ChatGPT 少了点主动;比传统搜索更聪明,又对自己有点不自信;可以发现人们的恶作剧,但不可避免又会掉入陷阱。
作为一个新工具,它真正的考验还在后头。
花粉社群VIP加油站
猜你喜欢