早上好!Freemen又和大家见面咯!
靠谱的高薪工作已经帮您筛选完毕,
FreemenIT行业求职招聘app诚挚邀请您前来参与。
参与入口→「链接」
ChatGPT类产品提升生产效率的潜力,已经被不断验证。
但与此同时,前有 ChatGPT 大规模封号、亚洲成重灾区,后有 OpenAI 因算力问题停售 ChatGPT Plus…
国内推出自己的模型迫在眉睫,看得出国内的玩家们都在持续发力准备冲刺了。
今天Freemen为大家汇总了近日阿里上线的ChatGPT产品通义千问的实测情况。
明天为大家介绍另一款近期上线的国产ChatGPT产品,敬请期待!
通义千问(阿里版 ChatGPT)
提问:请写代码解决"把 abcd...s 共 19 个字母组成的序列重复拼接 106 次,得到长度为 2014 的串。
对于以上「通义千问」生成的代码, CSDN-AI 团队研发总监如此评价:
“阿里云的模型对于随机抽取的常见代码片需求,基本能理解需求,生成合适的代码。能区分生成代码对指定语言的需求。能区分中英文问题输入。简单的冒泡排序和领域特定的逻辑回归代码,都能生成合适的代码,总体表现不错。在理解代码需求的推理能力上,则还有待加强。”
古怪问题大PK考考通义千问一些难倒老外的「汉语十级」考题。
请听题:您是要几等座?你们一共有几等座?特等一等二等等等,二等要多等一等。我看一下,等一等啊。别等了,再等一等就没了。那不等了,就这个吧。请问顾客最终买了几等座?
通义千问的表现非常优异,给出了正确答案——一等座,并作了详细的分析。
那么,作为一个母语是汉语的人,你觉得是几等座呢?
再问「女朋友对男朋友说,我都和你说了200次了,你也不长记性,又乱买东西。请问女生和男朋友说了多少次?」
通义千问显然是个「直男」,直接建议男生去问问女朋友,好好回顾下之前的聊天记录。
而前段时间,文心一言对这个问题,曾给出送到莆田医院的答案,这次看起来靠谱了许多。
GPT-4自始至终都对正确答案非常坚定。
代码分析能力可以看到,第一次测试的解释有大问题。
这可能是因为上文中生成了Powershell代码,模型的记忆能力似乎有问题,受上下文信息影响严重,直接解释了自己之前生成的代码,而非新提问的代码。
可以看到,分析能力还是有差距的。
GPT-4 明显详细很多,代码分解能力很强,而且直接给出结论“通常用于恶意软件或恶意脚本,试图逃避安全系统检测”。
「百宝袋」:情书诗歌彩虹屁,样样拿手另外,通义千问还整了一个针对不同场景小应用集合「百宝袋」,可以写提纲,给出放飞的菜谱,甚至还生成彩虹屁。
而不进入功能窗时,通义千问续写的内容就比较普适了,而且人物形象刻画更加生动饱满,故事细节更加丰富。
写提纲最后以「分析OpenAI新发布的GPT-4模型结尾」列个提纲。
通义千问生成的提纲把GPT-4的原理、前景、局限都覆盖到了,相当全面。
文章来源&作者:量子位 对白的算法屋 新智元
大语言模型国内赛进入白热化阶段,看来继疯狂三月之后,大家可以期待一个国内版AI填充的的疯狂四月!
Freemen持续为大家带来有用的IT和职场知识,记得关注我~
今天的分享就到这里,我们下期再见!
下面是今天的岗位推荐,记得来Freemen app查看更多高薪IT岗位。
今日推荐:
JAVA开发工程师
1.精通java编程、设计模式和组件技术,熟悉关系型数据库、通讯协议等。
2.熟练掌握sping、springboot、dubbo、zookeeper、rabbitmq. elasticsearch等相关技术。
3.对数据库的基本理论和内部实现机制有深刻的理解,熟练应用 mysql/nosql,有大数据和高并发的设计经验。
4.熟悉gitflow。
5.熟悉linux常用命令。
6.熟悉缓存技术,网站优化,服务器优化,集群技术处理、网站负载均衡、系统性能调优等软件编程的高级技术。
7.对分布式事务、并发、熔断等问题有自己的见解。
工作地点:深圳
花粉社群VIP加油站
猜你喜欢