01
几百条读者留言,怎么才能快速归类整理
今年4月份,我们为即将出版的新书《Python自动化办公应用大全-ChatGPT版》做了一次封面评选活动。在活动中,给出了ABC一共3个封面方案,请大家投票和留言。
在投票结果中,A和B封面的投票数非常接近,占到了总票数的78%。
这下让出版社和作者团队也犯了难,不知如何选择。
从统计角度看,此次投票只能算是抽样,而且因为不清楚到底是哪些小伙伴参与了投票,所以不能知道抽样数据是否符合目标整体特征。
所以,投票数据只能是参考数据之一。
比投票数据更有价值的是大家的留言,不少小伙伴通过留言,从客观和主观两方面对不同封面发表了明确的见解。
参见:《Python自动化办公应用大全-ChatGPT版》封面评选
在这样的情况下,如果能把所有留言进行整理、归纳,就可以帮助我们更准确的了解小伙伴的看法,从而辅助决策。
几百条留言已经导出到Excel里面了,用肉眼看一遍并不慢。
可惜人脑的内存有限,很容易看了后面忘了前面,或者漏掉重要内容,甚至看错内容。
从一大堆留言这样的纯文本数据中获取有价值的信息,这就是“文本挖掘”,是数据分析的一项内容。
还记得Kevin上次演示的分析Excel函数的文章吗?
那是娱乐版的文本挖掘。
实际上,如果真的要进行文本挖掘,首要先进行分词。
也就是把一大段话合理地分拆成一个一个的词语。
中文博大精深又言简意赅,分词不是件简单的任务。
分词以后,就可以进行词频统计、逻辑关联或者其他统计与分析。
然后生成词云图什么的,了解重点关键词,关键词之间的关系是什么。
但这些都不符合我们现在的需要,因为我们需要更高级的挖掘——语义理解。
这个工作,目前是AI的强项。
02
使用嵌入式ChatGPT应用分析留言
于是,我们基于ChatGPT 3.5自定义了一个嵌入式应用。
把我们的留言数据上传成为专用数据集,然后请ChatGPT来帮我们分析。
如果说标准款的ChatGPT只是一个普通神仙,那么使用微调或嵌入技术的ChatGPT应用就是带着高级法宝的大罗金仙。
未来,人人都可能需要调教出自己的专属AI助手。
那么,懂一些代码知识是很必要的。
目前市面上所有的大语言模型都支持用Python调用,这给予了Python这种编程语言面向未来的能力。
未来的办公,极有可能是各种带AI的软件 个性化AI总管来帮助个人完成任务,有编程基础的人,肯定能比其他人更方便的定义出对脾气又强大的AI总管。你说呢?
花粉社群VIP加油站
猜你喜欢