【导语】
生成式AI技术的竞争日益激烈。近日,Meta发布了一款名为LLaMA的全新AI大型语言模型,号称能降低生成式AI工具可能带来的偏见、有毒评论以及错误信息等问题。该模型仅用约1/10的参数规模,性能却能匹敌主流大模型GPT-3、Chinchilla和PaLM。LLaMA的开源和免费供给研究人员,让大型语言模型领域的研发更加容易,将有望推动该技术迈向更广泛的应用领域。
生成式AI技术一直是科技领域的热门话题。Meta公司最近宣布推出了全新的AI大型语言模型LLaMA,该模型在性能上能与OpenAI GPT-3、DeepMind Chinchilla和谷歌PaLM等主流大模型匹敌,同时解决了生成式AI工具可能带来的偏见、有毒评论和错误信息等问题。这对于AI研究学者来说是一个重要的利好消息。
在性能测试方面,LLaMA表现出了不俗的能力。拥有130亿参数的LLaMA模型在单个GPU上的性能可能超过拥有1750亿参数的GPT-3。该模型在常识推理、闭卷问答、阅读理解、数学推理、代码生成、大规模多任务语言理解等方面均不输于业界主流大模型。尤其值得一提的是,LLaMA的优势在于可以使用更少的计算能力和资源来进行测试,这有望推动类ChatGPT产品跑在消费级硬件上,为用户提供更为便利的服务。
【结语】
生成式AI技术的竞争愈发激烈,Meta公司发布的LLaMA语言模型成果是一大利好。这款全新的AI大型语言模型通过开源和免费供给研究人员,为研发人员提供了更多的研究和应用机会。虽然目前仅限于研究用途,但随着技术的不断优化,未来有望将生成式AI应用扩展到更广泛的领域,让用户在笔记本电脑甚至手机上也能体验到类ChatGPT功能的语言模型。
花粉社群VIP加油站
猜你喜欢