三三文章网 - 科技知识大全是专业科技新媒体网站。网站著眼于新一代科技新闻的全面及时处理报导,让网民在外面第二时间交待全球新一代的科技资讯。内容涵括AI+、互联网、IT、创业投资、核定、区块链、智能硬件等领域

元发布了AI语言模型LLaMA,它是一个拥有650亿参数的大语言模型,

  • 时间:
  • 浏览:0

2月25日(当地时间),Meta与受微软、谷歌等ChatGPT刺激的企业一起,发布了面向研究社区的基于人工智能(AI)的新型大规模语言模式。

元LLaMA是ldquo大型语言模型Meta AIrdquo是Large Language Model Meta AI(Large Language Model Meta AI)的缩写,可以通过非商用许可证向政府、社区、学术界的研究人员、实务人员等提供。

该公司将基本代码提供给用户,用户可以自己调整模型,并将其用于与研究相关的用例。Meta表示对模型计算力的要求ldquo。低得多的rdquo。

该公司表示,他们正在开发各种参数(7B、13B、33B、65B)的LLaMA。LLaMA65B和LLaMA33B用1.4万亿个令牌训练,最小的型号LLaMA7B也用1万亿个令牌训练。

与其他大型语言模型一样,LLaMA将一系列单词作为ldquo操作。输入rdquo;预测以下单词以递归方式生成文本为此模型,元从20种语言中选择了文本,并以拉丁语和基里尔文字为中心进行了训练。

当然,和其他模型一样,LLaMA也面临着偏见、有毒的评论和幻觉,Meta需要做进一步的研究来解决这种语言模型的缺点。

根据Meta,LLaMA作为基本模型被设计为多功能,可以在各种用例中使用,而不是针对特定任务的微调模型。通过将LLaMA的代码开源,其他研究人员可以很容易地找到限制或消除这些问题的新方法。Meta还展示了模型的局限性,并提供了一组评估模型偏差和毒性的标准评估标准,以支持研究人员在这一关键领域的进一步研究。

顺便说一下,Meta公司去年5月也发表了大型语言模型opt-175b。该项目也针对研究人员,这是该公司聊天室blenterbot新一轮迭代的基础

随后,该公司推出了一款名为“ldquo”的产品。是片酬库rdquo;(Galactica)这个模型被认为可以写科学文章和解答数学问题,但由于重复生成ldquo,演示版被删除了。内容好像是有权威的rdquo。

【出处:IT之家