元发布了AI语言模型LLaMA，它是一个拥有650亿参数的大语言模型，

时间:2023-03-24 09:19:21
浏览:0

me
模型

2月25日（当地时间），Meta与受微软、谷歌等ChatGPT刺激的企业一起，发布了面向研究社区的基于人工智能（AI）的新型大规模语言模式。

元LLaMA是ldquo大型语言模型Meta AIrdquo是Large Language Model Meta AI（Large Language Model Meta AI）的缩写，可以通过非商用许可证向政府、社区、学术界的研究人员、实务人员等提供。

该公司将基本代码提供给用户，用户可以自己调整模型，并将其用于与研究相关的用例。Meta表示对模型计算力的要求ldquo。低得多的rdquo。

该公司表示，他们正在开发各种参数（7B、13B、33B、65B）的LLaMA。LLaMA65B和LLaMA33B用1.4万亿个令牌训练，最小的型号LLaMA7B也用1万亿个令牌训练。

与其他大型语言模型一样，LLaMA将一系列单词作为ldquo操作。输入rdquo；预测以下单词以递归方式生成文本为此模型，元从20种语言中选择了文本，并以拉丁语和基里尔文字为中心进行了训练。

当然，和其他模型一样，LLaMA也面临着偏见、有毒的评论和幻觉，Meta需要做进一步的研究来解决这种语言模型的缺点。

根据Meta，LLaMA作为基本模型被设计为多功能，可以在各种用例中使用，而不是针对特定任务的微调模型。通过将LLaMA的代码开源，其他研究人员可以很容易地找到限制或消除这些问题的新方法。Meta还展示了模型的局限性，并提供了一组评估模型偏差和毒性的标准评估标准，以支持研究人员在这一关键领域的进一步研究。

顺便说一下，Meta公司去年5月也发表了大型语言模型opt-175b。该项目也针对研究人员，这是该公司聊天室blenterbot新一轮迭代的基础。

随后，该公司推出了一款名为“ldquo”的产品。是片酬库rdquo；（Galactica）这个模型被认为可以写科学文章和解答数学问题，但由于重复生成ldquo，演示版被删除了。内容好像是有权威的rdquo。

【出处：IT之家

钉钉7.0的发表会于12月28日召开，钉钉7.0的发表会于12月28日召开

世界上最受赞赏的！海尔智家如何获得行业最高？，

元发布了AI语言模型LLaMA，它是一个拥有650亿参数的大语言模型，

猜你喜欢

腾讯数据中心节能黑科技吸引外媒关注巧用余热回收助力碳中和（腾讯数据中心创新节能技术获外媒瞩目：余热回收助力实现碳中和目标）

从张勇夫妇第四次IPO看海底捞的企业创新与竞争力提升

全国首座潮间带光伏电站并网发电：预计年发电量 1.5 亿千瓦时（全国首座潮间带光伏电站成功并网发电：预计年发电达一亿五千千瓦时）

富士X-M5国行价格揭晓，5699元起，你会入手吗？（富士X-M5国行全新上市：价格曝光，起售价5699元，心动不如行动！）

“百亿工程”进程中的江南布衣品牌定位与市场战略

阿里巴巴盈利增长的奥秘：商业模式与市场策略分析

华熙集团「星热纪ENTVERSE」APP登陆各大应用商店：加速虚拟现实破壁链路（华熙集团全新推出「星热纪ENTVERSE」APP：打破虚拟现实界限，应用商店火热上线）

投资4亿美元建厂国产面板一哥京东方也要转向越南？回应来了（京东方投资越南建厂传闻揭秘：国产面板巨头是否转战越南？揭晓投资细节）

腾讯数据中心节能黑科技吸引外媒关注巧用余热回收助力碳中和（腾讯数据中心创新节能技术获外媒瞩目：余热回收助力实现碳中和目标）

从张勇夫妇第四次IPO看海底捞的企业创新与竞争力提升

全国首座潮间带光伏电站并网发电：预计年发电量 1.5 亿千瓦时（全国首座潮间带光伏电站成功并网发电：预计年发电达一亿五千千瓦时）

富士X-M5国行价格揭晓，5699元起，你会入手吗？（富士X-M5国行全新上市：价格曝光，起售价5699元，心动不如行动！）

“百亿工程”进程中的江南布衣品牌定位与市场战略

阿里巴巴盈利增长的奥秘：商业模式与市场策略分析

腾讯数据中心节能黑科技吸引外媒关注巧用余热回收助力碳中和（腾讯数据中心创新节能技术获外媒瞩目：余热回收助力实现碳中和目标）

从张勇夫妇第四次IPO看海底捞的企业创新与竞争力提升

全国首座潮间带光伏电站并网发电：预计年发电量 1.5 亿千瓦时（全国首座潮间带光伏电站成功并网发电：预计年发电达一亿五千千瓦时）

富士X-M5国行价格揭晓，5699元起，你会入手吗？（富士X-M5国行全新上市：价格曝光，起售价5699元，心动不如行动！）

“百亿工程”进程中的江南布衣品牌定位与市场战略

阿里巴巴盈利增长的奥秘：商业模式与市场策略分析