智源研究院仅用10万美元，成功训练出千亿参数大模型FLM

人工智能
23年9月18日
编辑

全民智能

在人工智能领域，训练大型模型的成本一直是一个难题。然而，北京智源人工智能研究院和中国科学院计算技术研究所等机构的一项研究打破了这一现状。他们仅用10万美元的预算，就训练出了一个拥有1010亿参数量的全新千亿参数大模型——FLM。

这个模型的训练成本远低于市场上的其他模型。例如，GPT-3的训练成本高达460万美元，而Llama2的训练成本也大约在这个数。然而，FLM只用了2.17%的花销，就达到了与GPT-3相媲美的效果。这一成果无疑为人工智能领域的研究开辟了新的道路。

FLM的成功开发得益于研究团队的新型训练策略。他们不仅成功地降低了训练成本，还提高了模型的性能。这一成果已经开源，引起了开发社区的广泛关注。

北京智源人工智能研究院和中国科学院计算技术研究所等机构的这项研究展示了他们在人工智能领域的深厚实力和创新能力。他们的成功为其他研究机构提供了宝贵的经验，也为人工智能的发展开辟了新的可能性。

声明：学AI网所有文章，如无特殊说明或标注，均为本站作者原创发布。任何个人或组织，在未征得作者同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益，可联系客服或提交工单进行处理。学AI网内用户所发表的所有内容及言论仅代表其本人，并不反映任何学AI网之意见及观点。

{{userData.name}}已认证

智源研究院仅用10万美元，成功训练出千亿参数大模型FLM

Arm上市后，孙正义的下一步：瞄准OpenAI

程序员噩梦？ChatGPT等AI聊天机器人可快速、经济高效地开发软件

极简主义女生头像MidJourney提示词

怀旧报纸女孩MidJourney提示词

MidJourney彩虹列车咒语

{{userData.name}}已认证

Arm上市后，孙正义的下一步：瞄准OpenAI

程序员噩梦？ChatGPT等AI聊天机器人可快速、经济高效地开发软件

姜子牙团队开源Ziya-Coding-34B-v1.0代码大模型，超越GPT-4在HumanEval Pass@1评测上表现出色

微软推出AutoGen框架，简化基于大语言模型的复杂应用开发工作

AI在机器人领域的应用：丰田研究院的“机器人幼儿园”项目

铁威马NAS照片库大升级：利用AI管理，以支持智能人脸分类

极简主义女生头像MidJourney提示词

怀旧报纸女孩MidJourney提示词

MidJourney彩虹列车咒语