百川智能发布全面领先的开源大模型 Baichuan 2，数学、代码能力大幅提升

人工智能
23年9月7日
编辑

全民智能

Baichuan 2是百川智能发布的一款开源大模型，号称“文理兼备全面领先LLaMA 2”。百川智能在这次主题为“百川汇海，开源共赢”的发布会上正式开源了微调后的Baichuan2-7B、Baichuan2-13B和Baichuan2-13B-Chat以及它们的4bit量化版本。这些模型都是免费且可商用的。

除了开源模型本身，百川智能还公开了模型训练过程中的Check Point，并宣布将发布Baichuan 2技术报告，详细介绍Baichuan 2的训练细节。你可以在这个链接中找到Baichuan 2的下载地址：https://github.com/baichuan-inc/Baichuan2

根据百川智能官方的介绍，Baichuan2-7B-Base和Baichuan2-13B-Base都基于2.6万亿高质量多语言数据进行了训练。这两个模型在数学、代码、安全、逻辑推理和语义理解等能力方面都有显著的提升。具体来说，Baichuan2-13B-Base相比上一代13B模型，在数学能力的提升上有49%，代码能力的提升上有46%，安全能力的提升上有37%，逻辑推理能力的提升上有25%，语义理解能力的提升上有15%。

在MMLU、CMMLU、GSM8K等基准测试中，百川智能的这两个模型都比LLaMA 2的分数要高一些，而且在“中文通用”部分的优势较大。

Baichuan2-7B和Baichuan2-13B不仅对学术研究完全开放，开发者也只需通过邮件申请获得官方商用许可后，就可以免费商用。腾讯云、阿里云、火山方舟、华为、联发科等企业都参加了本次发布会并与百川智能达成了合作。

声明：学AI网所有文章，如无特殊说明或标注，均为本站作者原创发布。任何个人或组织，在未征得作者同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益，可联系客服或提交工单进行处理。学AI网内用户所发表的所有内容及言论仅代表其本人，并不反映任何学AI网之意见及观点。

{{userData.name}}已认证

百川智能发布全面领先的开源大模型 Baichuan 2，数学、代码能力大幅提升

xAI：马斯克筑梦人工智能，Twitter、特斯拉…… All in AI

摩根士丹利推出AI聊天机器人，为投资者提供更精准的投资建议

极简主义女生头像MidJourney提示词

怀旧报纸女孩MidJourney提示词

MidJourney彩虹列车咒语

{{userData.name}}已认证

xAI：马斯克筑梦人工智能，Twitter、特斯拉…… All in AI

摩根士丹利推出AI聊天机器人，为投资者提供更精准的投资建议

大模型领域雷军选择与王小川携手合作：小米大规模布局首次曝光

姜子牙团队开源Ziya-Coding-34B-v1.0代码大模型，超越GPT-4在HumanEval Pass@1评测上表现出色

中国电信发布启明网络大模型：开创信息通信领域AI应用新纪元

百川智能推出全面升级的Baichuan2-53B大模型，开放API进入To B领域

极简主义女生头像MidJourney提示词

怀旧报纸女孩MidJourney提示词

MidJourney彩虹列车咒语