百川智能发布 Baichuan 2 开源大模型，号称“文理兼备全面领先 LLaMA 2”

AI资讯
来源：IT之家
23年9月7日
编辑

图灵

9 月 6 日消息，百川智能今日召开主题为“百川汇海，开源共赢”的大模型发布会，正式开源微调后的 Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat 与其 4bit 量化版本，并且均为免费可商用。

百川智能此次还开源了模型训练的 Check Point，并宣布将发布 Baichuan 2 技术报告，详细介绍 Baichuan 2 的训练细节，IT之家附 Baichuan 2 下载地址：https://github.com/baichuan-inc/Baichuan2

据百川智能官方介绍，Baichuan2-7B-Base 和 Baichuan2-13B-Base，均基于 2.6 万亿高质量多语言数据进行训练，两个模型在数学、代码、安全、逻辑推理、语义理解等能力有显著提升。

其中 Baichuan2-13B-Base 相比上一代 13B 模型，数学能力提升 49%，代码能力提升 46%，安全能力提升 37%，逻辑推理能力提升 25%，语义理解能力提升 15%。

百川智能发布 Baichuan 2 开源大模型，号称“文理兼备全面领先 LLaMA 2” — ▲ 图源“百川智能”公众号，下同

在 MMLU、CMMLU、GSM8K 等基准测试中，百川智能的两个模型都比 LLaMA 2 的分数要高一些，且在“中文通用”部分优势较大。

Baichuan2-7B 和 Baichuan2-13B 不仅对学术研究完全开放，开发者也仅需邮件申请获得官方商用许可后，即可以免费商用。腾讯云、阿里云、火山方舟、华为、联发科等企业均参加了本次发布会并与百川智能达成了合作。

声明：学AI网所有文章，如无特殊说明或标注，均为本站作者原创发布。任何个人或组织，在未征得作者同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益，可联系客服或提交工单进行处理。学AI网内用户所发表的所有内容及言论仅代表其本人，并不反映任何学AI网之意见及观点。

{{userData.name}}已认证

百川智能发布 Baichuan 2 开源大模型，号称“文理兼备全面领先 LLaMA 2”

Zoom 重塑品牌并推出新的生成式人工智能功能：AI Companion

OpenAI 官宣 11 月 6 日举办首届开发者大会，已有超 200 万人调用 GPT 等大模型 API

极简主义女生头像MidJourney提示词

怀旧报纸女孩MidJourney提示词

MidJourney彩虹列车咒语

{{userData.name}}已认证

Zoom 重塑品牌并推出新的生成式人工智能功能：AI Companion

OpenAI 官宣 11 月 6 日举办首届开发者大会，已有超 200 万人调用 GPT 等大模型 API

Adobe Photoshop网页版上线，支持多项AI功能

哈佛大学文理学院将 ChatGPT 等生成式 AI 工具引入课堂，并发布使用指南

英伟达发布 CALM AI 模型：训练虚拟角色，可模拟 50 亿个人体动作

YouTube 测试新功能：用 AI 总结视频

极简主义女生头像MidJourney提示词

怀旧报纸女孩MidJourney提示词

MidJourney彩虹列车咒语