阿里云开源Qwen-VL视觉语言模型，更适用于中国用户的多模态应用

人工智能
23年8月25日
编辑

全民智能

近日，阿里云旗下魔搭社区宣布开源了一款名为Qwen-VL的视觉语言模型。该模型以通义千问70亿参数模型Qwen-7B为基座语言模型，具备了图文输入和多模态信息理解的能力，更适用于中国用户的需求。

Qwen-VL在基于Qwen-7B模型的基础上新增了一些重要功能，包括视觉定位和图像中文字理解等。这意味着Qwen-VL可以接受图像和多语言文本作为输入，进一步提升了模型的多模态处理能力。这一创新使得Qwen-VL能够更好地适应中国用户的需求，为他们提供更加准确、全面的信息理解和处理。

此次开源的Qwen-VL包括通用模型Qwen-VL和对话模型Qwen-VL-Chat两个版本。通用模型Qwen-VL具备了强大的多模态信息理解能力，可以广泛应用于图像识别、文字理解等领域。而对话模型Qwen-VL-Chat则专注于快速搭建具备多模态能力的对话应用，具有快速推理速度和低资源消耗的特点。

阿里云的开源举措为开发者和研究人员提供了更多自由和灵活性，他们可以根据自己的需求和场景，利用Qwen-VL构建出更加智能、高效的应用系统。同时，这也进一步推动了中国在人工智能领域的创新和发展。

相信随着Qwen-VL的开源和广泛应用，我们将会见证更多基于视觉语言模型的创新应用和技术突破。阿里云将继续致力于推动人工智能技术的进步，为用户提供更多智能化的解决方案和服务。

声明：学AI网所有文章，如无特殊说明或标注，均为本站作者原创发布。任何个人或组织，在未征得作者同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益，可联系客服或提交工单进行处理。学AI网内用户所发表的所有内容及言论仅代表其本人，并不反映任何学AI网之意见及观点。

{{userData.name}}已认证

阿里云开源Qwen-VL视觉语言模型，更适用于中国用户的多模态应用

Ideogram引领AI生成图像领域，推出新一代文字渲染系统

小爱同学大模型内测第二批名额即将开放，覆盖更多小米手机型号

极简主义女生头像MidJourney提示词

怀旧报纸女孩MidJourney提示词

MidJourney彩虹列车咒语

{{userData.name}}已认证

Ideogram引领AI生成图像领域，推出新一代文字渲染系统

小爱同学大模型内测第二批名额即将开放，覆盖更多小米手机型号

姜子牙团队开源Ziya-Coding-34B-v1.0代码大模型，超越GPT-4在HumanEval Pass@1评测上表现出色

智源研究院仅用10万美元，成功训练出千亿参数大模型FLM

通义千问大模型即日起正式对公众开放，助力人工智能应用更加广泛拓展

英伟达AI峰会倒计时：黄仁勋将探讨最新技术突破

极简主义女生头像MidJourney提示词

怀旧报纸女孩MidJourney提示词

MidJourney彩虹列车咒语