最近,OPPO的安第斯大模型(AndesGPT)在SuperCLUE的9月排行榜上崭露头角,在“知识与百科”能力方面仅次于GPT4,排名国内大模型第一,并在“角色扮演能力”中位居前三。
SuperCLUE是一个专注于中文通用大模型的评估基准,旨在全面评估这些大模型的能力,包括对中文特定任务的理解和积累。它从三个不同的维度评估模型的能力:基础能力、专业能力和中文特性能力,其中基础能力包括语义理解、对话、知识与百科、逻辑推理、角色扮演、代码、生成与创作等10项能力。
AndesGPT,作为OPPO自主训练的生成式大语言模型,早在8月初就开始面向公众邀测,旨在为传统语音助手带来核心级别的升级。在SuperCLUE的十大基础能力排行榜中,AndesGPT在“知识与百科”能力方面获得了高达98.33的测试分数,遥遥领先其他大模型,仅次于GPT4,在国内排名第一。这一成绩与知识与百科问答是智能助手最重要的应用场景密切相关。早在2020年,OPPO就开始探索和实践相关技术,曾在大规模知识图谱问答评测KgCLUE中获得第一名。AndesGPT则通过引入高质量的知识图谱、问答数据,并结合先进的预训练和微调技术,显著提高了大语言模型在知识与百科领域的覆盖面和准确性。
凭借近5年的技术积累,OPPO已经成为对话交互技术领域的领军者,其智能助手小布是手机领域最早实现月活跃用户破亿的产品之一,为大模型提供了丰富的真实对话数据。AndesGPT的技术方向旨在增强对话能力,与智能助手的核心应用场景高度契合。
据悉,AndesGPT包含多种参数规模的大语言模型,从十亿级别到千亿级别不等,可支持多样化的应用场景。未来,AndesGPT将继续增强OPPO智能助手小布的AI能力,提供更出色的用户体验,并逐步应用于更多OPPO核心产品中。这一成就标志着OPPO在大语言模型领域的突破,为智能交互和知识传递领域带来了更多可能性。