据上证报报道,4月21日,复旦大学自然语言处理实验室开发的新版MOSS模型正式上线,成为国内首个插件增强的开源对话语言模型。
目前,MOSS模型已上线开源,相关代码、数据、模型参数已在Github和Hugging Face等平台开放,供科研人员下载。开源代码涵盖模型训练和推理代码,开源数据包括超100万条对话训练数据,开源模型包括160亿参数中英双语基座语言模型、对话模型以及插件增强的对话模型。
MOSS基于公开的中英文数据训练,目前已经拥有200亿参数,具有和人类对话的能力,并可以通过与人类交互实现迭代优化。
2月20日,复旦大学自然语言处理实验室发布了国内第一个对话式大型语言模型MOSS,并通过邀请码进行内测。
复旦大学自然语言处理实验室称,MOSS还是一个非常不成熟的模型,距离ChatGPT还有很长的路需要走。由于训练数据中的多语言语料库有限,MOSS 在理解和生成非英语文本方面表现不佳。目前正在开发一个改进版本,以提高其中文语言能力。
复旦MOSS网址:MOSS.fastnlp.top/