今日 2023 阿里云峰会・粤港澳大湾区于广州举行,阿里云智能首席技术官周靖人宣布推出通义家族最新产品 —— 工作学习 AI 助手“通义听悟”,其依托大模型,可用于会议讨论、教学培训、调研访谈、视频观看等场景。
据官方介绍,通义听悟接入了通义千问大模型的理解与摘要能力,可成为用户工作学习中的得力 AI 助手,帮助随时随地高效完成对音视频内容的转写、检索、摘要和整理,比如用大模型自动做笔记、整理访谈、提取 PPT 等。公测期间,用户可领取 100 小时以上听悟免费转写时长。
周靖人介绍,通义听悟能够提供全新的音视品体验。在实时对话方面,其能够实时记录、多语言翻译、发言总结、问题回顾;视频体验方面,通义听悟支持云盘导入和本地上传、章节速览、全文概要等。
根据现场演示,听悟融合了十多项 AI 功能,可以全面提升知识从音视频向图文形态转化的效率。除了“听力好”,能高准确度生成会议记录、区分不同发言人,这个 AI 助手“悟性也极高”,大模型可以一秒给音视频划分章节并形成摘要、总结全文及每个发言人观点、整理关注重点和待办事项。大模型一键提取 PPT、针对多个音视频内容向 AI 提问、概括特定段落等功能近期也将上线。
据介绍,通义听悟于 6 月 1 日开始正式公测,用户可通过官网 tingwu.aliyun.com 进行体验,官方称这是国内首个开放公测的大模型应用产品。。
IT之家从通义听悟官网了解到,通义听悟支持在会议、课程、访谈、培训等场景下实时转录和音视频转文字,智能生成总结,实时翻译打破跨语言沟通障碍。通义听悟还支持快速标记关键信息,识别结果和笔记能够轻松导出至本地或阿里云盘知识管理更高效。
附通义听悟核心能力官方介绍:
实时语音转写,生成智能记录,搜索定位助力高效回顾
- 开启实时记录,完整沉淀沟通内容,精准快捷生成记录,音字对应播放
- 支持自主检索关键词,精准定位核心信息,轻松回顾会话重点
文件转写,海量文件同时上传,帮你省时又省力
- 会议、学习、访谈等音视频文件快速上传,同时可上传 50 个本地文件,也可以上传阿里云盘中的文件
- 支持自动区分发言人,转写结果自动保存在「我的记录」中,方便随时查看回顾
实时翻译,支持中英互译,跨语言协作流畅自如
- 实时转写中和结束后,支持一键开启中英互译,打破语言壁垒,轻松实现无障碍沟通
快速标记,高亮重点、问题、待办,重点信息一目了然
- 支持高亮标记重点、问题、待办事项,支持筛选和批量摘录,回顾整理更清晰
轻松导出,丰富内容任你挑,多样格式供你选
- 支持下载原文、笔记、音视频和译文,一键导出所需内容
- 多种下载文档格式:支持 word、pdf 和 srt 字幕文件导出