腾讯李学朝:从数字人同源性,形成新的生产效率-量子比特,
- 时间:
- 浏览:0
7月29日,2022世界数字经济会议暨互联网3.0峰会数字人类生态发展论坛在京举行。本次论坛将汇聚数字人类产业的政、产、学、研、企业主要嘉宾,共同探讨数字人类产业的发展。
由云计算和大数据研究所主办的全球第一个数字人类国际标准itu-t F.748.15共同制定了“Framework and metrics for digital human application”。发布了system(数字人机应用系统的基础框架和评价指标)
在“深度网站”上,腾讯智能产品副总裁李学朝通过题为“从数字人智人,形成新的生产性”的主题演讲,腾讯云,腾讯研究院和黑马经过产业研究、实地调查共同抽取并总结的“数字人类发展10大趋势”。
李学朝,数字人是互联网3.0的重要入口,一系列严重的技术正在产生,应用正在进化。其演进可分为离线-在线-场三个阶段,从“离线”到“在线,是技术效率的释放。并且未来,从“在线”走向“在现场”,技术的进化将推动线上和线下更全面的一体化,进入完整的连接。“通过AI技术从感知到决策、表达的一系列突破,数同源可以与数字场景、行业理解更深入地结合,加速向现实生产率的转换,实现全面的'现场'服务。”李学朝。
在演讲中,李学朝分享了腾讯在数字人类领域的探索。集成ASR、NLP、语音对话、自然语言理解、图像识别、TTS、知识图谱等全栈AI能力,将丰富的内容与服务生态系统相结合,面向使用场景提升平台能力。实现了从“数字人”到“同性恋”的智能化。现在,腾讯同调是在银行、证券、媒体、文游、行动等多个场景中的云的小数量。
李学朝未来腾讯云小微将与更多合作伙伴共同帮助中国数字化建设,共同探索数字人应用,为行业提供温度互智能服务,促进技术进步。
以下是演讲录。
各位嘉宾,各位媒体
大家好。我很高兴能在腾讯李学朝数字人类生态发展论坛上与大家交流。
今年以来,互联网3.0成为业界关注的焦点。随着数字世界和物理世界无缝加速,以人工智能、大数据和云计算为代表的数字技术将深入生产生活,为各行各业的升级转型打开新的想象空间。
其中,数字人作为AI技术具体化的一种形式,是互联网3.0的重要入口,深度技术、应用不断演进。
将这一变化分解为离线--在线]-演唱会的3个阶段在“离线”的初期阶段,通过动画和渲染技术,身份型的虚拟数字人作为现实偶像的数字分身、虚拟角色等,进行数字营销、在娱乐等领域进行了广泛的展示。最近几年,数字人加入了一项名为“在线”的服务。通过学习语义智能解析、语音在线合成等AI技术,数字人被升级为“数位熟人”,进入金融、媒体、旅游、旅游等领域,为最终用户提供数字客户服务、数字导游、数字主播等服务帮助企业和组织实现数字转换,实现成本节约效果。
从“离线”到“在线”,通过技术释放效率。而未来,从“在线”走向“在现场”,技术的进化将推动线上与线下更全面的一体化,进入完整的互联互通,也是Web 3.0的真正落地。从AI技术知觉到决策、表达的一系列突破,数同源将与数字场景、行业理解深入结合,加快向现实生产率的转换,实现全面的“现场”服务。
从离线到现场,技术应用的终极价值是“为人服务”。在这一过程中,数字人行业将运用哪些新的技术和模式,预计会有什么样的增长呢。带着这些疑问,我们和腾讯研究院,创业黑马进行了一段时间的一系列行业调研,今天借此机会,与大家分享我们的观察和想法。
第一,从产品形态看,短期内复数类型数字虚拟人共存,建模、渲染、驱动等技术环相对同质化。
这样,现在的数字虚拟机主要有两种:一种是功能型的数字员工,另一种是身份型的数字员工。在每种类型中,建模、动捕、驱动和渲染这些技术已经相对同质化和管道化,产业链分工越来越明确,说明产业和技术已经达到了第一成熟期。
在第二个核心价值中,艺术性、IP、运营能力是身份型数字人核心,功能型数字人核心的本质是利用AI的人强化、支援。
功能型数字人的重点在于AI技术突破。AI技术驱动多模态输入感知、多模态交互能力不断改善,ASR、NLP、TTS、STA、情感计算也是技术突破的重点方向。
第三,从技术融合的维度来看,数字人技术与SLAM、体积视频等技术实现了深度融合,云渲染是一个重要关注点。
作为3D渲染的一种方法,数字人提出了其他3D技术(如SLAM)、体视频融合、渲染能力强的需求。因此,通过云渲染并流到终端,或者通过端云协作,云侧判断有场景,终端侧判断有分别渲染数字人的方向性。
第四,目前数字人的展示平台,主要是传统的显示设备,以PC、手机、大屏幕显示硬件为主流。不过,数字人与3D数字内容的融合,将推动裸眼3D、VR、AR等硬件的普及,让沉浸式设备在特定领域成为最佳解决方案。
第五,作为产业应用,数字人将成为连接AI与人的新互动入口。
当数字人发展成同质人后,在不改变商业逻辑、使用文字和声音对话的当前场景中,可以使用AI同质人协同或辅助,为用户提供更好的陪伴。未来,数同源可以与更多行业场景深入结合,产生数字员工,成为提供行业服务的必备选择。
第六,C端应用程序通过平台工具降低应用程序门槛和制作成本,加速UGC数字和新业务模式的出现。
随着AI动画驱动技术的发展,能够轻松生产数字人的服务平台陆续登场,预计将来普通用户也能以低成本制作数字人的UGC模型将普及。
第七,数字人将AI技术从后端引导到前端,开创感知-决策-表达的闭环。
传统的AI技术多引用基础技术,用于后台数据处理,如算法推荐、图像处理等。现在,数字人将多种AI技术聚合在一起,用asr-nlp-tts等AI技术,构建感知-决策-表达的闭环,从单纯的数据处理,向用户深刻感知的前端进化AI技术。
第八,在产业集聚上,数字人发展艺术和技术驱动二轮,北京有望成为产业新高。
数字人的研发需要艺术和技术两方面的人才,北京、深圳、杭州、成都将成为数字人产业的重要居住地。其中,北京文化产业和科技产业优势突出,政府高度重视数字人产业的发展,也是全国第一个出台数字人发展扶持政策的城市,有望成为产业发展的新高地。
第九,我们从挑战上看,目前数字人的权益保护还处于探索期,数字人的著作权、商标权、人的形象授权、人声授权等知识产权管理等问题比较突出。只有通过产业的共同努力,推动和利用数字人类产业才是可行的、可靠的、可知的、可控的。
最后,我们还将谈到行业趋势判断。正如开头所提到的,离线-在线-现场表演是数字人发展的必然路径。
在线从服务到现场体验,从关注动态、渲染的身份型数字人,到融合语言理解力、表现力、学习力、交互能力的服务型数同源性,数字人进入大规模应用期,加快向现实生产力的转换为消费市场和企业服务创造更大的价值。
从线下到在线现场,腾讯数字人类产业不断深耕和探索。当交互模式从文本升级为语音,成为多模态人机交互系统时,交流效率和服务温度都有了很大的提高。
腾讯云微通过整合ASR、NLP、语音交互、自然语言理解、图像识别、TTS、知识地图等AI能力,腾讯连接丰富的内容和服务生态,面向使用场景磨练平台能力,为行业客户提供智能、形象、构建互动式数字分身,实现从“数字人”到“数字人”的智能化升级。
就在最近,腾讯云小微与中国国家博物馆合作,刚刚推出了国博首个阿凡达卡通人物艾雯雯。通过文博文献培训,《艾雯雯》能够实现对140多万藏品的知识逆流,并通过自学,适应不断提升行业、场景和用户的理解能力、应变能力和表达能力,更好地向全世界游客讲解中国文明可以让中国文化走向世界。
到目前为止,由云微技术驱动的数智人已经在银行、证券、教育、政务、媒体、文旅、出行等多个行业场景落地。
例如,在媒体领域,在年初的冰雪赛事中,腾讯3D手语数智人《听语》出任中央视频AI手语翻译官,运用近2000个手语动作为聋哑观众解读赛事直播,这是业界首次尝试。在金融领域,它与中信建投证券共同搭建虚拟坐席,通过数知识分子实现视频见证开户,在证券行业首次获得互动式数字员工。在出行领域,在一汽-大众云展厅,数智人Ida经过汽车行业专用语料培训,变身为汽车导购的“数智分身”,就像真人专业的汽车导购,可以为客户带来沉浸式购车体验。
从数字人数到智慧人的最大变化是实现“能听懂、能听懂、能表达”。随着交互式智能技术的加速发展,数智人相信,将成为各行业形成竞争优势的新生产力,促进更高效的产业合作,达到更优质的用户体验。
今天的论坛聚集了数字人行业产、学、研领域的重量级嘉宾。未来,我们愿与大家一道推动技术进步,与合作伙伴一道探索数字人应用落地产业,提供有温度的互动智能服务,共同助力中国数字化建设。