12月20日,由腾讯云智能、腾讯研究院、创业黑马联合主办的“2023数字人产业发展趋势解读”圆桌在线上举行。创业黑马产业加速器总经理冯莎莎,北京理工大学光电学院研究员、博士生导师、数字栩生创始人兼CTO翁冬冬,腾讯云智能数智人产品总经理陈磊,南方都市报官微运营部总监申鹏,共同探讨行业现状,解读技术与产品内核,共话产业发展,为大家带来了一次数字人产业发展前沿趋势的全面解析。

一起了解几位大咖的精彩观点,查收满满干货!

Q1:数字人的起源为何?如今发展至何阶段?

翁冬冬:数字人起源于上世纪八十年代,最早是从表演的角度来去慢慢的出现,《指环王》、《星球大战》、《阿凡达》等电影大量使用数字人技术。

在过去20年的图形技术当中,大家都在关注皮肤渲染、头发渲染、眼睛渲染等等,现在更偏向神经渲染这类更新的表达。

我们现在面临的问题是,怎么在已有的技术和成果之上进行迭代,这个过程依然会面临大量技术难题。怎么让数字人足够平民化、低门槛、易使用、易制造,包括AI也在解决这件事情,如何把成本降下来。

Q2:数字人产业在发展过程中有何特征?

翁冬冬:第一,逼真。从信息交流学、传播学角度来讲,通过表情、眼身、肢体够精准的传递情感和信息。所以数字人具备逼真的外观是精准传递信息的刚需;

第二,实时化。数字人与人类的情感传递、互动是趋势,在这种情况下,需要让技术支持数字人可以满足实时化的要求;

第三,智能化。数字人由AI生成和驱动,在这个过程里,AI算法起到非常重要的作用,尤其是随着像人机对话的进展,对数字人智能化起到非常重要的作用;

第四,虚实融合。目前的人机交互方式通过屏幕和人在进行交互,在这种环境里面数字人能够起到的作用非常局限。未来,在VR、AR场景下,数字人将会实现更好的效果。

Q3:数字人的生产运营环节如何降本增效?

陈磊:数智人作为交互智能的新入口,面临的挑战很大。要想实现数字人在行业或使场景里快速落地,就要对数字人的生产制作流程、技术能力等方面提出更高的要求。

比如最近,腾讯云智能上线一个新的生产管线,管线里除了精品数字人之外,还包括小样本数智人。客户可以上传3—5分钟左右的视频,就能生成一个属于自己的数字分身。要想实现每个人都能打造自己的数字分身,一定是在它具备低成本、高效率的生产模式下,才会有更强的覆盖性。

在训练方案上,腾讯云智能数智人更偏爱小模型,采用了 5 亿级别的小参数量的多语言预训练模型“神农 MShenNonG”,以小博大的方式,实现成本控制。

翁冬冬:目前,行业更多思考的是如何通过降低成本推动数字人的普及。现在是一个产线迭代的时代,数字人最初出现是为艺术服务,但到了工业化生产阶段,行业需要思考的是,如何将个性化的生产经验固化到AI算法,让数字人变得更容易制造,更容易使用。

Q4:数字人背后的核心技术支撑是什么?

陈磊:多模态交互是数智人背后的核心技术支撑,各家公司都在强调这项技术。与业内同类产品相比,腾讯云智能数智人在该项技术上拥有多项差异化优势。

具体而言,腾讯云智能数智人融合了 ASR、TTS、NLP、计算机视觉、知识图谱等全栈式的 AI 底层能力。相对来说,在中小企业里面,具备全栈式能力的还是少数。而且,如何更好地将这些全栈型能力整合在一起更富有挑战。将这些能力融合在一起,才能让数智人拥有强大的表现力、识别力和感知理解能力。

Q5:数字人下一个技术的突破点在哪里?

翁冬冬:数字人真正的核心技术是AI,已经是行业目前比较清晰的一个认知,下一阶段大家需要突破的目标是“如何让数字人变得更像一个人”。这将取决于内外两个方向。“外在分为静态的像和动态的像,因为其实在真正交流的时候,情感传递更多是由动态的表情、姿态和动作来完成,这些呈现和交流内容密切相关,很难通过前期的预制动画把它完成,未来需要AI算法和更智能的“动作引擎”来指导数字人的反应。在内在层面,又分为语音交互和非语音交互两个部分,下一个突破点是让数字人不再局限于答录机,而是像人一样思考去升级反馈问题。

我认为到2023年的年底,甚至不用捏脸,只需要一张照片就可以生成数字人,预计明年数字人将会更大众化。

陈磊:我每天都能看到数字人技术的变化,从底部的三个引擎,形象、交互、驱动引擎,包括上游的设备,每一层都是百花齐放的状态。

目前大多数的数字人企业是通过文本输入,通过标签化的手段加入动作去驱动数字人。还没有实现通过输入文本指令,就可以自动化地结合情感去表达。在自然度、便捷度上还有提升空间。

从整体的内外部趋势看,数智人会进入大规模的应用期,加速转化为现实生产力,无论是消费级还是企业服务赛道都能创造很大的商业价值。

Q6:数字人距离发展至“完全体”还有多久?

翁冬冬:目前无法预测,现在的数字人属于离身智能,为了解决某个任务去研发制作的,不能把它当做智能体去看待。虽然数字人越来越具备“人”的行为和功能,但距离它有人的意识和智能,还是遥遥无期。

由于现在可选择的方向比较多,实现手段和技术多,更新速度快,行业仍不够成熟。希望大家能走慢、走稳,只有更细致的打磨和挖掘,才能把这条路走的更长远。

陈磊:越是接触行业越觉得难以预测,在ChatGPT出现之前,我认为对话智能做到现在的程度已经超出认知,给我们的带来极大的便利,但让它自己去创造内容还是无法实现的。

Q7:当下数字人产业发展到底有多少真实的市场需求?

冯莎莎:目前看政策很热闹,但距离落地还有一定的时间,2023年将是很多政策实施落地第一年。

从市场的角度,2022仍然是数字人的培育年,大部分企业都服务B端客户,同时也在教育C端市场。明年可能是行业的分水岭,企业仍需要具备核心技术和内容创新能力,保证自己在数字人赛道上的竞争力。

陈磊:以腾讯云智能数智人举例,覆盖了10+行业领域以及50+的应用场景,包括银行虚拟客服、虚拟坐席,保险公司的AI培训师、AI讲解师,以及文旅行业的AI导游等等,我们在每一个维度上都做了应用,市场需求还是很多的。

Q8:从国内数字人企业分布来看,数字人的市场空间如何?

冯莎莎:我们通过对“数字人加速器”多家企业进行调研,数字人在营销方向应用最多,其次是文娱、文旅以及直播带货,以及金融场景,这些领域在商业化变现方面都做的很成功。

大家也能明显地感觉到数字人服务朝着脱虚向实的方向发展,在行业里面产生了实实在在的价值。

陈磊:在金融场景,腾讯云智能已在某金融机构落地了 3000+ 以上的数智人客户服务,辅助传统人工客服工作,由数智人 + 对话式 AI 帮助解答用户问题。

Q9:数字人在传媒领域的使用效果如何?使用场景有哪些?

申鹏:过去从文案撰写、找主持人、拍摄再到后期剪辑,可能需要一天时间去制作2分钟的视频,现在用时不到5分钟就能生成一段视频。

虚拟主播“小N”在世界杯期间吸引了许多球迷和观众,最高峰值点击率有几十万,反响很高。未来希望它能够和VR、AR融合,走出演播室。我们还希望“小N”能成为一个内容UI界面,不仅能够播报内容,还可以和用户互动,成为一个高度拟人化的渠道。

陈磊:针对播报场景腾讯云智能研发了一些新产品,仅3-5分钟就可以打造出一个数智人,目前我们的管线已经达到这样的水准。后续,腾讯云智能数智人也会将客户输入的文本

、语序或语义,去自动找到合适的动作,实现自动化植入,这将是以后的重点工作。

Q10:对数字人产业的未来畅想?

冯莎莎:第一个关键词是“标配”,数字员工将成为每一家企业的“标配”,数字人将会赋能千行百业。其次,在企业经营层面,“成本和效率”也成为需要考虑的关键问题。第三是“未来可期”,在政策不断的落地的当下,数字人行业呈现欣欣向荣的状态。

翁冬冬:第一个关键词是“优雅”,数字人应该特别易于使用,不需要调整太多参数就可以“优雅”地使用;第二是“经济”,物美价廉的数字人在行业里才有更大的生存空间;第三是“无所不在”,未来,数字人存在于社会的方方面面,所有人都在使用。

陈磊:第一个关键词是“平民化”,数字人的生产周期、成本都应该是很亲民的价格;第二是“场景化”,目前数字人还处于行业早期,未来需要从场景出发,找到并解决客户在实际的落地过程中遇到的问题。

申鹏:第一个关键词是“真实”,作为媒体信息的传递者,虚拟主播要能够打动观众,无限趋近于可控制的真实;第二是“便利”,比如数字人能够与手机摄像头融合,在用手机拍摄视频的时候就可以直接生成虚拟主播;第三是“智能”,数智人未来的方向是更加形象化、更加拟人化,给观众提供更真实的体验。

了解详细产品信息,快戳阅读原文联系我们

腾讯云智能生态计划

腾讯云智能,依托腾讯优图实验室、腾讯AILab、腾讯多媒体实验室、微信智聆、微信智言等腾讯顶级实验室的产品和技术能力,持续引入生态合作伙伴,共建智能生态。通过授权认证、商机共享、技术共建、平台助力、品牌升级、标杆打造等合作形式,帮助合作伙伴和客户高效打造针对性的解决方案,助力各行各业的数字化和智能化转型。

END

更多AI资讯,你可能感兴趣

《数字人产业发展趋势报告》发布,AI技术发展推动数字人智能化升级

腾讯云数智人亮相中国国际人工智能领袖峰会,数智人正服务于千行百业

WAIC 2022  | 跨界对话:人工智能如何实现“向上向善”

文章来源于腾讯云开发者社区,点击查看原文