6月21日,在联合国教科文组织驻华代表处、中国文物信息咨询中心(国家文物局数据中心)、中国文化遗产研究院的指导下,腾讯SSV数字文化实验室与腾讯研究院联合发起“探元计划2023”。

探元计划2023,面向人工智能、数字孪生、沉浸式感知交互等创新技术群,聚焦文物、非遗、传统文化艺术等传统文化应用场景,征集、遴选创新技术解决方案;腾讯投入千万级资金,牵引内部近10个核心技术团队,推动“文化+科技”解决方案的共创落地。

访谈专家:

沈浩:中国传媒大学教授、博士生导师,媒体融合与传播国家重点实验室媒体大数据中心首席科学家,中国市场信息调查业协会副会长,探元计划2023特邀专家

采访人:

中国传媒大学文化产业管理学院 田卉、刘江红

腾讯研究院社会价值创新研究中心 孙怡

一、关于“AI大模型+传统文化”能够碰撞出什么样的火花?

关于AI大模型与传统文化领域的碰撞,我认为有四个判断要点。一是二者融合产物的“形式与内容”;二是生成物的文化属性与艺术质感;三是生成物的版权;四是文化相关行业的劳动就业。

如果按照这个原则来看AI生成内容,目前还存在以下情况:

第一,需要认识到,AIGC存在“形式大于内容”的问题。尤其在面对需要逻辑应对、涉及专业知识或最新信息的任务时,AI大模型产出的内容很可能是缺乏事实核查的“虚假信息”。

第二,目前AI大模型能够以极快的速度创作内容,带来了文化产品数量的海量增长,但这些生成物是否能够保持文化属性或艺术美感?这一点值得商榷。如,AI大模型生成的很多数字藏品,仅是文化元素的模式化拼贴,其艺术审美和文化价值大打折扣。

第三,版权是文化产业化的生命线,而利用AI大模型生成的文化内容,存在无法确认“自然人创作者”与“人工智能创作者”贡献度评估的问题。如在“Midjourney案”裁定中,美国版权局拒绝对ChatGPT类产品生成内容进行版权保护。目前,我国对于生成作品的著作权归属也未有明确的法律规定。

第四,目前生成式AI可能会带来失业问题,但也会创造出类似“提示工程师”等新的职业,打破文化创意行业门槛,带来“平民化”或“民主化”发展趋势。比如,Stable Diffusion、Midjourney等AI生成工具,任何一个赋有想象力的人,都可以使用自然语言创作出此前技术层面难以实现的文化艺术作品,可以达成“创意民主化”“人人皆可创作”的图景。

基于以上利弊,我们把对AI大模型与传统文化碰撞的思考,带入文物数字化的应用场景。AI大模型是“大数据+大算力+强算法”结合的产物,能够存储和学习大量的文化资源数据并进行独特的内容呈现,因此,基于国家文化数字化战略背景的文化资源要素上链和上线,将文化数据信息导入模型,就能实现例如探索溯源三星堆历史。

AI大模型有助于提升传统文化数字孪生的效率和质量。但从目前来看,AI大模型只能简单地回答问题,难以生成故事序列。因此,如何利用AI生成中国文化主题的图像、音频、文本故事序列,如何挖掘和理解文化的内在价值,并据此进行创新性创造,展现高超的叙事水平仍是难题。

未来,如果畅想生成式AI应用于文化遗产展览场景,观众只需通过扫描二维码便可与AI进行对话,就能够获得 AI基于历史文献和研究数据库自动生成的虚拟场景和创意内容,以此给予观众沉浸式的交流和独特的互动体验,我认为这还是具有一定可行性的。

二、如何利用AI大模型提升文化资源要素管理和应用的质量和效率?

2022年,我国推进实施“国家文化数字化战略”,推进文化数字化,文化资源采集是前提。虽然我国科技企业拥有海量的互联网数据,但数据类型不够全面,文化数据的上线上链标准还不统一。AI大模型通过数据复制、学习和训练,可以提升文化资源要素的管理和应用效率。

由于消耗的资源体量巨大,OpenAI会让用户通过订阅的方式来提供更高的访问优先级、更短的响应时间以及更高版本的模型等,来尽可能释放算力资源,算力资源消耗较大的项目也将调整经营策略进行收费。国内大型企业为了迅速进入赛道,也竞相推出自己的大模型,由此带来的能源消耗与碳排放压力是巨大的。

因此,在拥抱科技的同时,也建议理性对待大模型的开发使用问题,不同大型企业可以在某种程度上进行数据的共享与资源的整合。在稳步进化的同时,也需要避免过度竞赛所带来的不必要消耗。同时,生成式AI领域的创新发展也意味着在软硬件关键技术上实现突破,需要有产业政策的支持。

三、如何创作独具“中国特色”,应用于文化领域的AI行业大模型?

据数据统计,国内已经出现了70多个所谓的AI大模型。但从技术应用的角度来看,中国的很多大模型并没有发生革命性的迭代,需要考量能否创造或形成在文化垂类领域的独特性。ChatGPT对众多行业都是革命性和颠覆性的,对于文化领域更是触及到了核心区域,也可能会带来一些相关风险,例如AI大模型在中文文字理解上弱于英文,且在翻译过程中存有偏差。因此,可能为中文母语用户带来认知偏差,为非中文母语用户在理解中国文化时造成理解困难和理解错误。

此外,目前国外的AI大模型在编码与训练过程中隐含种族、性别、国别、党派等不公正因素,进一步带来社会偏见与刻板偏见,致使存在社会极端情绪风险、价值观风险等意识形态风险。我国如需创作独具中国特色的AI大模型,至少需要在以上层面扭转偏差并提供价值。

值得注意的是,从数据资源角度来看,英语目前仍是全球通用语言,各国资料数据均会有对应英语版本,英语大模型训练的语料数据远高于中文,虽然我国发展人工智能具有海量数据和用户基础,但丰富的传统文化沉淀并未实现数字化,致使可供AI大模型训练的中文语料有限。比如,为训练GPT,OpenAI雇佣了肯尼亚劳工进行数据标注产出了海量的训练数据。而中国的数据资源相对较少,且成本相对较高,这在一定程度上影响了大模型的发展。

从技术水平差异来看,中国目前正在相关行业的技术内容上遭受美国“卡脖子”的限制,训练大模型所需的硬件发展创新遇到一定的瓶颈。从产业全生态来看,美国AI产业生态较为成熟,涵盖了从数据资源到算法创新的全链条,中国初步涉足大模型领域,未来需要进一步加强产业链上下游的合作和创新。

四、AIGC生成的新内容是否会鼓励和激发文化创新?

AIGC主要是通过复制、学习和训练现有的内容,利用算法和数据分析生成新的内容,可能会面临创造力和创新性的限制。因此AIGC在激发文化创新层面,以原真性复原和创新性展示为主,可以为文化的传承提供新的媒介和途径。

从文化保护的角度来看,AIGC在“习得”了大量的传统文化语料之后,对于某些濒临失传的传统文化形式,可以以数字化的形式还原其内容,使这些传统文化内容或形式得到更好的保护。AIGC生成的内容可以作为一种媒介形式,为传统文化的传承提供新的途径,如虚拟文化展览、文化主题的互动游戏等,这样的优势是可以吸引更多年轻人参与到文化传承中。

在“合理使用”的范围内,可以通过AI为传统文化注入一些新的表达方式,比如网上已经有的用模型将二维码和具有文化特色的水墨画等结合起来生成可扫码的图片,不仅能够为实用的二维码增色,还给传统文化注入了新的表现形式。与之类似的想法,还有利用AI技术将传统文化特色的作品进行数字化处理,用于保护和保存传统文化的珍贵资源;利用AI翻译技术将文学作品翻译成不同语言,促进传统文化的国际传播和交流等等。

文化作品和观众之间连接的本质是内在的价值共情,AIGC无法取代人类创作的思想独特性,但AIGC可以充当优秀的“协助者”,通过其擅长的“头脑风暴”式的内容生成方式,为创作者进行文化创新提供更多元的思路和切入点。总之,对待AIGC与文化创新,我们需要保持一定程度的理性克制,确保AI训练不会削弱艺术创造的可持续动力,不会阻碍人类文明的源远流长。

五、AI大模型与传统文化的创新机会,未来对于文博机构从业者、文化内容创作者、文化科技企业等会带来哪些范式变化或机遇挑战吗?

前面提到的“Midjourney案”中,AI绘画已经开始和人类绘画师、插画师“抢饭碗”,威胁到他们的职业发展。在影视领域,有些后期公司对AIGC技术的运用也已经覆盖全流程,通过提示驱动AI参与基于IP形象训练的衍生品设计与开发、影视宣发等工作。动漫和游戏行业及其从业者们,纷纷尝试基于AIGC技术的改变。长远来看,AI替代文化行业的特定职位甚至颠覆行业生产生态的潮流势不可挡。

需要强调的是,AIGC的普及虽然意味着内容创作门槛的降低,但决不意味着对内容工业化的颠覆。AI生成器是一种知识的“催化剂”,特定内容的生成可以完全由AI生成或主导生成,但原创性和源头性的专业内容生成仍然离不开兼具专业知识、技术经验和工业能力的顶尖创作者。

大模型通过深度学习等技术,可以对文化遗产进行数字化保护和修复,使得文化遗产得到更好地传承和利用。对于文博机构从业者来说,大模型的发展将促进数字化转型和文化创意的创新。AI大模型的应用也会改变传统文博发挥收藏、展览和教育功能的方式,需要从业者具备相关的技术和创新能力。

AI大模型不仅可以为文化内容创作者带来灵感,其不断的发展也将提供更多的创作工具和方式。提供便利的同时也伴随着新的挑战,因为大模型的使用可能会导致创作者的作品缺乏独特性和原创性,需要在创作过程中保持创作者的个性和创新能力。

通过利用大模型开发智能化的文化产品和服务,文化科技企业可以提供个性化的文化体验和定制化的文化产品,提高用户体验和文化消费的质量,能够带来更多的商业机会和创新空间。

六、AIGC的创作,如果仅是“编排方式创新”是否还能继续享有版权保护?

基于大模型一键生成“编排式创新”产物,是否应该享受版权保护的问题应该还有待商榷。如学术论文写作,知名机构如《科学》杂志表示不接受ChatGPT作为论文的作者,AI暂时没有被公众广泛地认为是创作者或创作者的合作者,AIGC到底应归结于人类的创意和还是机器的创意到现在尚未有定论。区块链技术可能是进行确权和版权保护比较好的选择,但当下中国没有公链。但有一点,内容是否为AI生成是可以通过算法检测到的,类似于用“魔法打败魔法”。

七、人工智能技术进入大众传播、文化领域,应该如何规范“真实性”?

这就涉及到人工智能技术在图像、视频、音频处理和合成方面的应用,包括图像编辑、人脸合成和视频合成等等,这些技术成熟之后便有可能生成一些以假乱真的内容。

至于真实性的规范,一方面我们可能需要研发更先进的人工智能技术用于检测AI生成的图像和视频,比如开发一些真实性检测算法,用来标记这些内容。另一方面我们可能也需要法律政策的约束来禁止和打击虚假信息的传播。

为确保人工智能技术在大众传播、文化领域的应用是真实可信的,是保障社会良性发展和文化传承的重要一环,我们需要加强数据管理和隐私保护,防止数据被滥用和泄露。需要对大众进行AI技术的普及和宣传,提高公众的科技素养和媒体素养,让人们更加理性地对待AI技术和文化领域的应用。同时,需加强社会监督和公众参与,推动AI技术的公开透明和民主参与,避免出现利益输送和信息不对称的问题。

八、您曾经表达对“技术向善、技术为善”的期待,腾讯也曾经发布过“科技向善”的理念。针对“探元”计划,您有哪些期待和建议吗?

“探元”计划是一个很好的尝试,旨在推动解决文化数字化道路上的一些“卡脖子”问题,将中华优秀传统文化与科技创新相结合,实现多方共创和融合发展。

我们应当始终坚持以“科技向善”为核心,重点关注项目所带来的社会价值和对中华文化传承的贡献。要鼓励各类企业、科研机构、组织、人员等共同参与到其中,拥抱变化,与时俱进,共同推动我们中华优秀传统文化与科技创新的融合发展。

同时也要注意知识产权保护问题,为参与项目的各方提供知识产权保护指导,确保创新成果得到有效保护。

最后祝“探元”计划能够再次取得具有开拓性的进展,为中华文化传承与创新发展做出更大的贡献。

(本次访谈致谢:中国传媒大学鲍赫、刘姝秀)

文章来源于腾讯云开发者社区,点击查看原文