数字水印作为一种新兴的技术方案,在版权保护和溯源中具有广阔的应用前景。本周的技术解码就由狄冲老师为大家解密图像和视频数字水印的相关内容
水印作为版权声明和保护的手段在日常生活中随处可见。传统水印多为浮现式水印,通过技术手段将水印信息直接叠加在载体上,具有实现方便,嵌入灵活等特点。
但是,浮现式水印隐蔽性差,在影响画面观感的同时也容易通过裁剪、遮挡等简单操作对水印信息进行破坏。隐藏式水印(也称为数字水印)作为一种新兴的技术方案,能够在人眼(耳)几乎无法察觉的情况下将水印信息秘密嵌入到音频、图像或视频等多媒体载体中,在版权保护和溯源中有着广阔的应用前景。本文主要介绍图像和视频数字水印的相关内容。
对于一种数字水印方案,不可察觉性和鲁棒性是最为重要的性能指标。其中,不可察觉性要求数字水印的嵌入尽可能小地对载体信息造成影响,在提高观感的同时使得嵌入操作更具隐蔽性;而鲁棒性则要求水印能够抵抗多种攻击,包括图像的缩放裁剪、视频的压缩转码等编辑操作。一般而言,不可察觉性和鲁棒性是相互矛盾的,一个指标的增强往往会造成另一个指标的下降,在具体实现中需要采取一定的策略以达到两项指标的均衡。此外,数字水印的容量、安全性以及嵌入效率也是在数字水印方案设计时需要考虑的技术指标。
根据信息嵌入方式的不同,可将数字水印的技术方案分为空间域嵌入方案和变换域嵌入方案。最低有效位(Least Significant Bit, LSB)方法是最经典的空间域嵌入方案之一,通过直接修改图片像素值的最低有效位实现水印信息的秘密嵌入。LSB方法对图像视觉质量的影响很小,但是鲁棒性也很低,简单的JPEG压缩操作就能完全破坏掉嵌入的水印信息。在变换域方案中,离散傅立叶变换(Discrete Fourier Transform, DFT)、离散余弦变换(Discrete Cosine Transform, DCT)以及小波变换(Wavelet Transform, WT)都是常用的技术手段。其中, DFT和DCT将图像空间域信号转化为频域信号,把图像的灰度分布函数变换为图像的频率分布函数,具有良好的仿射变换不变性。利用DFT或DCT,可以根据水印信息按需调整频谱系数,从而实现水印在频域上的嵌入操作。此外,WT能够有效地从信号中提取信息,通过伸缩和平移等运算功能对函数或信号进行多尺度细化分析,从而使得频谱能量更为集中,优化水印嵌入性能。因此,基于变换域的数字水印嵌入方案具有较强的鲁棒性,能够抵抗常见的音视频操作和工具,但实现过程较为复杂,嵌入过程计算量大,需要十分谨慎地制定嵌入策略。
进一步从水印的提取方式进行划分,数字水印可分为盲水印和非盲水印。盲水印是指水印的提取无需原始载体参与,可从嵌入后的载体中直接提取水印信息,而非盲水印的提取则需要原始载体的辅助,从而对数据存储有着更高的要求。
我们提供了一种基于变换域的盲水印嵌入方案,水印嵌入和提取过程如下图所示:
下图展示了采用上述方案嵌入腾讯LOGO信息前后的图像:
为了更客观评估方案性能,以两段实际视频为例(测试视频-1和测试视频-2),给出详细的测试报告。
水印分为图像水印和文本水印, 其中:
图片水印:
文本水印:
字符串"Tencent"
由于图片水印和文本水印嵌入方式相同, 且图片水印往往需要嵌入更多的信息, 故以图片水印(100x19腾讯logo)为例, 分析水印嵌入操作对视频质量(PSNR和SSIM)造成的影响。
除水印嵌入操作外,转码参数的设置也会造成视频质量的降低,因此以仅按照参数(-vcodec libx264 -x264opts bitrate = 4000)转码后视频的PSNR和SSIM结果作为评估水印嵌入操作对视频质量影响的baseline。
PSNR:
SSIM:
结果分析: 分析以上结果, 可得出以下结论: (1) 与Baseline相比,水印嵌入操作均会在一定程度上对视频质量(包括PSNR和SSIM)造成一定影响, 但整体在可接受范围内; (2) 通过增加水印嵌入帧间的间隔可以有效提高视频质量; (3) 水印嵌入力度的加大会对视频质量造成更大的影响。
进一步测试水印的解析效果,检出标准为:
·图片水印: 客观评估水印解析效果, 以误比特率为标准,设定检出条件;
·文本水印: 检出标准为所恢复字符串与嵌入内容完全一致;
以下是误比特率与主观辨识度上的对应关系:1 - bits_error = 0.5
1 - bits_error = 0.6
1 - bits_error = 0.7
1 - bits_error = 0.8
1 - bits_error = 0.9
1 - bits_error = 1.0
观察可得, 当1 - bits_error >= 0.8时, 水印可辨识度较高。因此, 以1 - bits_error >= 0.8为检出标准。
图片水印检出率:
文本水印检出率:
结果分析: 对于图片水印, 在测试视频实验结果中, 可得出如下结论:(1) 当嵌入频率为1(即每帧嵌入)时, 水印恢复情况较为理想, 且对抗缩放能力较强, 解析得到的水印图片中半数以上的水印可以轻易辨识(1 - bits_error >= 0.8);(2) 当嵌入频率为30时, 水印恢复受到较大影响, 在水印嵌入力度为64的情况下, 仅有30%左右水印可以轻易辨识;(3) 加大水印嵌入力度可以在一定程度上提高水印恢复效果。
对于文本水印, 受水印嵌入频率和强度影响与图片水印类似。二者嵌入方式本质上没有区别, 但文本水印对误比特率的要求更高, 无损恢复要求1 - bits_error > 0.92。因此在水印嵌入强度和频率都较低的情况下成功恢复的难度较高。
编码参数对水印恢复的影响: 以向测试视频-2添加图片水印为例, 分别测试编码参数中, CRF和Bitrate对水印恢复情况的影响。
横轴为CRF/Bitrate编码参数, 纵轴为编码后视频解析得到图片水印的检出率(以1 - bits_error >= 0.8为标准)。
结果分析: 从以上测试结果中可以发现, 水印解析效果受视频编码质量影响。总体来说, 视频质量越高, 水印解析效果越好。
除以上客观性能数据外, 视频内容的视觉观感也十分重要。由于水印信息的嵌入是帧间独立的, 连续的水印嵌入操作很容易造成视觉上的闪烁效应, 隐蔽性差的同时还会降低视频的观看体验。因此, 在实际的使用中, 需要谨慎地指定上层策略选择合适的视频帧进行水印嵌入, 并通过控制水印嵌入的力度来保证数字水印的解析效果。
使用Tips:
以下是对使用细节的补充, 所提供数字水印方案:1. 支持文本水印和图片水印的嵌入, 以满足不同应用场景的需求。例如在需要进行版权声明的场景, 可选择图片水印进行嵌入; 可将用户ID作为文本水印嵌入到视频中用于视频溯源。2. 支持上层控制嵌入帧选取策略, 以及自定义水印嵌入力度, 可根据实际需求在视频质量和水印恢复质量间作出平衡。当对视频质量和观感要求比较高时, 可适当减少水印嵌入频率并降低嵌入力度; 反之, 当需要保证水印解析效果时, 则需要加大水印嵌入频率或提高水印嵌入力度。3. 实际测试场景中,在1080P视频上能够满足视频直播、点播等应用场景的需要; 可抵抗一定程度的视频转码, 缩放等操作。
视频云视频智能团队积极携手内容制作方、版权方以及游戏平台方,推进版权保护技术升级。例如:在影视后期制作环节,特别是素材审核,存在着普遍的版权保护需求。腾讯影业旗下“智慧影视”解决方案立足于为影视各环节提供安全高效的技术方案,将与视频云“智能编辑”基础产品一道,积极推动数字版权保护方式落地与升级。
参考文献:
- Begum, Mahbuba, and Mohammad Shorif Uddin. "Digital Image Watermarking Techniques: A Review." Information 11.2 (2020): 110.
- Shih, Frank Y. Digital watermarking and steganography: fundamentals and techniques. CRC press, 2017.
- Bansal, Neha, et al. "Comparative analysis of LSB, DCT and DWT for Digital Watermarking." 2015 2nd International Conference on Computing for Sustainable Global Development (INDIACom). IEEE, 2015.