


单击此处编辑母版标题样式,,单击此处编辑母版文本样式,,第二级,,第三级,,第四级,,第五级,,,*,第12章 信息隐藏技术,第12章 信息隐藏技术,12.1 信息隐藏概述,,12.2 信息隐藏技术的分类及应用领域,,12.3 数字图像水印技术,,12.4 数字文本水印技术,,12.5 数字语音水印技术,,12.6 数字视频水印技术,,,12.1 基 本 概 念,12.1.1 信息隐藏的基本概念,,1.信息隐藏技术的发展,,信息隐藏的发展历史可以一直追溯到“匿形术(Steganography)”的使用匿形术”一词来源于古希腊文中“隐藏的”和“图形”两个词语的组合匿形术”与“密码术(Cryptography)” 都是致力于信息保密的技术,但两者的设计思想却完全不同密码术”主要通过设计加密技术,使非授权者不可读取保密信息,但是对于非授权者来讲,虽然他无法获知保密信息的具体内容,却能意识到保密信息的存在而“匿形术”则致力于通过设计精妙的方法,使得非授权者根本无从得知保密信息是否存在现代信息隐藏技术发展主要为了应对数字化信息的大量出现,以及因特网快速发展条件下信息保护的问题随着因特网的日益普及,多媒体等数字化信息的交流已达到了前所未有的深度和广度,其发布形式也愈加丰富了。
人们如今可以通过因特网发布自己的作品、重要信息和进行网络交易等,但是随之而出现的版权和信息安全问题也十分严重:如作品侵权更加容易,篡改也更加方便人们越来越认识到因特网时代知识产权保护的重要性,信息隐藏学就是为达到信息保护目的而诞生的一门新兴交叉学科信息隐藏学作为隐蔽通信和知识产权保护等的主要技术手段,正得到广泛的研究与应用2.信息可隐藏的原因,,信息之所以能够隐藏在多媒体等数字化数据中,主要有两方面的原因:,,(1)多媒体等数字化信息本身存在很大的冗余性,从信息论的角度看,未压缩的多媒体等信息的编码效率很低,所以将某些信息嵌入到多媒体等信息中进行秘密传送是完全可行的,并不会影响多媒体等信息本身的传送和使用2)人眼和人耳本身对某些信息都有一定的掩蔽效应,如人眼对灰度的分辨率只有几十个灰度级,对边沿附近的信息不敏感等利用人体感官的这些特点,可以很好地将信息隐藏而不被察觉信息隐藏技术中涉及到的主要对象包括待隐藏的信息、信息的载体、带有秘密信息的载体,具体内容如下:,,(1)信息隐藏技术中待隐藏的信息称为秘密信息(SecretMessage),该信息可以是版权信息或秘密数据,也可以是一个序列号;,,(2)用来承载秘密信息的公开信息称为载体信息(CoverMessage),如视频、音频、文本片段;,,(3)隐藏有秘密信息的公开信息称为隐蔽载体(StegoCover),如带有版权签名的视频、带有秘密文字的图片和音频等。
4.信息隐藏技术的特性,,信息隐藏不同于传统的加密,因为其目的不在于限制正常的资料存取,而在于保证隐藏数据不被侵犯和发现因此,信息隐藏技术必须考虑正常的信息操作所造成的威胁,即要使机密资料不易被正常的数据操作(如通常的信号变换操作或数据压缩)所破坏为保证信息隐藏和不影响正常操作的目的,信息隐藏技术需要具备以下特性1)鲁棒性(robustness):指不因数据文件的某种改动而导致隐藏信息丢失的能力这里所谓“改动”包括传输过程中的信道噪音、滤波操作、重采样、有损编码压缩、D/A或A/D转换等2)不可检测性(undetectability): 指隐蔽载体与原始载体具有一致的特性例如具有一致的统计噪声分布等,以便使非法拦截者无法判断是否有隐蔽信息3)透明性(invisibility): 利用人类视觉系统或人类听觉系统属性,经过一系列隐藏处理,使目标数据没有明显的降质现象,且隐藏的数据无法人为地看见或听见4)安全性(security): 指隐藏算法有较强的抗攻击能力,即它必须能够承受一定程度的人为攻击,而使隐藏信息不会被破坏5)自恢复性: 由于经过一些操作或变换后,可能会使原图产生较大的破坏,如果只从留下的片段数据仍能恢复隐藏信号,而且恢复过程不需要宿主信号,这就是所谓的自恢复性。
1.信息隐藏嵌入过程,,信息隐藏嵌入过程实际上就是一个数字化信号的变换过程,主要步骤包括:,,(1)对原始主信号(载体信息)作信号变换;,,(2)对原始主信号(载体信息)作感知分析;,,(3)在步骤(2)的基础上,基于事先给定的关键字,在变换域上将签字信号(秘密信息)嵌入主信号,得到带有隐藏信息的主信号(隐蔽载体)信息隐藏的嵌入过程如图12.1所示图12.1 信息隐藏的嵌入过程,,,,图12.2 信息隐藏的检测过程,,,,信息隐藏技术按照嵌入方法的不同,可分为空域(SpatialDomain)信息嵌入方法和变换域(TransformationDomain)信息嵌入方法两类,具体内容如下:,,(1)空域信息嵌入方法这类方法也被称做时域信息嵌入方法,主要优点是运算相对简单,信息嵌入速度快,计算量小,对于主信号的几何变换、数据压缩等基本操作具有一定的抵抗能力,但总体上抗攻击和抗破坏能力比较脆弱,对于信号滤波、加噪等操作的鲁棒性较差2)变换域信息嵌入方法这类方法也被称做频率域、频域信息嵌入方法,这类技术主要是通过修改主信号某些指定的频域系数来嵌入数据的常用频率域包括傅立叶变换(FFT)域、离散余弦变换(DCT)域、离散小波变换(DWT)域等。
信息隐藏技术一般选取信号中频区域上的系数来嵌入签字信号,从而使之既满足不可感知性,又满足对诸如失真压缩等操作的鲁棒性其主要原因在于低频分量包含了图像的主要信息(如亮度),低频区域系数的改动可能会影响到主信号的感知效果,而高频系数容易被破坏,因此中频信号更符合信息隐藏技术的要求12.2.2 信息隐藏技术的应用领域,,1.版权保护(CopyrightProtection),,到目前为止,信息隐藏技术的绝大部分研究成果都集中在版权保护这一领域中,相关成果已经得到了应用信息隐藏技术在应用于版权保护时,所嵌入的签字信号通常被称做“数字水印(DigitalWatermark)”版权保护所需嵌入的数据量最小,但对签字信号的安全性和鲁棒性要求也最高,甚至是十分苛刻的为了避免混淆,应用于版权保护的信息隐藏技术一般称做“鲁棒型水印技术”,而所嵌入的签字信号则相应地称做“鲁棒型水印(RobustWatermark)”,从而与下文将要提到的“脆弱型水印”区别开来一般在版权保护领域所提到的“数字水印”则多指鲁棒型水印鲁棒型数字水印用于确认主信号的原作者或版权的合法拥有者,相关技术必须保证对原始版权的准确无误标识。
数字水印时刻面临着用户或侵权者无意或恶意的破坏,因此,鲁棒型水印技术必须保证对主信号可能发生的各种失真变换和各种恶意攻击都具备很高的抵抗能力与此同时,信息隐藏技术要求保证原始信号的感知效果尽可能不被破坏,因此实际应用中对鲁棒型水印的不可见性也有很高的要求如何设计一套完美的数字水印算法,并伴随以制订相应的安全体系结构和标准,从而实现真正实用的版权保护方案,是信息隐藏技术最具挑战性也极具吸引力的一个课题目前,一些数字水印方法已经在版权保护中得到应用,但是尚无十分有效的鲁棒水印算法3.扩充数据的嵌入(AugmentationDataEmbedding),,扩充数据包括对主信号的描述或参考信息、控制信息以及其他媒体信号等等描述信息可以是特征定位信息、标题或内容注释信息等,而控制信息的嵌入则可实现对主信号的存取控制和监测扩充数据可以是多种附属描述信息,例如针对不同所有权级别的用户存取权限信息,跟踪某一特定内容对象创建、行为以及被修改历史的“时间戳(TimeStamp)”信息等信息隐藏技术使得主信号无需在原信号上附加头文件或历史文件情况下附加扩充数据,记录主信号对象的使用权限描述、历史使用操作信息等,避免了扩充信息因为附加文件被改动或丢失造成的破坏,节省了传输带宽和存储空间。
扩充数据还可以实现在给定的主信号中嵌入其他完整而有意义的媒体信号,例如在给定视频序列中嵌入另一视频序列等信息隐藏技术通过扩充数据嵌入为多媒体信息的个性化剪裁提供了可能,可以按照用户需要提供不同的信息形式和内容,这种应用非常有意义,对用户极具魅力例如,在某一频道内收看电视,可以通过信息隐藏方法在所播放的同一个电视节目中嵌入更多的镜头以及多种语言伴音及字幕,使用户能够按照个人的喜好和指定的语言方式播放,这种方法在某种意义上实现了视频点播(VideoOnDemand,VOD)的功能,而其最大的优点在于减少了一般VOD服务所需的传输带宽和存储空间12.3 数字图像水印技术,12.3.1 数字水印技术的基本原理,,数字水印技术的基本原理是通过一定的算法将一些标志性信息直接嵌入到多媒体内容中,但不影响原内容的价值和使用, 而且不会被人感知或注意水印信息可以是作者的序列号、 公司标志、有特殊意义的文本、图形、图像标记等其作用是可用于识别文件、图像或音乐制品的来源、 版本原作者、 拥有人、发行人以及合法适用人对数字产品的所有权 数字水印技术包含嵌入水印和提取水印两个过程 下面给出通用意义下的数字水印嵌入和提取过程。
图 12.3 水印嵌入的一般过程,,,,图12.3中,图像的预处理包含图像为了保证水印嵌入算法的高效以及实用而采取的一系列变换,如图像为了适应人类视觉系统而进行的颜色模型的调整、 时频域转换等图像恢复则是指在将水印信号嵌入原始图像以后对原始图像进行恢复显示的过程, 使得它转换到我们通常所看到的时域信号, 或者转换到计算机所能进行一般处理的颜色模型中来在图12.3中最关键的部分是水印嵌入,也就是水印嵌入函数,f,的作用通常在水印嵌入的时候都是将水印信号转换成二进制码流嵌入到原始图像中, 如果二进制码为0,则对原始图像相应像素位进行一定处理;如果二进制码为1,则对原始图像进行另外的处理,这样做的目的是方便将来的提取过程我们用式(11-2)来表示嵌入函数作用其中,I,和,W,为经过预处理以后的数据,函数,B,是取水印图像的一位,,P,1和,P,2是分别对原始图像的相应像素位进行函数处理12.2),,,,在对水印图像提取水印信息以前需要先对水印图像进行必要的预处理在提取算法上,分为两种:一种是盲提取,也就是提取水印信息的算法在应用过程中不需要原始图像的参与;另外一种就是明文水印,也就是在水印信息提取算法中需要原始图像才能正确地提取出水印信息。
目前水印算法研究的重点越来越趋向于盲水印图像水印提取的一般过程如图12.4所示图 12.4 水印提取的一般过程,,,,图像水印技术是目前数字水印技术研究的重点,相关文章非常多,而且也取得了非常多的成就,但大部分水印技术采用的原理基本相同即在空/时域或频域中选定一些系数并对其进行微小的随机变动,改变的系数的数目远大于待嵌入的数据位数, 这种冗余嵌入有助于提高鲁棒性实际上,许多图像水印方法是相近的,只是在局部有差别或只是在水印信号设计、嵌入和提取的某个方面域有所差别下面我们分空域和频域两个方面分别加以介绍,给出一些算法11.3.2 空域的图像水印技术,,空域算法指的是实现数字水印嵌入和提取的过程全部在空域中完成,不需要进行频率域的变换 最早提出的空域算法就是著名的LSB(Least Significant Bits)方法,它是将水印信息安排在像素的最低位,也就是最不容易引起图像有较大视觉变换的位置 作为几个比较实用的软件包之一的Stego就采用了改变图像最低位信号实现图像水印的目的这样的算法鲁棒性不够强,目前对于这种方法提出了很多改进算法,Lippman曾经提出将水印信号隐藏在原始图像的色度通道中。
Bender曾经提出了两种方法,一种是基于统计学的“patchwork”方法,另一种是纹理块编码方法空域水印算法以其简洁、高效的特性而在水印研究领域占有一席之地,在过去的十几年中,水印的空域算法也层出不穷 其经典的LSB算法就是将水印信息放置在原始图像中对于人类视觉最不敏感的地方在空域中,通常选择改变原始图像中像素的最低位来实现水印的嵌入和提取下面用一个具体的算法来说明1) 嵌入过程 把水印信号经过颜色模型转换后再转化为二进制数据码流;原始图像同样经过颜色模型转换后,再将其每个字节的高7位依次异或;最后再用原始图像像素字节位异或结果与二进制数码流异或后写入其最低位如图11.5所示为基于LSB算法的水印嵌入过程图 12.5 基于LSB算法的水印嵌入过程,,,,(2) 提取过程 把待提取的水印图像(以下称为水印图像)经过颜色模型转换后每个字节8位依次异或,并保存其结果; 再将其结果每8位组成一个字节;最后得到的数据经过颜色模型转换后就得到水印图像如图12.6为基于LSB算法的水印提取过程图12.6 基于LSB算法的水印提取过程,,,,例如, 三个像素的原始数据为: ,,(00100111,11101001,11001000),(00100111, 11101000, 11001001), (11001000, 00100111, 11101001),,所存的水印数据为: 010001011,,嵌入过程计算:,,,将水印嵌入后, 像素数据变为: ,,(00100111, 11101001, 11001001),(00100111, 11101000, 11001000), (11001001, 00100110, 11101001),水印数据的提取过程:,,最后,提取出的水印数据为:010001011,,,,11.3.3 频域的图像水印技术,,频域算法与空域算法不同,指的是在嵌入或者提取水印的过程中,需要进行频域的变换操作,这样做的目的是增强水印算法的鲁棒性,使得图像在有损压缩和滤波后仍能很好地提取出水印信息。
NEC实验室的COX等人提出的基于扩展频谱的水印算法在数字水印算法中占有重要地位,这一算法提出了鲁棒型水印算法的几个重要原则:首先,水印信号应该嵌入数据中对人的感觉最重要的部分在频率域中这个重要部分就是低频分量,一般的图像处理技术并不去改变这部分数据其次水印信号应该由具有高斯分布的随机实数序列构成这样会使水印经受多拷贝联合攻击的能力大大增强NEC的实现思想是:对整幅图像做DCT(离散余弦变换)变换,选取除DC分量外的1000个最大的DCT系数插入由N(0,1)所产生的一个实数序列水印信号静止图像通用压缩标准JPEG(Joint Photographic Experts Group,联合图像专家小组)的核心部分是DCT变换,它根据人眼的视觉特性把图像信号从时域空间转换到频率域空间由于低频信号是图像的实质而高频信号则是图像的细节信息,因此, 人眼对于细节信息即高频信号部分的改变并不是很敏感,JPEG压缩通过丢弃高频部分来最大程度的满足压缩和人眼视觉的需要这里针对JPEG压缩标准提出根据DCT变换系数性质来植入水印的算法Cox等曾经提出了鲁棒型水印算法的重要原则:为了使水印强壮,水印信号应该嵌入原始数据中对人的感觉最重要的部分, 在频率域空间中,这种重要部分就是低频分量。
因为攻击者在破坏水印的过程中,将会不可避免地引起图像质量的严重下降, 所以,一般的图像处理技术也并不去改变这部分数据, 这样会使水印的鲁棒性大大提高但是此类鲁棒算法在实现水印信息嵌入低频系数的过程中却破坏了图像本身的质量而Turner也在其文章中提到将水印信息添加至图像中最不重要的位置,显然这样的水印算法鲁棒性不足,但是却能够保证图像质量最低限度的损失综合考虑这两类算法的优缺点,同时为了保证水印算法的鲁棒性和在嵌入水印信息后保证图像的质量不会受到大的损坏的情况下,基于DCT域水印算法将水印信息添加至图像的中频系数中采用中频系数的频域DCT变换水印嵌入的过程,主要包括颜色模型转换、频域FDCT变换、中频系数提取、水印信息嵌入、频域IDCT反变换和颜色模型恢复几个环节,具体嵌入过程如下:,,(1)图像和水印信息图像进行颜色模型转换,从RGB颜色空间到YUV颜色模型空间;然后将经过颜色模型转换后的图像分成8×8的块2)对每一个8×8图像块用滤波矩阵进行滤波实现FDCT(快速离散余弦变换)离散余弦变换是将信号从空域转换到频域的一种方法3)提取原始图像的中频系数,即将原始图像的频域系数经过量化后自适应选取中频系数作为将来嵌入水印信息的载体位。
同时选取水印信息图像频域系数的低频和中频部分,并将其转换为二进制码流,作为嵌入的对象4)将水印信息嵌入到原始图像信息中,具体的嵌入过程是,先判断水印信息二进制码,如果其值为1,而且待嵌入水印系数比其下一个系数的值小,则交换这两个系数的值;如果其值为0,而待嵌入水印系数比其下一个系数的值大,则交换这两个系数换句话说就是要保证嵌入1时,此系数大于下一个系数值,嵌入0时相反5)最后对嵌入水印信息的原始图像进行反离散余弦变换(IDCT),再将其从YUV颜色模型空间转换到RGB颜色空间,最终得到了嵌入水印后的图像频域DCT变换中频系数水印嵌入的具体算法流程如图12.7所示图12.7 嵌入水印过程,,,图12.8 提取水印过程,,,图12.9 基于DCT方法提取水印图,,,(a),,(b),,,,图12.10 中心裁剪75%后提取水印图,,,,图12.11 图像旋转后提取水印图,,,,图12.12 JPEG压缩后提取水印图,,,图12.13 亮度、对比度调整后提取水印图,,,,数字水印尚未形成一个完善的技术体系,每个研究人员的介入角度各不相同,所以研究方法和设计策略也各不相同,但都是围绕着实现数字水印的各种基本特性进行设计的。
同时,随着该技术的推广和应用的深入,逐步引入了其他领域的先进技术和算法,从而完备和充实了数据水印技术例如在数字图像处理中的小波变换、分形理论,图像编码中的各种压缩算法等等12.4 数字文本水印技术,12.4.1 数字文本水印技术的一般原理,,现在的印刷品的电子化传送可以通过在线数据库、 电子图书馆、CD-ROM等方式,这就使得版权的保护尤为重要目前数字水印的研究大多数集中在图像视频和音频方面文本数字水印的研究有限最原始的文档,包括ASCII文本文件或计算机原码文件, 是不能被插入水印的,因为这种类型的文档中不存在可插入标记的可辨认空间(Perceptual Headroom) 然而, 一些高级形式的文档通常都是格式化的(如PostScript, PDF, RTF, WORD, WPS),并且对于这些类型的文档可以将一个水印藏入版面布局信息(如字间距或行间距)或格式化编排中可以将某种变化定义为1,不变化定义为0,这样嵌入的数字水印信号就是具有某种分布形式的伪随机序列一个英文文本文件一般由单词、行和段落等有规律的结构组合而成,对其作一些细微的改动是难以察觉的这种方式既可以修改文档的图像表示, 也可以修改文档格式文件。
后者是一个包含文档内容及其格式的文件,基于此可以产生出可供阅读的文字(图像)而图像表示则是将一个文本页面数字化为二值图像, 其结果是一个二维数组:,f,(,x,y,)=0或 1,x,=0, 1, ……,,W,;,y,=0, 1, …..,,L,,其中,,f,(,x, y,)表示在坐标(,x, y,)处的像素强度;,W,和,L,的取值取决于扫描解析度, 分别表示一页的宽度和长度12.5),,,,轮廓是文本图像的一维投影, 单个文本行的水平轮廓表示为,,其中,,t,和,b,分别是图像中处于该文本行最上方和最下方的像素行坐标采用这种方法可以只修改第2、4、6、 …行, 而使第1、 3、 5, …行保持不变 这种方法能够抵御在传输过程中出现的意外或故意的图像损坏12.6),,,,数据隐藏需要一个编码器和一个解码器如图12.14所示, 编码器的输入是原始文件,输出是加了标记的文件首先对原始文档进行预处理, 将所得到的图像页按照从码本中选取的码字进行修改编码器的输出即为修改过的文件并被分送出去 解码器输入修改过的文件,输出其中所嵌入的数据信息, 图12.15表示解码过程图 12.14 编码器的结构,,,,图 12.15 解码器的结构,,,,11.4.2 行移编码,,行移编码技术既可以用于文本文档也可以用于文件格式, 它是通过垂直移动文本行的位置来实现的。
经验告诉我们当垂直位移量等于或小于1/300英寸时, 肉眼无法辨认出给文档预分配的码字规定了文档中的哪些文本行将被移动 可以规定行上移表示“0”,下移表示“1”当然也可以规定上移表示“1”, 下移表示“-1”,不动表示0 该技术采用了差分编码技术以获得好的不可检测性和鲁棒性同每行均可移动的方法相比较,可被隐藏的每个码字的长度减少了,但这个数字还是相当大的, 足以够用 如一页有40行,则每页会有2,20,=1 048 576个不同的码字根据要嵌入文件中标记的内容, 编码器将文本行上移或下移 解码器测量文档文件中相邻行的行间距,这可以用以下方法来实现: 解码器测量相邻行的基准线之间的距离或重心之间的距离基准线是一行中所有字符被放置的逻辑线,而重心则是具体文本行的点阵质量重心假定第,i,-1行和,i,+1行未被移动而将第,i,行上移或下移,在未改动的文档文件中相邻行的基准线之间距为常数,令,S,i-,1,和,S,i,分别是基线,i,-1和,i,之间基线,i,+1和,i,之间的距离,采用的检测准则算法如,S,i-,1,>,S,i,,则第,i,行下移;,S,i,-1,<,S,i,,则第,i,行下移,其它情况不定。
同基线调距方法不同的是,重心调距方法不要求间距一致 重心间距的测量基于原始文档中的间距与修改后文档中重心间距的差异 可以用下列公式来计算中心位置:,(12-7),,,,其中,,i,=1、2、…、,N,,为当前行号,,N,为一页中的行数,,t,i,和,b,i,表示第,i,行的顶和底N,为计算被选中像素点数目的函数,即,f,(,k, j,)=1,,k,=0, …,,W,; 下一步计算第,i,-1行和,i,行之间、第,i,行和,i,+1行之间的距离,令其为,S,i,-1,和,S,i, 类似地可以作下面的判断: ,,如,S,i,-1,-,t,i-,1,>,S,i,-t,i,,则第,i,行上移,否则, 第,i,行下移 ,,图12.16表示了采用行移编码文档的一部分图 12.16 行移编码,,,,11.4.3 字移编码,,字移编码技术通过使文本行内字符发生平移来嵌入特定标记 采用这种方式时,相邻字之间的距离各不相同经验告诉我们, 人眼无法辨认1/150英寸以内的单词的水平位移量其实在文档对齐处理时经常采用调整空格的方法来改变字符间隔(如文本的排序)因为作了变间隔处理,解码器需要掌握原始文档或关于原始文档字间隔的说明。
编码器首先要观察文本行是否有足够的字数用于编码,过短的行不被采用,然后用差分编码方法对所选定的行进行编码自左边起第2、4、6、 …等位置上的字被移动, 但行首字和行尾字不移动用来保持整页中的列向对齐最后将经字位移处理后的文档分发出去解码器需要原始文档的有关信息,不能实现盲检,只有那些拥有最初文档的组织或其代理人可以读到隐藏信息我们需要知道每个字的起始位置或重心位置 假设第,i,个字被移动了位置,其自身和相邻两字的重心分别为,c,i,-1,,,c,i,和,c,i,+1,,移动后的重心位置分别是,c,i-,1,′,,c,i,′和,c,i-,1,′ ,则计算公式为:,(12.8),,(12.9),,,,然后再用下面的方法来决定第,i,个字是被左移还是右移若,,, 则第,i,个字节被左移若,,, 则第,i,个字节被右移图 12.17 字移编码,,,,12.4.4 特征编码,,特征编码是一种通过改变某个字母的某一特征来插入标记的技术字母特征改变可能是其高度等属性特征同样,特征编码也会保留一些字母特征不作改变以帮助解码例如,使用字母高度进行特征编码的文本水印处理中,水印检测算法会将那些被认为发生变化的字母与该页中没有变化的相同字母的高度进行比较,得到水印结果。
11.4.5 编码方式的综合运用,,以上方法可以综合运用,这样的编码方式可以增加鲁棒性, 在破坏严重的情况下,仍可以检测到水印 在一个文档被处理的过程中,水平与竖直方向可能会受到不同程度的破坏对同一行同时使用行移和字移进行编码,可以结合控制行与被标记行来估计出水平与竖直轮廓哪一个破坏较小,从而决定进行行移检测还是字移检测11.5.1 最不重要位(LSB)方法,,,最不重要位(LSB)方法是将秘密数据嵌入到载体数据中去的最简单的一种方法,它是在空域中隐藏数据任何的秘密数据都可以看作是一串二进制位流,而音频文件的每一个采样数据也是用二进制数来表示这样,我们可以将部分采样值的最不重要位用代表秘密数据的二进制位替换掉,达到在音频信号中编码加入秘密数据的目的为了加大对秘密数据攻击的难度, 可以用一段伪随机序列来控制嵌入秘密二进制位的位置下面我们具体讲一讲水印的嵌入和提取过程:,12.5 数字语音水印技术,,,(1) 以二进制数的形式读取载体音频数据, 得到原始信号;,,(2) 将秘密数据转换为二进制位流的形式, 并计算秘密数据位的总数; ,,(3) 将(2)中得到的数据流作置乱变换, 得到待隐藏的数据流; ,,(4) 将秘密数据位的总数首先嵌入到载体文件中; ,,(5) 将原始数据的最低位用秘密数据位替代; ,,(6) 循环操作第(5)步, 直至秘密信息全部被嵌入。
音频数字水印的LSB方法水印提取过程主要步骤如下:,,(1)首先提出秘密数据位的总数;,,(2)提取水印信息的数据位;,,(3)循环操作(2),直至所有的秘密二进制位全部被提取出来;,,(4)根据嵌入过程使用的置乱变换,采取逆变换,得到我们所需要的数据水印信息为了提高鲁棒性,我们也可以将秘密数据位嵌入到载体数据的较高位,但这样带来的结果是大大降低了数据隐藏的隐蔽性当然,在变化域进行数字水印的嵌入能获得很强的鲁棒性 下面介绍小波变换的方法12.5.2 小波变换方法,,小波变换是一种新的时频分析方法,随着新一代视频压缩标准MPEG-4的推出,小波水印技术日益受到重视小波变换与传统的频域方法相比具有很多优势,变换算法在频域和时域同时具有良好的局部化特征,小波变换支持多分辨率分析与人眼视觉特性相匹配小波水印可以将水印嵌入中频的不同子带中,形成的算法鲁棒性强,在经历各种处理和攻击后,如加噪、滤波、重采样、剪切、有损压缩和几何变形等,仍可以保持很高的可靠性在嵌入时对语音信号序列按下式进行Harr小波分解:,,(12.10),,(12.11),,其中,,h,1,=0.7071,0.7071,,h,0,=-0.7071,0.7071。
12.12),,,,图 12.18小波域音频水印的嵌入方案,,,,图 12.19 小波域音频水印的提取方案,,,,12.6 数字视频水印技术,12.6.1 数字视频水印技术的一般原理,,视频水印研究是当前数字水印技术研究方向中的一个热点和难点,热点在于大量消费类数字视频产品的推出,如VCD、 DVD, 使得以数字水印为重要组成部分的数字产品版权保护更加迫切难点是由于虽然数字水印技术近几年得到长足发展, 但方向主要是集中于静止图像的水印技术然而在视频水印的研究方面,由于包括时间域掩蔽效应等特性在内的更为精确的人眼视觉模型尚未完全建立,使得视频水印技术相对于图像水印技术发展滞后,同时现有的标准视频编码格式又造成了水印技术引入上的局限性另一方面, 由于一些针对视频水印的特殊攻击形式 (如帧重组, 帧间组合等)的出现,为视频水印提出了一些区别于静止图像水印的独特要求 主要有以下几个方面:,,(1)实时处理性 水印嵌入和提取应该具有低复杂度 ,,(2)随机检测性 可以在视频的任何位置、 在短时间内(不超过几秒种)检测出水印3) 与视频编码标准相结合 相对于其它的多媒体数据, 视频数据的数据量极大,在存储、传输中通常先要对其进行压缩, 现在最常用到的标准是一组由国际电信联盟和国际标准化组织制定并发布的音、视频数据的压缩标准(MPEG-1、MPEG-2、 MPEG-4)。
如果我们在压缩视频中嵌入水印,很显然应该与压缩标准相结合;但如果是在原始视频中嵌入水印,我们知道水印的嵌入是利用视频的冗余数据来携带信息的,而视频的编码技术则是尽可能的除去视频中的冗余数据,如果不考虑视频的压缩编码标准而盲目地嵌入水印,则嵌入的水印很可能在编码的过程中丢失4) 盲水印方案 若检测时需要原始信号, 则此水印被称为非盲水印, 否则称为盲水印(Blind Watermark) 由于视频数据量巨大, 采用非盲水印技术是不现实的 因此,除了极少数方案外, 目前主要研究的是盲视频水印技术 ,,通过分析现有的数字视频编解码系统,可以将目前的视频水印分类为以下几类视频水印的嵌入与提取方案,如图12.20所示图 12.20 视频水印嵌入和提取方案,,,,视频水印嵌入方案一:水印直接嵌入在原始视频流中 此类方案的优点是: 水印嵌入的方法比较多,原则上数字图像水印方案均可以应用于此 缺点是: 会增加视频码流的数据比特率; 经MPEG-2压缩后会丢失水印; 降低视频质量;对于已压缩的视频, 需先进行解码, 然后嵌入水印后, 再重新编码视频水印嵌入方案二:水印嵌入在编码阶段的离散余弦变换(DCT)域中的量化系数中。
此类方案的优点是:水印仅嵌入在DCT系数中,不会增加视频流的数据比特率;易设计出抗多种攻击的水印缺点是会降低视频的质量, 因为一般它也有一个解码、嵌入、再编码的过程 ,,视频水印嵌入方案三:水印直接嵌入在MPEG-2压缩比特流中此类方案的优点是没有解码和再编码的过程, 因而不会造成视频质量的下降,同时计算复杂度低缺点是由于压缩比特率的限制而限定了嵌入水印的数据量的大小11.6.2 原始视频水印,,原始视频水印是指直接对未压缩的视频数据进行处理,与视频编码格式无关因此,可以分为两种情况:可以直接获得原始视频流数据,此时,在原始的视频流中完成水印的嵌入或提取,这时的处理比较简单;只能得到编码的视频流数据,此时,首先对编码视频进行解码,然后再嵌入或提取水印,在水印处理之后, 如果有必要再重新压缩, 这时的处理相对复杂按照水印嵌入和提取之前是否对宿主信号进行某种变换, 原始视频水印又可分为空域水印和频域水印两种方法前者直接在原始视频数据中嵌入水印,后者对原始视频数据进行某种变换, 如DCT, 然后进行水印的嵌入和提取处理 ,,空域水印是指直接在原始视频数据中嵌入水印,嵌入的水印信号一般是添加在亮度分量上,有时也有一部分被加入到颜色分量中,或全部加入到颜色分量中。
其优点是思想简单、复杂度低,缺点也是明显的,在鲁棒性和不可感知性方面的性能较差空域水印的一个简单的实现, 是直接利用各种最低有效位方法,在原始视频中嵌入水印直接在原始像素值上进行水印嵌入和提取,主要目的是为了降低水印处理的复杂度,然而随着处理器速度的不断提高,在频域中进行水印嵌入和提取已经成为最为常见的方法Swanson等提出采用三维小波变换的水印方案小波变换是用多个分辨率表示信号的一个有力工具小波分解的多分辨率特性在空域、频域提供了信号的局部特定信息,可以用于信号的分析和处理利用小波技术的数字水印方案,是近几年来的一个研究热点Swanson将视频序列看成三维信号,并将视频序列分为场景, 这样水印处理就能够考虑时域冗余视频序列中视觉上类似的区域,即来自同一个场景的帧,必须嵌入一个一致的水印小波变换的多分辨率特性,使得水印存在于多个时域分级水印嵌入时,利用基于人类视觉系统的掩盖模型来保证嵌入到每个视频帧的水印是不可感知的和鲁棒的 先对视频序列一个场景中的,k,个帧进行三维小波变换,将变换系数分为8×8的块,B,ij,,对每一块,B,ij,,通过其离散余弦变换(DCT)得到频率掩盖矩阵,进而得到水印矩阵,W,ij,,并根据空域掩盖矩阵,S,ij,,在该块中添加水印,W,ij,,所有块添加水印之后,进行逆变换则得到添加了水印的信号。
水印检测有两种方案,第一种检测方案需要原始宿主信号, 是一种非盲水印方案, 将待检测帧减取原始帧,并计算与水印信号,W,之间的相关值, 可以确定视频序列中是否添加了水印 第二种检测方案不需要原始宿主信号,是盲水印方案,将待检测帧减去最低空域小波帧,然后计算与,W,之间的相关值,来确定是否添加了水印12.6.3 压缩视频水印,,在视频中嵌入水印一般考虑MPEG编码标准 在MPEG标准中, 有三种图像类型:内部编码帧(I帧)、前向预测帧(P帧)和双向预测帧(B帧)I帧的编码类似于JPEG,利用帧内相邻像素间的空域冗余来压缩信息;P帧编码时要用到先前的帧, 当前的帧又可以作为后面的预测帧的参考帧;B帧的数据压缩效果最显著,它在预测时需要先前和后续的信息,且自身不能作为其它帧的预测参考帧P帧和B帧都利用了相邻帧间的时域冗余来压缩信息,同时预测误差信号还可以进一步的去除空域冗余 去除空域冗余主要用到了DCT、量化和熵编码等技术;去除时域冗余用到了运动补偿、 运动表示和运动估计等技术Hartung和Girod提出了用于MPEG格式压缩视频的数据嵌入法其嵌入过程分为以下7个步骤 ,,(1)进行DCT计算,将DCT系数按Z字型重扫描为1×64的矢量。
令,W,0,为直流量(DC)系数,,W,63,为最高频率的分量系数(AC) ,,(2)令V,n,、V,n,′分别为加入水印前后的信号且V,0,′,,=V,0,+,W,0,3)在位流中寻找邻近的变长编码器(VLC),求出码字、 位置和以VLC编码字表示的交直流分量Vm决定的运行指标对(rm,lm)4)令V,m,′=V,m,+,Wm,表示新DCT系数,确保采用V,0,′之后不会增加位速率 ,,(5)令,R、R,′分别为传送(rm, lm)、(rm,lm′)的二进制位数 ,,(6)若,R≥R,′,则传送,R,′;否则传送(rm,lm) ,,(7)重复(3)~(6),直到遇到数据块结尾码Hartung与Girod研究了这一算法的鲁棒性他们指出,其算法对压缩、 滤波、 轻度旋转具有鲁棒性对程度更重的旋转, 需要采用适当的检测及校正机制去除或插入数据会导致收发双方丢失同步信息,因此还要有同步信息丢失检测及实现再次同步的机制数字水印技术从正式提出到现在短短的几年,已有不少著名大学和研究机构投入相当大的人力和财力,致力于该项技术的研究, 并取得了一定的成果(包括美国的麻省理工学院、Purdue大学、英国的Georage Mason大学、 瑞士洛桑联邦工技院、 NEC研究所、IBM研究所等)。
一些公司也已推出了数字水印的产品,如HIGHWATER FBI、Digimarc Corporation、 Fraunhofer's SYSCOP等 各研究机构正努力设计出更高效、 更通用、 鲁棒性更强的数字水印产品数字水印技术和Web应用相结合,是今后该技术在信息领域的主要发展方向在诸如电子商务、网络多媒体服务、远程诊断、教学等所有涉及版权或信息安全的领域,数字水印及其相关技术均能发挥重要作用可以预见,随着计算机、 网络及信息科学、 密码学等学科的不断发展,安全可靠的数字水印技术将在很多领域得到更加广泛的应用。