一、导言
据美国电影产业估计,由于非法的复制行为和经由物理媒介(录像带、dvd、vcd等)传播的盗版电影所导致的收入损失超过了30亿美元。
这种对非法下载导致的收入损失的估计是有问题的,因为很难确定非法下载的哪些部分会给电影产业带来收入上的损失,而且非法下载所带来的“免费宣传”是否会对票房收入有积极影响也未可知。然而,通过互联网传播的非法拷贝很可能对dvd销售和付费网络电影有越来越大的影响。低成本的高速宽带互联网连接和p2p文件共享网络的发展使得非法电影拷贝的下载越来越容易,这使得电影产业对非法下载的关注愈加强烈。而非法复制的电影在该电影于美国电影院线放映之前就在网络上出现的状况则加强了电影产业对这一问题的关注。
大部分关于阻止非法复制电影之活动的讨论集中于摧毁盗版电影的大规模制作和传播,并采取措施阻止消费者从dvd、vcd、付费网络下载或数字电视广播等渠道制作非法电影拷贝。直到最近,关于安全措施的公共讨论还几乎没有,而这些安全措施将阻止非法电影拷贝落入那些企图对其进行大批量制作——有些是在院线放映之前——的人们手中。
本研究试图对从2002年1月起18个月内美国票房收入前50名之电影的互联网非法拷贝的源头进行归类。没有事实支撑的争论已有不少,但在公共领域里还没有发现关于这个课题的可靠数据。本文简要分析了电影制作和发行的过程,并确认了可能会导致电影的非法拷贝被试图传播它们的人获得的安全漏洞。在研究期间我们还分析了互联网盗版、院线放映和dvd发行之间的时间差,并描述了确定互联网拷贝的可能源头以及本分析之结果的方法论问题。最后,本文还提出了减少电影制作和发行过程中的安全漏洞的一些建议。
二、电影制作和发行
对于安全漏洞的考察始于电影的制作过程,在该过程中各种各样的声音、图像和数字元素都会被创造出来并被糅合成最终产品。然后,我们又考察了电影的发行过程,该过程包括面向观众以及评论家、奖项评委和其他人的物理或电子发行。市场销售以及与之有关的活动也会出现在这两个过程之中。
制作过程的连接点是剪辑室。在剪辑室里,通过对实景拍摄的影像和声音记录(镜头)加以剪辑和组合,电影内容就浮现出来了。一旦这些镜头被粗剪完毕,则其它方面,比如电脑生成特技以及音乐与声音的合成等都由外部部门完成。在所有的情况下,经过提炼加工后的内容都会再回到剪辑室,可能是作进一步的剪辑、修改和提炼加工。最后,在后期制作阶段,电影的视觉和音效元素会被进一步地精致化。和电影制作过程的其它部分一样,后期制作也有可能被外包给其它公司。
与电影内容制作同步进行的是一些相关的市场活动。电影公司的市场部要进行广告宣传以促销电影,而这类活动通常早在电影内容制作完成之前就开始了。除了制作电影预告片和海报以提升电影知名度之外,在针对核心观众群的私下放映中,市场部门还要对观众对电影粗剪的反应做出评估。电影将根据观众反映和调查结果来加以调整。通常当电影内容制作接近尾声之时,电影公司的主管人员和投资方都要观看影片并提出意见。只有当剪辑人员、导演、制片人和市场部都感到满意了,将在影院上映的最终版才算大功告成。
在电影发行过程中需要复制电影的最终版并将其提供给经公司授权的各方,这其中最关键的因素在于将电影提供给各方的时间。有这样三个时间段是要考虑到的:影院公映前、公映到dvd发行前以及dvd发行后,①最后这一阶段使终端消费者提供了非法复制的机会(如直接从买到的dvd上转录)。
在院线放映之前,影片的最后版本可能会被提供给许多人,评论家和奖项评委都会得到拷贝。需要注意的是,这个过程在电影产业中发挥着关键功能:对影片进行宣传并得到评价(当然最好是积极的评论)。然而,参与这个过程的人实在不少,这使得电影的安全问题变得更为错综复杂。电影公司的许多雇员都有机会接触到电影的最后版本:市场主管不断地观看电影并为之制定促销方案,而电影通常会以便携格式(vhs或dvd)提供给各方。
电影内容本身必须在制作部门进行复制,而很多雇员都有机会进入该部门。就在影片上映之日或之前的很短一段时间内,电影内容会被提供给电影院。一直以来,电影放映会在各地交错进行,然而,出于对非法拷贝的顾虑,一些公司正在压缩放映时间的间隔。一旦电影院收到一部电影,则电影院的雇员就有可能接触到它。电影一旦放映,它就会暴露给能够直接操作放映机的电影院雇员,同时也会暴露给公众,而其中或许就有人想制作非法拷贝。
电影上映几个月之后,影片就会在dvd压制工厂里复制成dvd产品,然后这些dvd就会被发售到商店和影片出租公司。在美国,影片的dvd有时在其正式发行日之前的一个月甚至更早就开始发行了,这并不是什么新鲜事(一般而言,美国电影dvd的海外发行日会在美国院线放映日之后)。于是,商店店员就有机会在dvd发行之前几周内便接触到dvd,而在有些时候,商店会违反电影公司的规定而在发行日之前就出售dvd。
三、安全漏洞
针对电影内容的制作和发行系统的各类攻击已被证明是成功的。在考察这些攻击之时,需对它们做关键性的划分:内部人攻击和外部人攻击。一般来说,内部人员是指那些得到信任(至少部分地)的群体中的成员。和更为一般意义上的信息安全一样,在电影产业中,针对内部人威胁的预警和应对措施必然与针对外部人威胁的大不一样。
(一)内部人攻击
前面的分析揭示了电影制作和发行过程中诸多潜在的内部人员的攻击。以下仅列出电影制作和发行安全的部分潜在的威胁:
1.在供应链中的剪辑室或相近位置对影片——不管是粗剪还是对成品的非法复制。这些拷贝通常与公映版有些微的不同或包含不完整的音频或视频。有些还会有表明它们出处的预先嵌置的文字标记,或者包括屏幕计时表。
2.对影评家提前收到的拷贝的非法复制。这些拷贝有时会有“仅供放映,版权所有”等字样出现在屏幕上。
3.对提供给奖项评委的拷贝的非法复制。这些拷贝可能带有“仅供欣赏”等字样。
4.对促销或预放映拷贝的非法复制。这些拷贝可能带有与提供给影评家的拷贝相似的字样。
5.放映员在具备无侧光的屏幕、舒适的布光和直接音效的电影院里直接进行数字复制。这些拷贝质量不同,但通常会比较好。
6.在工厂或在售出前的任何环节对消费品如dvd或vhs的非法复制。这些拷贝不带任何标记并且品质接近完美。
需要注意的是,本文的研究考虑了电影制作和发行过程中除了终端用户以外的所有内部参与者,尽管有些并不是被电影公司直接雇用的。
(二)外部人攻击
为了便于比较,这里也列出一些外部人攻击的例子:
1.电影观众使用便携式摄像机在影院的座位上对影片进行数字复制。一般来说,这种拷贝的音像质量很差,因为它受到摄录这一方式本身所具有的限制。通常,这种拷贝能很明显地看出并不是从放映的相同角度录制的。
2.消费者对租来的dvd或vhs的非法复制。这些拷贝(和下列两种)的品质接近完美,但只会在电影制作完成及发行后才出现。
3.消费者对购买的dvd或vhs的非法复制。
4.对有线、卫星或地面电视播出的电影的非法复制。
外部人攻击似乎是对电影安全的更大威胁,因为这些潜在的攻击者数量甚为巨大,而且他们的攻击通常发生在影片完成以后且不带任何电影公司的标记。然而,本文在下面一部分考察了这类拷贝的一些重要属性,这些属性可以使我们不必对其太过担心。
(三)新鲜度和品质
非法拷贝形式多样,各有不同,但有两个方面特别关键:新鲜度和品质。一部电影的新鲜度在于它有多新:电影在其放映之时或放映之前是新鲜度最高的。新鲜度是非常重要的,因为对最新电影的需求最旺,而且对最新电影的市场开发力度也最大。那些仍未在院线或某个市场上放映的影片的非法拷贝是最有价值的,因为它们出现在影片经合法渠道上映之前。
新鲜(在影院上映前或上映期间)、高品质(电视画面的品质或更好)的电影拷贝几乎不可能由外部人攻击获取。这个发现对于我们分析电影制作和发行过程中的安全漏洞至关重要。与防范外部人获取拷贝及对这些拷贝的再传播相比,防范内部人攻击所需弥补的漏洞数量是极小的。此外,从内部人的定义来看,他们无疑会受到电影内容所有者的一定影响,因为这些人在电影产业内拥有工作,所以便也有失去工作的顾虑。这对于防范对电影的非法复制具有非凡的意义。
四、实证分析
为了更深入地挖掘被泄漏之电影的源头,本文对2002年1月1日到2003年6月27日之间进入美国票房前50名的电影进行了实证分析,下面一部分描述了我们的研究方法和分析结果。
(一)研究方法
在数据收集过程中我们始终牢记下列要求:
(1)该过程必须被记录下来,并且能被重复。
(2)与需要通过特殊渠道才能获取的数据相比,更倾向于只使用公开发表的数据进行分析。很明显,这样的分析也更可能被重复。
(3)符合美国版权法的合理使用条款。
(4)该过程应当达到一定的自我生成度,从而当前的研究和大量的回顾分析均能得以进行。
1.电影数据库
本文收集了一组在公共电影网站上发布的电影,并编制了若干2002年1月1日—2003年6月27日间任一时段的美国票房收入前50名的电影列表。这个过程自动收集和编制了一系列的数据,包括电影放映日、dvd发行日、发行商、mpaa的分级、票房收入和一些初浅的观众评级。本文共收集到409部符合标准的影片的数据。在这409部电影中,那些在国外上映(包括在国外电影节)比在美国上映早的影片被排除掉了。几部数据不全的电影也被排除掉了,因此最终的数据只包括312部电影。
2.非法拷贝的辨认
对于数据库中的每一部电影,本研究都运用软件在在线门户网站上进行搜索,并且自动找到该电影的所有非法拷贝。
3.文件样本的获得
根据从内容门户网站上获得的信息,与之相应的文件肯定位于p2p网络上,并包含着每一相关拷贝的一小部分(平均起来大概可获得每部电影的5%)。我们无法下载到对应相关链接的某些文件,且下载到的文件中有27份无法播放。另有18份文件是在外国发布的(例如带有非英文字幕),对于这些文件我们没有进行进一步考察。在数据库的312部电影中,我们成功地下载和播放了对应于285个相关链接的文件,而这些链接则指向183部电影的在线拷贝(占电影数据库的59%)。
为了本项研究,我们编写了一个perl程序,从而为使用200mhz的电脑、并通过有线modem连接到互联网上的p2p用户提供一个便于操作的界面。这一程序使得研究者可以启动、监控、暂停以及取消文件下载,于是在获取到所需文件的所需部分时便可结束下载。我们花了近1周的时间获得了285个可播放样本,数据总量超过18g。
4.内容分类
在获得样本之后,我们用一份自动生成的说明将它们提供给一组评估人员,让他们对这些样本进行评估,并随说明附上一张供填充数据的表格。收录的数据包括对音频和视频品质的评估以及非法拷贝的各种可能特征的存在与否。在这一阶段,本文也采用了一些自动分析方法。对于大部分样本来说,评估人员能够对它们的影音品质做出明确的评估,但对于其中的38个样本,评估人员却在其收到的表格上承认他们不敢确定评估是否正确。大部分情况下,他们是对音频品质的好坏不能确定。②
5.分析
根据在上述过程中收集到的数据,本文考察了新鲜度、拷贝品质和攻击点之间的相互关系。此外,本文还计算了每一部影片的影院上映日期和它第一次出现在内容门户网站的日期之间的时间差。如果影片已经发行了dvd,则本文也计算了该影片的dvd发行日与它第一次出现在内容门户网站的日期之间的时间差。
只要符合下列条件之一,则该攻击点就被视作内部人攻击(与外部人攻击相反):
(1)拷贝出现的日期早于影映上映日期。
(2)拷贝的镜头中经常出现一些剪辑室里的物品,如长杆话筒,或该拷贝明显不是最终的放映版本。
(3)拷贝带有任何与电影公司相关的标记或带有明显的水印。
(4)拷贝有着良好的摄录画面,但其音频却很明显的是直接嵌入的,且出现在dvd/vhs发行之前。如果是这种情况,则很可能是某影院的雇员在电影院直接从放映机上拷贝了声音,并用放置在放映间或处于最佳位置的坐椅上的手提摄像机录下了影像。
(5)拷贝直接翻录自dvd并出现在dvd发行之前(同样适用于vhs)。
其它的拷贝被归类为源自外部人或来源不明。
6.局限性
本文的分析提供了一些必需的实证数据。然而,了解本文的研究方法自身所具有的若干局限性是颇为重要的。首先,这种类型的分析无法得到所有或几乎所有不同的非法电影拷贝。因此本文不可避免地低估了现有非法拷贝的数量。再者,我们查询的内容门户网站似乎删除了一些低质拷贝的链接,而这些低质拷贝通常比优质拷贝更早地被贴到互联网上,这增加了我们分析的偏差。但就对研究样本的考察结果来看,撇开上述情形不谈,这些内容门户网站应该说还是非常精确的。根据其它数据来源对放映日期进行即时检验有时会发现一些小小的差异,比如对点映和公映日期的不一致记录,但这些错误很少出现,而且影响也不大。电影样本中没有出现诱饵文件。
对拷贝进行采样和检验的过程同样存在着误差。下载的样本中有27个不能播放。这27个样本中有些可能是损坏了,但我们怀疑大部分是以某些特殊格式加以编码的,这些格式使得当仅获得一个小的样本时,它们便无法播放。另外,带有内部标记的电影不会在每个镜头中都出现这些标记,所以这些标记也可能并未出现在所播放的电影样本片断中,而这就会使我们低估带有这类标记的拷贝数量。此外,某些样本在其被贴到互联网上之前可能就已经被去除了内部人攻击的标记了,这使得本文对内部泄漏的估计更是保守。
本文在估计不带标记的dvd拷贝的内部泄漏时可能不会保守。一些这样的拷贝在影片的dvd版正式发行前几周就出现了,它们可能是从在dvd正式发行日之前便出售dvd的商店里买到的。
还需要注意的是,本研究关注的是流行电影。至于片长较短的独立电影是否也会有相似的泄漏模式则并不清楚。
五、结论
在我们研究的312部电影中,有183部是在内容门户网站检索到的,这表明网络盗版的普遍性。在所考察的285份电影样本中,有77%看起来首先是从产业内部泄漏出来的(由前文所概述的标准而判定)。平均起来看,这些电影样本在影院放映后100天、dvd发行之前83天便可被检索到。尽管只有7部电影在影院上映前便能被检索到,但却有163部电影在dvd发行之前就被检索到了。在本研究进行之时便已发行dvd的电影样本中,仅有5%是在dvd发行之后才首次出现在内容门户网站上的。这表明同内部泄漏相比,消费者对dvd的复制在目前仅是一个相对较小的因素。
根据影片在内容门户网站上出现的日期与该影片在影院上映的日期及其dvd发行日之间的时间差的比较,可以看出,许多电影在影院上映3周内就出现在互联网上。这包括在电影制作和影院发行过程中的泄漏以及提供给影评家和奥斯卡评委的拷贝的泄漏。另外一个泄漏高峰出现于dvd发行之前的1个月左右。这些泄漏可能大多源于dvd压制工厂、dvd发行商、零售店雇员或奥斯卡评委。然而,有些也可能是源于消费者在那些于dvd正式发行日之前就出售dvd的商店里买到了dvd,并对其进行了复制。
数据库中的大部分样本都具有dvd品质。而那些不具有dvd品质的则是影片在影院上映的日期和在互联网上出现的日期之间的时间差比较短的样本。同样地,那些带有明显的水印或者文字标记的样本也是两者时间差较短的样本。
各家电影公司在内容门户网站上检索到的电影的比例及其平均时间差相差极大。各家公司的制作和发行过程以及所制作电影的类型或许可以解释部分差异。然而我们未能发现每家电影公司的平均时间差与其平均票房收入之间存在着相关性。
六、讨论和结论
本研究表明内部泄漏事件大量存在,因此我们认为,当前的防范技术还不够有效。考虑到电影产业公布的因盗版而导致的收入损失,在内部控制上花费更多的财力和精力实在是明智之举。
在整个制作过程和大部分的发行过程中,电影内容是被数量有限的工作人员在受控制的环境中接触和管理的,而在发行的后半阶段,电影内容则会被大量而且基本是匿名的人群接触到。确保前期过程的安全虽然困难,但终究还可做到,而确保后期过程的安全则几乎是不可能的。因此集中精力对付内部威胁正是试图解决内容泄漏中造成最大经济损失的那部分泄漏,而其成功的机会也最大。
注释:
①当然电影的发行过程还包括其它重要的环节如全球放映、宾馆付费放映、航班放映以及家庭付费放映等等。本文的分析仅集中于本文指出的这三个阶段。另外,一些电影的dvd和vhs的发行日期是不同的。但本文的分析只考虑较早的那个日期。需要注意的是,在美国,dvd的发行日期是指电影的dvd开始出售和出租的日期。
②自动化的工具也许能够被用来更精确地测定音频的品质,比如通过比较音轨之间的差异。如果音轨之间很少或几乎没有差异,这就表明该音频是从影院偷录得来的。