版权

与维基百科站在一起

目前,中文维基百科中关于百度侵权的讨论再次被提上议程,一部分愤慨的维基百科成员发起了公开声讨百度侵权做法的倡议,然后一份关于百度百科侵权的通知函件被起草。值得说明的是,这一次的维权讨论是由非官方的中文维基百科成员发起,目前尚未获得维基百科基金会的官方表态,不过越来越多成员的加入让这一事件不再那么简单。另外,由于维基百科词条的著作权归作者所有,所以词条作者有权对任何相关侵权行为提出质疑,并且在得到部分作者授权的情况下维基百科基金会能够作为主体发起诉讼。 一个很重要的问题,百度百科抄袭维基百科了吗?依据现在了解到的材料,百度百科侵权的事实是清晰的,维基百科非官方未确定的侵权内容条数至少为1600条,这些侵权行为包括引用、修改未将作者、出处进行标注,也没有按照维基百科官方约定的“ CC-by-sa-3.0 ”协议以相同方式进行共享,当然他们也没有得到任何维基百科词条编辑的正式许可。按照通常的规则,我们可以预期百度百科会将一切归咎于用户上传,并且尽快删除那些侵犯维基百科的词条,但这一行为并不影响百度百科在未来继续抄袭并违规使用维基编辑的劳动成果。 让人意外的是,百度百科并未获得以往那么多的支持声音,在之前的百度文库以及百度MP3纠纷中,普通民众的支持是决定百度最终获胜的重要因素。他们支持百度很重要的一个原因是自己从百度相关产品获益了,他从百度MP3下载不需要付费与授权的音乐,他从百度文库获得众多未经授权的文档资料,这一次关于百度百科的争议适用同样的理论,事实上大量人群从百度百科获取有效信息,人们总是会下意识去捍卫自己的既得利益,但普通民众关于百度百科侵权事件的反弹很有限。 从双方的中文用户数量看,百度百科肯定大幅高于维基百科,但是维基百科的词条质量远远高于百度百科,尽管百度百科一直在试图学习维基百科,但是它很难模仿尊重版权、维护作者的信条,百度百科更相信一些看不见的规则。我看到双汇的负面新闻,第一时间想要了解双汇的具体情况, 百度百科 展示的是连篇累牍的官方式介绍,看起来更像是从双汇网站上摘抄下来的信息, 维基百科 词条内容简练有力,能够最快速让用户了解双汇是一家怎样的公司。这只是无数条对比中的一条,维基百科在大多数时候获胜。 其次维基百科成员的要求合情合理,根据维基百科词条相关的授权协议,引用相关内容应该注明作者并以相同方式共享。但事实上的情况是百度百科把别人内容扒走还改变了共享方式,这是一种毫无疑问的侵权行为,在这样的情况下维基百科有足够的理由声讨百度百科,这更多是为了维护与感谢维基百科编辑付出的大量劳动。 维基百科整站没有任何形式的广告及营业收入,完全依靠捐赠来维持和生存下去,社群编辑也没有获取任何收入,他们用自己的时间与精力做着做着毫无功利的事情,事实上你雇上上万名员工也不一定能比他们做得更好。维基百科是数字时代的一个奇迹,它改变了我们知识传播的方式,无数人都从中受益,其中包括律师、记者、学生、学者、ITer等众多行业从业者,我想这个时候我们应该选择做对的事情,与维基百科站在一起。 日志标签: 版权 , 百度百科 , 维基百科 | 日志链接 | 1个人围观这篇文章 © XJP的碎碎念 , 2011. 文章如未注明均为原创,适用 署名-非商业性使用 2.5授权 ,非商业及个人网站转载文章须以链接形式注明来源,商业媒体及纸媒请先联系。 您可能还喜欢: 搜狗的尴尬境地 关于网游厂商的Q币炒作的一些闲谈 破釜沉舟之金山毒霸 后诺基亚时代的抗争 北京的川渝火锅 无觅

阅读更多

魏武挥:从百度文库侵权看衰传统出版

近来,一批作家和出版策划机构集体声讨百度文库侵权一事,闹得沸沸扬扬,接下来双方谈判破裂,引发作家和出版策划机构愤慨,用微博、博客等UGC工具予以口诛笔伐,北京有司出来表态说百度涉嫌侵权,一时间坊间热议,煞是可观。 百度这档子危机,我觉得可以从以下六个方面来观察并讨论。 为什么是百度? 事实上,网上可以获取电子书的地方很多,比如verycd到我写此文时还提供有18102个图书下载链接,其中不乏版权可疑者。豆丁网亦是一个可以下载大量电子书之所在,甚至有利用版权不明的作品进行售卖的嫌疑。当然,这两个网站比起百度来,个头小得几乎可以不计,毕竟百度刚刚拿下了中国市值最高数字公司的头衔。 不过,并不是只有小个头在那里打游击,赫赫新浪,也在干这事。新浪爱问是一个电子书宝库,数量远远超过verycd和豆丁的。根据alexa统计,新浪爱问占据整个新浪访问量2.34%,百度文库则占百度1.63%。当然,新浪爱问还提供类似百度知道的服务且新浪整站访问量不及百度,但要说新浪爱问没有庞大的电子书下载群体,那纯属鬼话。 更早些时候,盛大文学侯小强也痛斥百度侵犯盛大合法权益,却完全不曾提及新浪。而这一波又是如此。新浪刚刚突破股价100美元,新浪微博搞成一个时代风潮,也是一风口浪尖公司。诸多权益受损者,怎么就忘记它了呢? 道理很简单:因为新浪是一个媒体。 新浪是一个可以搞策划、弄活动使劲倒腾出声音的媒体,但百度不是。百度更多的是依靠用户自己输入关键字的“传播渠道”。如果我对作家张三毫不感兴趣,百度不会让我看到作家张三的东西,但新浪却可以把该作家新书的信息推送到我的眼前。这两者的运作机理不太一样,从做宣传搞推广的影响力而言,新浪可能比百度更有用。 码字的人,大多知道,轻易不要得罪媒体。更何况这批作者和出版策划机构运营者,大多还有一个带V认证的新浪微博帐号。新书一出,还指望着这类媒体帮忙吆喝一下呢。如果控诉百度成功,新浪最好自行收敛——事实上,新浪爱问一向也的确低调得很。 至于侯小强,本来就是新浪陈彤的部下,指望他先对以前就关系较好的老东家叫阵,有点违背中国人的所谓道义。于是乎,百度就被挑上了。 故而,权益受损者也不是逢“盗版”就打。专攻百度,不计其它,这是很聪明的进攻手法。一个和利益有关的事,算计一下,也属正常。 百度有没有侵权? 在现行著作权体系下(请注意这个前提),百度无可争议地侵权了。 百度文库和百度MP3并不一样。百度MP3提供的是音乐下载的链接地址,而不是把音乐放在自己服务器上。故而,它可以辩解说:仅为传播信息之方便。至于人家网站盗版不盗版,与我无干。从侵权责任角度而言,这个辩解不能说一定道理都没有。故而百度MP3至今屹立不倒,为百度提供了1.28%的流量。 但文库却把资料(无论合法的还是盗版的)都放在了自己的服务器,这个性质就完全不同了。事实上,我也一直很奇怪百度这个行为:它完全可以提供类似MP3搜索这类网盘资料搜索的功能,链接地址都是别人的。在这个策略下,百度可以继续利用为自己辩护MP3搜索的方法来辩护这个资料搜索,但百度却没有这样做。 极有可能的是,在MP3搜索的数个官司中,百度屡屡得手,助长了它的势头。另外一点是,文库资料从表面上看,都是用户上传,而非百度自己上传。百度是不是可以在这里使用“避风港原则”? 仅仅从先前视频网站版权大战的结果就可以知道了,这把保护伞其实相当不靠谱——如果可以有效地用来做挡箭牌的话,为什么它们还纷纷撤下有侵权嫌疑的视频作品呢?。当避风港原则无法使用时,网站运营者极有可能被判定承担“连带责任”,而连带责任的核心要义就在于:先可以由原告向任一被告要求全部的赔偿,再由诸个被告自己去分别算账。现行的侵权责任法第二章里,对于连带责任的判定有很详细的描述,而第三十六条,更是清晰: “网络用户利用网络服务实施侵权行为的,被侵权人有权通知网络服务提供者采取删除、屏蔽、断开链接等必要措施。网络服务提供者接到通知后未及时采取必要措施的,对损害的扩大部分与该网络用户承担连带责任。 网络服务提供者知道网络用户利用其网络服务侵害他人民事权益,未采取必要措施的,与该网络用户承担连带责任。 而百度非要用“避风港原则”来说自己不知情,在如此大的规模之下(目前大概存有2000万份文档,版权不明的比例相当高),显然有点站不住脚了。 百度主要侵了谁的权? 一般人会以为:当然是作者的。但如果你换一种问法:谁的利益受损最大,就知道,其实不是作者的。 对于一部作品而言,通常来说,作者(也包括译者)的权益体现主要是三个部分:署名权、稿酬和版税拆账。署名权是不会动的,即便是在很多非法电子书下载中,由于是扫描件,故而作者(译者)大名高高在上,人没说这东西不是你写的,是我写的。 现在看稿酬。有些出版合同里索性没有稿酬(也就是0元),全部用版税代替。即便有,对于很多非大牌作者而言,稿酬也不高(其实大牌作者更愿意用版税拆账)。写一本20万字的书,能拿到几万元稿费,那是很不错的稿酬。而至于版税部分,一般情况下也就7到8个点,12-15个点是著名作家那个级别——而很多情况下,除了很小部分的著名作者预付版税外,大部分一般性的作者的版税还要被用各种借口拖欠,因为版税是跟着销量走的,销量是得一版销售完才晓得的且充斥着各种猫腻。 很多作者在签订版权合同时,还被剥夺了著作权下大量的其它权益(出版机构和非大牌作者签订合同时,都是格式条款,也就是俗称的霸王合同),比如说:根据你这个作品拍个电视剧,拍个电影?对不起,这个权益归属出版机构(或者要出版机构点头同意,下同)。再比如说,你这个作品搞成英文版卖点海外市场?对不起,这个权益也归属出版机构。搞成电子版?对不起,出版机构没点头你作者不能干。故而,码字的,和印字的,很象演艺人员和经纪公司的关系。你看着那些影星们在台前人五人六的,真正赚钱的,都是背后的经纪公司。 至于译作,译者就更可怜了。可怜到我都不想告诉你(为何道宽先生一哭!)。 所以,写作者和出版机构,是两码子事,有时候,他们的利益甚至是对立的(下文解释)。出版机构还包括两种:专业图书策划公司和出版社。专业图书策划公司就是书籍这个行当里的经纪公司,他们不仅经纪一本书,甚至经纪一个人。不过他们没有书号,需要向出版社索取(或者购买)。专业图书策划公司是一个彻底的商业公司,完全不承担除商业以外的义务(有时候一些大学出版社有这类义务,做一些不怎么赚钱的书,不过通常也需要基金立项来保本)。说它们是搞文化的?姑且算之,以赚钱为核心的披着文化皮的商业机构。 在图书市场里,在大众面前,通常就是作者和售卖渠道(以前是书店,现在是当当卓越这类网商),但其实,这两者都不赚钱。真正相对赚钱的,是图书策划公司,以及出版社(在音乐产业里,就是唱片公司)。 既然是真正赚钱的,故而就特别看重所谓的著作权。因为一旦被侵权,它们的利益就受到最大的影响。这些机构,自身自然也有一定的风险,比如没包装好,眼光不准没搞好一本书。做十本书,两三本大卖,七八本亏本或刚保本也不算稀罕。而这三本大卖的书,如果还让人给免费传播了,那可就亏大发了。 故而,百度真正动及的奶酪,是它们的。 现行版权体系之恶 我前面说到的是,百度是侵犯了现行版权体系下的他人权益的。但作为一个每月要写十几篇专栏文章经常有点稿酬的码字者,我一点也不想掩饰我对现行版权体系的厌恶和痛恨。 先把目光投到很久很久以前——大约在1453—1456年间。 德国人谷腾堡捣鼓出了一个新玩意儿:印刷机。这被称为“谷腾堡革命”。印刷机出现的意义是巨大的。因为在印刷机没有诞生之前,人们复制一本书的唯一方法就是:誊写。誊写的工作效率很明显非常低下,以至于一本《圣经》被当成宝贝一样锁在教堂的桌椅之上。由于圣经稀少且只物理存在在教堂中,教士神父们就成了圣经的唯一解释者。而印刷机的出现,使得圣经在物理上被广为流传,打破了教廷对圣经的唯一解释权,最终引发了新教革命。而据马克斯韦伯的说法,新教伦理直接构成了资本主义精神的重要基石——这就是知识、思想、智慧的传播引发的整个社会变革。诚然,对于教士们和誊写者而言,这是一个噩耗。后者作为一种工种,已经基本消失。 现行的版权体系呢?它也在阻挡思想的传播:书价并不便宜,甚至有些书都已经买不到了,比如中国数字世界启蒙之作:《数字化生存》的译本,除了二手市场,你已经无法购得。而另外一方面,由于出版机构对于书籍作品的商业贪婪,使得很多国外的书籍普及到中国并不容易。我这里举几个例子: 网络法领域中的学术重镇,Lawrence Lessig所著的三部书: 《The Future of ideas》,2001年出版,中译本《思想的未来》,2004年10月出版 《Code》(第一版),1999年出版,中译本《代码》,2004年10月出版 《Free Culture》,2005年出版,大陆译本无,台湾译本《谁绑架了文化创意》2008年出版 再来看网络社会学家Manuel Castells著名的信息时代三部曲: 《The Rise of the Network Society》,2000年出版,中译本《网络社会的崛起》,2003年4月 《The Power of Identity》,2004年出版(第二版),中译本《认同的力量》,2006年 《End of Millennium》,2000年出版,中译本《千年终结》,2006年 看出点什么没有? 基本上,我们的中文版本要落后英文版本3年以上。那么,一部书的翻译工作需要多少时间呢?译者全力以赴的话,大概3个月到半年。 6个月变成3年,怎么回事? 很简单,版权金的讨价还价。以至于我们的知识更新比美国人的,落后3年以上(还不包括大量的书籍并没有中译本)。 是写作者本人不愿意传播他们的思想么?答案似乎并不如此。Lawrence Lessig后来还写了《Remix》以及《Code》第二版,他主动采用CC协议(具体说来:署名权-保持一致-不得商用),供人们免费传播。其实,对于很多写作者而言,ta的思想被传播,是ta最开心的事。有人替ta译介,ta乐见其成——这里插一句,我始终好奇的是,一本CC协议下的《代码》第二版,到了中国,就变成售卖48元了,中间是怎么回事? 但出版机构不愿意。他们的理由是:我们的合法利益要保证。如果我们没有利益,谁帮你出书?他们再用类似恐吓的语调说:如果写作者和我们的利益丧失殆尽,那么,你们就没书看了。 真的是这样的么? 在信息爆炸的年代,我丝毫看不出如果人们写东西无法获得利益的话就没人再写东西了的迹象。维基是一个最好的例子,写作者没有任何物质利益,但硬是造就了人类智慧文明上的皇冠。中国大陆现在每年出品的书籍种类大概是30万之多,而整个人类文明的书籍浩如烟海,不计其数。退一万步讲,话说得极端一些,这个世界,我看一百年都没有任何一本新书问世(这不意味着没有新内容的出现),也没什么了不得的。我们有太多的前人智慧尚未消化,而这个世界,已经成为Postman笔下的《娱乐至死》,我看没什么夸张的。 还是回归到稍许理性一点的层面上,好吧,我们需要写作者和出版机构获得利益,但现行版权体系是原子时代所构建的体系,它需要去适应比特时代,而不是让比特时代去适应它。时代演进中,动了谁的奶酪很正常,关键在于,你的奶酪在这个时代还能有么?当年誊写人的奶酪,就已被剥夺得一干二净,荡然无存了。 因为数字时代使得内容可以脱离纸张而独立存在,数字时代使得人们可以在互联网上发布自己的作品而无需经过传统的出版机构。而今天的版权组织和数字公司之争,说到底,争夺的就是这样一条渠道:出版渠道。在版权组织眼里,数字公司要进行出版,必须获得它们的同意。而这份同意,其实对文明的进步而言,并不具有“合法性”。 书籍的自由传播,真正的阻碍者是出版者而不是写作者。因为它的主要目的是赚钱(或者其它,比如意识形态),而不是传播思想。从过去曾被印刷机赶下岗的誊写人,到今天要被服务器赶下岗的印刷机,莫不如是。 CopyLeft的希望 我并不是一个藐视著作权的人,作为一个码字者,我很看重著作权:1、如果你胆敢把这篇文章的作者改成你自己的,我当然很不爽。2、如果你胆敢把这篇文章断章取义重新拼凑加入你自己的私货,我也很不爽。3、如果你胆敢把这篇文章拿去印在你的某本集子里卖书赚钱而不基于合理的原则分给我,我还是很不爽。—— 故而,我对于一些网站匿名转载我魏武挥的东西,我一向深恶痛绝不过又无可奈何。 这就是署名—保持一致—不得商用的CC原则之一。CC协议,又被俗称为Copyleft(相对于CopyRight),是版权所有人可以自行决断保留著作权中哪一部分的授权协议。有些内容贡献人,可以放弃所有的著作权项,而有些人,还希望保留一部分。 除了侵犯到CopyRight体系下的他人利益,百度文库的问题还在于:看上去它目前是没有商用的(它的页面没有广告),但还是会让人认为这是有商业目的的。比如说这个域名:wenku.baidu.com,是百度的二级域名,所有的访问量将计算在百度域名之下,对它在全球网站的排名有一定的支撑作用,而百度域名,正如baidu.com所标识的,这是一个商业域名。 在数字时代到来之前,CopyLeft是没有任何实操意义的,因为内容必须依附于纸张之上,而纸张的消耗,必然引起成本增加——这种增加,通常不是一个人随随便便就能负担的。但数字时代到来以后,人们发布作品的成本急剧下降,那么,就应该允许有些人完全不在乎商业利益而自行发布作品——我就是愿意让人免费阅读,不可以么? 答案是:有点尴尬。 因为所有的出版物,需要书号。这也是盛大文学目前碰到的一个尴尬:旗下文学网站上有太多的作品,其实没有书号。如果只是放在网上供人阅读,那么一个ICP经营许可证或可作为合法证明。但现在跑到电子阅读器中,怎么办? 但时代之轮滚滚向前,靠一个书号来束缚人们宪法赋予的“出版自由”,已经越来越不牢靠了。有人在这其中,并不想获取直接的利益,ta为什么不可以使用Copyleft协议呢?而有人,还是想通过码字来获得一份不错的收入,ta就一定要通过图书策划公司和出版社么? 未必。 数字出版的未来 最近有一则新闻,被称为“印刷业的地震”:一个美国大牌作者,《纽约时报》畅销书榜作家Barry Eisler拒绝了价值50万美元的图书出版合同,而决定选择自行出版模式出版最新的小说:即电子书。电子书虽然廉价,但作者可以从亚马逊中获取70%的收入分成,而昂贵的实体书只有14.9%。 人类文明的总体态势是这样两条线交织前行的:其一产业分工,分得越来越细,专业的事交给专业的人做;其二缩短渠道,最好是制造者直接和消费者交易,中间环节越少越好,因为中间环节的存在会抬高最终消费成本,同时降低最初制造者的利益。这两条线其实并不矛盾。产业分工并不等于拉长渠道,设置更多交易环节。 过去的书籍产业的环节已经显得过长。从写作者到阅读者,中间要经过策划机构、出版机构、印刷机构和售卖机构。书籍同时也是树木的杀手,在钞票都开始提倡无纸化的今天,书籍需要一定程度上的数字化。 实体书只给予写作者不到2成的版税分成,主要原因在于它们的成本太高了。纸张、油墨、库存以及运输都是成本(在中国,书号都可以算为成本)。而电子出版之所以敢给7成的利益,就在于它的成本极低——规模效应下,甚至是零成本。 我个人虽然更倾向于CopyLeft式的著作传播,但我不至于书斋到认定所有的写作者都不关心自己的物质利益。美国这位畅销书作者很显然已经意识到,什么样的做法能更大化自己的利益。内容生产者并没有变,但内容出版和传播渠道正在发生变化。今天的出版机构们,牢牢抱着现有的版权保护体系当救命稻草,痴人说梦罢了。 百度文库搞了一个“文库书店”的模块,这不代表着百度会全力进军数字出版领域,但我个人表示谨慎乐观:谨慎的原因在于国内所谓合法出版物还是有很多条条框框的。因为真正意义上的数字出版,是应该抛弃传统的出版机构:要它们在这个产业链条里干什么呢?我坐在电脑前用WORD码下20万的字交付数字出版,干你鸟事? 乐观的原因在于,我相信迟早有一天,整个出版业会抛弃今天的这种做法:书号式出版。一本书的价格和著作权授权,将由写作者做主。Ta可以选择保留一定权益的免费传播,亦可以随意定价,只要市场接受。抱着陈旧版权体系的出版者们,迟早向数字低下他们今天高傲的头颅。 相对于互联网,传统出版的效率已经低下了,故而,它们将被淘汰,必须的。 作者简介: 魏武挥,曾经供职于多家网络公司,混迹互联网多年,目前执教于上海交通大学媒体与设计学院,对一切数字化的互动媒体都抱有浓厚的观察、研究和批判的兴趣。 现为网易科技专栏之“数字与人”专栏独家供稿,与读者探讨数字化的媒介和人这种物种以及这个物种所构成的社会之间的关系。 相关日志 2011/03/29 — 一五一十部落:透视百度互联网“共享主义” (0) 2011/03/26 — 写给和百度作战的文艺工作者们 (0) 2011/03/26 — 南方周末: “盗书贼”百度的避风港 (0) 2011/03/26 — 韩寒:给李彦宏先生的一封信 (0) 2011/03/26 — 韩寒:为了食油,声讨百度 (1)

阅读更多

墙外or墙内? Free or Free?

来英国后第三天便有利物浦与曼联的“红色德比”,于是在之前一天晚上吃饭时,我便向两个已在这个宿舍呆了一年的球迷(一个韩国人和一个缅甸人)询问看球的方法。他们说,如果真想看球,通常是去酒吧;有时候宿舍的TV Room也可以看到重大比赛,但这样的机会不多,而且要征求其他人的同一;当我问他们是否可以在网上看视频直播时,他们一脸诧异地望着我,表示从来没有过如此经历。比赛当天,我尝试了几个国内外的视频直播链接,或是不能看,或是十分不流畅;加上宿舍规定中明确指出使用p2p一旦被监测到,就会遭到限速乃至封网,我决定不再冒险,甘心通过文字直播了解这场虽有些遗憾(当然是指对于红军球迷),却异常精彩的比赛。

阅读更多

CDT/CDS今日重点

十月之声(2024)

【404文库】“再找演员的话,请放过未成年”(外二篇)

【404媒体】“等帘子拉开,模特已经换上了新衣”(外二篇)


更多文章总汇……

CDT专题

支持中国数字时代

蓝灯·无界计划

现在,你可以用一种新的方式对抗互联网审查:在浏览中国数字时代网站时,按下下面这个开关按钮,为全世界想要自由获取信息的人提供一个安全的“桥梁”。这个开源项目由蓝灯(lantern)提供,了解详情

CDT 新闻简报

读者投稿

漫游数字空间