新浪微博和今日头条作为我国两家极为具有影响力的内容聚合平台,对优质内容存在争夺。为了阻止今日头条从新浪微博移植内容,新浪微博设置了专门针对今日头条爬虫的ROBOTS协议,不允许今日头条的爬虫获取新浪微博的内容,对于被列入黑名单一事,今日头条以不正当竞争为由起诉了新浪微博(简称“头条爬虫黑名单案”)[1]。针对今日头条从微博移植/同步内容一事,新浪微博则起诉了今日头条不正当竞争(简称“微博移植案”)[2]。这两个诉讼明显具有相关性,一审原告均胜诉,在某种意义上,两个判决可能是矛盾的。
1、头条爬虫黑名单案
本案涉及新浪微博在自己的Robots协议中,将今日头条的爬虫放入黑名单。Robots协议简单说,就是一个网站会在自己的根目录下写明,哪些搜索引擎可以抓取数据,哪些搜索引擎不可以抓取数据,哪些内容可以被抓取,哪些内容不可以被抓取。其没有任何技术效果,可以视为一个君子协定,搜索引擎完全可以忽视Robots协议抓取网站的内容。在Robots协议中,User-agent代表搜索引擎,Allow代表允许抓取,Disallow代表不允许抓取。例如:
1.允许所有的搜索引擎抓取:
User-agent: *
Allow:/
2.不允许所有的搜索引擎抓取:
User-agent: *
Disallow:/
3.不允许头条爬虫抓取:
User-agent: ToutiaoSpider
Disallow:/
新浪微博即设置了上述第三种示例,特点在于仅有头条爬虫被放入了黑名单,其他爬虫都可以爬取新浪微博的内容。今日头条认为新浪微博具有限制和妨碍自由竞争的主观恶意,一方面导致今日头条无法及时、完整地获取新浪微博的内容,降低今日头条平台的良好用户体验,严重影响用户对今日头条服务的市场评价,客观上增强了新浪微博在相应市场竞争领域的市场优势地位,另一方面导致今日头条在相应竞争领域出于明显不利的地位。
一审法院认为,新浪微博在Robots协议中以文字宣示方式单方限制今日头条的网络机器人抓取对公众和其他所有网络机器人完全公开的相关网页内容,导致今日头条的网络机器人无法正常抓取相关网络信息,直接降低了“今日头条”平台的用户体验,影响了网络用户对今日头条相关网络平台的市场评价,也一定程度上降低了今日头条平台的竞争优势,损害了今日头条的合法权益。而且,也影响了网络用户对其所选择的“今日头条”客户端的正常使用,且在一定程度上迫使存在相关信息检索需求的网络用户只能通过其他平台获取相关信息,增加了网络用户的选择成本,损害了网络用户的选择权,从而损害了相关网络用户的合法权益。最后,一审法院认为,新浪微博作为互联网信息服务经营者,应当坚持诚实信用原则,公平对待其他经营者。但是,新浪微博以文字宣示方式单方限制原告今日头条抓取对其他经营者公开的相关网络信息,显然违背了公平竞争原则。法院认为,robots协议的设立初衷在于引导网络机器人更有效地 抓取对网络用户有用的信息,从而促进信息共享。本案被告新浪微博的涉案行为造成相关网络用户无法完整地获取相关信息,人为设置了网络信息正常流动的障碍,与互联网行业普遍遵循的开放、平等、公平、促进信息流动的原则相悖,与网络行业互联互通的基本价值不符,损害了网络市场的竞争秩序。
一审法院参考《互联网搜索引擎服务自律公约》,[3] 公约第八条规定,“互联网站所有者设置机器人协议应遵循公平、开放和促进信息自由流动的原则,限制搜索引擎抓取应有行业公认合理的正当理由,不利用机器人协议进行不正当竞争行为,积极营造鼓励创新、公平公正的良性竞争环境。”。一审法院认为,被告新浪微博本质上是在按照经营主体来区分网络信息是否可以被抓取,而并非按照信息内容本身区分是否可被抓取,此种针对性的限制措施显然与行业公认的robots协议公平、开放和促进信息自由流动 原则不符,与互联网行业普遍遵从的开放、平等、分享、协 作的互联网精神相悖,不利于维护公平参与、理性竞争的互联网市场竞争环境。
一审法院同时认为新浪微博的不正当竞争行为降低了用户对于“今日头条”平台的评价,客观上对于其在互联网业内的声誉产生了一定影响, 新浪微博除了赔偿外,还应当承担消除影响的法律责任。
2、微博移植案
2016年下半年开始,今日头条获取新浪微博用户发表在新浪微博的内容,主要是一些网络大V、明星等名人的微博内容,共涉及125个微博账户,发布在今日头条126个对应的头条号账户上(有一个微博账户对应了二个头条号账户)。新浪微博指控今日头条的行为构成对新浪微博的实质性替代。今日头条则辩称已经获得了新浪微博用户的授权书,可以同步用户在新浪微博发布的内容,用户对于其发布的内容同样拥有独立而完整的权利,其权利范围至少包括许可他人使用以及怎么使用。该权利不应受到“经平台同意”或“不得授权他人行使”的非法限缩。今日头条还抗辩其行为有利于拓宽涉案用户的宣传渠道以及提升提前其他用户的体验。今日头条参考欧盟的数据可携带权和美国的数据迁移,认为基于用户授权进行数据的同步是尊重和强化了用户对个人数据的控制。
一审法院认为,新浪微博通过长期、大量的资金、技术、服务等经营成本的投入,设立,维护和发展起新浪微博平台,为自身建立起市场竞争优势并获得商业利益。首先,新浪微博通过与用户订立服务协议、吸引用户注册帐号、发布内容,在向用户提供服务的同时,合法地对用户生成的内容通过新浪微博进行传播并加以利用,包括投放信息流广告等商业信息,以此获得商业收益。其次,新浪微博不仅为用户发布内容提供了服务,也为相应内容的生成提供了一系列额外的帮助和服务,如“@其他新浪微博帐号”“#话题词#”、特有的表情符号以及音乐、视频等内容的链接等,丰富和扩展了用户所表达的内容。再次,经过新浪微博的收集、存储、编排、管理、传播等经营活动,使得一个个单独用户生成的零散的内容,通过新浪微博平台整体地向其他用户和社会公众进行传播,并由此产生了巨大的商业价值,帮助新浪微博建立起了市场竞争优势。由此可见,通过新浪微博平台展示和传播的涉案微博内容,并不是单纯的、仅仅由用户生成的内容,而是在此基础上附加了新浪微博所投入的上述经营资源和服务之后而最终形成的成果。其满足了社会公众的相关需求,增加了消费者的福利,本质上是一种竞争性权益。尽管该权益并未在相关知识产权专门法或反不正当竞争法第二章中被具体列明,但应属反不正当竞争法第二条所保护的合法权益,故新浪微博有权在本案中依法提出相应主张。
就获得数据的手段,今日头条表示是通过用户手动发布(即微博用户手动将发布在微博的内容发布到头条号上)和技术性获得(即爬虫)。但是今日头条关于手动发布的主张并没有得到法院认可,因为微博公司提供了大量的反驳证据。
就获得用户的授权,首先,今日头条主张获得了部分用户的授权,并不是全部的125个账户。其次,今日头条主张获得授权的方式包括书面授权、入住视频授权、口头授权、电子邮件授权、邮件授权五种。这实际上是本案的核心,反映到数据保护法就是数据主体对自己的数据享有何种权利。法院认为,从证据规则出发,今日头条能证明获得有效授权的数量是非常有限的,占涉案微博账户的比例很小。法院继而评述了有效授权,认为民事主体对其权利的处分不得超出自身所享有的权利范围,不得侵害他人合法权益。例如,尽管小说的作者可以授权多个出版社出版其作品,但其无权许可其中的某一出版社使用其他出版社的版式设计;而唱片公司即使获得了词曲作者就某一歌曲的授权,也不得在未经录音制作者许可的情况下,将此前已录制好的该歌曲唱片径行予以复制。同理,在本案中,即使今日头条获得了一少部分用户的授权,但这些用户也仅可对其自己生成的文字、图片等内容授权今日头条使用,即在今日头条平台上进行传播。但在未经新浪微博许可的情况下,上述授权的范围不应涵盖新浪微博基于经营新浪微博所享有的相应合法权益。然而如前所述,从今日头条对新浪微博内容的移植情况看,其展示在今日头条上的内容,已明显超出了授权用户自身生成并享有权利的文字、图片范围,而是扩大到了新浪微博运营新浪微博时对用户生成内容进行收集、存储、编排、管理、传播以及为用户生成内容提供帮助和服务的过程中形成和添附的其他内容。在此情况下,今日头条有针对性地将新浪微博的内容移植至今日头条,且主要集中在粉丝用户多、市场影响力大、吸引流量能力强的明星、大V等帐号上、这一点从仅仅120余个涉案帐号,在部分被诉行为实施期间涉及的6000余条内容,就产生了超过60亿次阅读量这一事实即可见一斑。据此不难判断,今日头条的移植行为,已使今日头条在涉案范围内足以产生对新浪微博的实质性替代效果,进而削弱新浪微博的竞争优势,损害其商业利益。
案例评述:两个案例的焦点问题是一样的,即平台对用户在平台发布的内容享有什么权利。站在平台的角度,平台实际上关心的是,这种权利对竞争对手平台有什么法律效果。对于非竞争对手的情况,一般而言平台会欢迎被爬取内容,因为这会帮助平台传播。将两个案例结合在一起,似乎可以得出这样的结论,即一个平台不应该禁止另外一个平台爬取数据,但是另外一个平台爬取数据后的使用情况也应当合规。这个结论听上去很合理,但很容易被片面理解。如果我们倒序解读这个结论的话,是不是可以理解为,如果一个平台爬取数据的目的是为了不正当竞争,只能制止这种不正当竞争行为,而不能制止爬取数据行为。这是非常匪夷所思的一个结论,跟常识都不符合。就第一个案例而言,我们可以做一个假设,如果新浪微博是禁止百度爬虫,那么很容易就可以得出这是不正当的行为的结论,因为百度爬虫的目的是为了百度搜索引擎,既不会实质替代新浪微博,还便利了网络用户的信息搜索。但是本案中,一审判决似乎没有认清头条爬虫并非搜索引擎这一关键事实,其裁判的结论值得商榷。
| 抓取内容 | 显示效果 | 网络用户 |
搜索引擎爬虫 | 网页URL和关键词 | 网页标题、包含搜索关键词的网页部分内容 | 点击后访问原网页 |
非搜索引擎爬虫 | 网页内容的全部或实质部分 | 网页内容的全部或实质部分 | 无需访问原网页 |
结合第二个案例可知,头条爬虫将爬取的数据在今日头条客户端展示,并不是传统的搜索引擎的展示方式,起到了对新浪微博的实质性替代效果,因此应当被定性为非搜索引擎爬虫。通过网络检索可知,今日头条的运营单位推出“头条搜索”进入搜索引擎服务行业是在2019年8月10日,[4]而且头条搜索使用的爬虫是Bytespider名称,而不是涉案的ToutiaoSpider。一审判决还认为新浪微博的不正当竞争行为降低了用户对于“今日头条”平台的评价,客观上对于其在互联网业内的声誉产生了一定影响, 新浪微博应当承担消除影响的法律责任。尽管Robots协议确实是公众可见的,但是不能脱离绝大多数网络用户根本不可能去查验一个平台的Robots协议的客观事实,因此就Robots协议而言,不存在造成信誉上的不良影响,只可能涉及交易机会,是财产利益的问题。这似乎也在印证一审法院没有准确把握Robots协议的属性和运作机制的前提下作出的裁判。就第二个案例而言,对于今日头条没有获得用户授权的移植内容,比较容易认定不正当竞争。但是对于获得用户授权的内容,一审法院的观点是即使今日头条获得了一少部分用户的授权,但这些用户也仅可对其自己生成的文字、图片等内容授权今日头条使用,即在今日头条平台上进行传播。然而,展示在今日头条上的内容,已明显超出了授权用户自身生成并享有权利的文字、图片范围,而是扩大到了新浪微博运营新浪微博时对用户生成内容进行收集、存储、编排、管理、传播以及为用户生成内容提供帮助和服务的过程中形成和添附的其他内容。由于存在移植非用户创造的内容的情况,认定不正当竞争也应当没有异议。但是一审判决关于“用户可对其自己生成的(发表在微博上)文字、图片等内容授权今日头条使用”观点,实际上是沿着个人数据控制权或者说个人信息自决权的思路提出的。这个观点的威力很大,因为他直接触及了问题的灵魂,即平台对用户发表的平台的上内容享有什么权利,特别是对竞争对手平台。
作为用户首次发表内容的平台,往往主张用户已经同意了平台的排他许可,因此再次授权是无效的。例如,根据《微博服务使用协议》的规定,[5] “1.3用户使用微博服务过程中,对自身使用微博服务的行为以及通过微博服务发布、公开的任何信息享有合法权利,承担相应法律责任。同时,用户同意:1.3.1 微博运营方对微博内容(微博内容即指用户在微博上已发布的信息,例如文字、图片、视频、音频等)享有使用权。1.3.2 未经微博运营方事先书面许可,用户不得自行或授权、协助任何第三方非法抓取微博内容,“非法抓取”是指采用程序或者非正常浏览等技术手段获取内容数据的行为。1.4用户在使用微博服务过程中应当严格遵守微博运营方所发布的Robots协议。未经微博运营方事先书面同意,任何用户不得以任何方式自行或委托任何第三方以违反上述规定的方式访问微博平台或收集任何微博内容。”这种约定的法律有效性值得商榷。首先,从合同法出发,这种约定有因为格式合同而被无效的可能性。其次,平台享有平台用户发布的内容的使用权是不言而喻的,但是这种使用权不宜作为排他使用对待。理由是,第一,如果科技借鉴著作权法中一般职务作品的理念,著作权由作者享有,但法人或者非法人组织有权在其业务范围内优先使用。作品完成两年内,未经单位同意,作者不得许可第三人以与单位使用的相同方式使用该作品。职务作品由于存在作者和单位的特殊身份关系,特别是单位向作者支付对价的事实(薪酬),单位仅仅获得了两年的附条件的排他使用(不得许可他人以相同方式使用作品),平台与平外用户的关系显然更加松散,付出的对价也更低,更不应该获得排他使用权。第二,平台用户发布的内容实际上是个人数据,用户发布的目的是为了获得平台的服务是客观事实,但是这些数据如果不能继续流通,实际上相当于赋予了平台数据垄断的效果,那么这会极大的增加社会活动的成本,例如其他平台或机构可能希望获得数据从事完全不相干的事情包括科研在内,网络用户的信息搜索成本也会上升。
本文赞成微博移植案中一审法院关于网络用户可以授权第三方使用自己发表在一个平台的内容的观点,但是这个观点应当附加限制条件,否则可能会带来新的问题。比如,用户对其在平台发布的数据享有的权利并不是财产权,也不是绝对的,可以说,用户获得平台的服务的对价就是交换用户数据,这个对价一旦完成交换,用户对数据的处理就要兼顾平台的利益,否则这就是一种用户违约行为。而由于平台不希望数据被其他平台获得是行业公知事实,在后的平台通过另一平台的用户同意去获得另一平台上该用户的数据,就很难在类似于“善意取得”的逻辑上成立。因此,今日头条仅仅通过微博用户同意,去获得微博的内容,被认定为合法,也在某种程度上会破坏互联网的生态,帮助大平台去掠夺其他平台的商业机会。举例而言,微信作为国民级应用,假如微信开始向其用户(几乎等同于全体手机用户)发送通知,告知为了提升用户体验,希望获得用户在其他购物平台的购物记录等,而且微信很贴心的准备了现金红包作为用户同意的答谢,可以想象,微信可以在很短的时间内获得用户网购的海量信息,这些信息自然可以帮助微信通过广告精准投放等手段去发展自身的网购业务,这对其他购物平台是极不公平的。
[1] 参见北京市知识产权法院(2017)京73民初2020号民事判决书,本文以新浪微博和今日头条同时代指各自的运营单位
[2] 参见北京市海淀区人民法院(2017)京0108民初24530号民事判决书,本文以新浪微博和今日头条同时代指各自的运营单位
[3] 《互联网搜索引擎服务自律公约》,是由百度、即刻搜索、盘古搜索、奇虎360、盛大文学、搜狗、腾讯、网易、新浪、宜搜、易查无限、中搜十二家企业发起的。公约规定,各签约方遵循robots协议,对于违反公约内容的,相关网站应及时删除、断开链接。2012年11月1日在北京签署。旨在提高搜索引擎服务行业的水平。参考百度百度介绍,https://baike.baidu.com/item/%E4%BA%92%E8%81%94%E7%BD%91%E6%90%9C%E7%B4%A2%E5%BC%95%E6%93%8E%E6%9C%8D%E5%8A%A1%E8%87%AA%E5%BE%8B%E5%85%AC%E7%BA%A6/6224968?fr=aladdin,访问日期2021年6月6日。
[4] 参考百度百科介绍,https://baike.baidu.com/item/%E5%A4%B4%E6%9D%A1%E6%90%9C%E7%B4%A2/23668990?fr=aladdin#reference-[1]-24179918-wrap,访问时间2021年6月6日。
[5] https://weibo.com/signup/v5/protocol,访问时间2021年6月6日。