【笔者按】本语录结合笔者2019年参与的一次讲座,深感讲座人思路清晰,深谋远虑,较之法律人而言,有着实践者对事物的独到见解与新颖分析。由此记下其语录,隐去具体身份信息,以飨读者。
因为是现场速记,文法上的问题,还请大家多多包容!
Part I 讲座部分
主讲人:A平台在数字经济时代在知识产权的实践上,我们认为走得比较靠前的,特别是每年海量的数据,达1千多万件的投诉量,以及其中衍生出来的许多故事。今天主要是根据此简单地与大家做一些分享,特别希望在座诸君能够为我们提供一些意见和建议。
A平台的核心业务就不多讲了,我们所有的业务板块都在上云,全部业务系统都在云上面迁,是未来整个业务的大动作。然后,A平台是一个有责任感的公司,有5亿左右活跃的用户,最近的数据已经到了7亿,然后每年创造的就业机会大概就有3千万左右。数字不再多讲。
今天主要分成四个部分进行阐述:
l 第一、传统知识产权保护在互联网的作用
关于“通知删除”规则就不再赘述。A平台主要围绕“通知-删除”原则来建立的,其是核心。A平台有专门的知识产权保护平台,即A平台的IPP平台,用户可以在其中进行投诉等。所有运营体系都在这个网站内进行的,里面有许多的板块。但到了数据经济时代,这里面的产生了一些变化。
在最初,这些都是运用传真机进行的。但到了15亿的数量级的时候,传真机的作用就不大了。所以,在此情况下单靠人已经不能解决问题了,当存量商品到了15亿。而每天新发的链接与商品的数量级已达到一千万以上,每年的权利人的投诉量也达到了一千万的数量级,这也是经过A平台两年的防控之后减少到的数量级。前年比去年减少44%,而去年比今年减少32%,所以说再往回倒退两年,投诉量就是两千万的数量级。
当前受理投诉处理的团队主要15个人左右,这样海量的投诉光靠人是不行的。而我们每年还接受政府的监管协查,每年估计协同监管机关处理10万多件。所以,传统的知识产权保护机制已经不能跟上时代的发展,不能在互联网上不能适用。因此,现实倒逼A平台进行一定改变和创新。
l 第二、当前互联网技术对于传统知识产权的影响
先看一个数字,如图,A平台对外承诺96%的投诉都会在24小时内处理,但如何实现生产工具与生产关系的匹配。单靠是人不够的,就需要依托技术。所以接下来将在两个方面阐述当前A平台是如何运用技术来处理只是知识产权问题的:
第一点,与政府如何进行有效地数据交互。权属是进行知识产权纠纷处理的大前提,所以在方面,A平台使用了大量的政府数据,比如说工商营业数据、商标的数据,企业信用贷款的数据,这些数据为A平台提供高效的处理纠纷提供了坚实的基础。所以,在后台系统中采用大量的数据匹配、比对的技术,以来确认权属问题,大大提高了工作效率。
第二点,A平台利用算法为小二进行赋能。如图,有伪造的商标权属证明,这些都是一般网上提交的,而这些证明都是网上提交的,所以有用PS篡改的可能性。所以,近期A平台上线了一个图片识别算法,有效运用各种图片算法识别侵权点,有效识别的图片篡改。随后,认为有篡改行为的投诉人将被记录到恶意投诉的权利人的体系中。
另外,A平台还利用不同图片的算法,对商品的图片侵权的行为进行识别。所以,在这些算法帮助下,当前自动化的效率已经达到了70%。也就是说,虽然有海量的投诉,但70%的投诉都由算法来自动化实现。而其他30%的投诉,如专利,还是需要人工进行。所以,基于算法,A平台的生产效率得到了提高。
刚才只是一个例子,事实上A平台后天还有许多种算法在帮助侵权判断和投诉处理,如无监督学习之类的,算法的效率有极大提升。如图,A平台还会使用不同颜色标注不同卖家,红色的卖家有欺诈类型,橙色的是造假者,而蓝色的是正常卖家。如一些代购的商品,系统在碰到这些情况,会根据多个关键信息进行监测识别,比如品牌价格的关键词、流量的监测、支付方式的变化、以及收货或退货的信息,比如一些“著名”的假货制作点,如福建莆田的球鞋,基本上现在所有的相关户籍的卖家都已被封锁,但有些仍更换地址继续售价。但其最后的退货地址一般都还是写莆田,所以后台可以通过算法进行识别,因此可以根据此物流信息进行判断。用户的评价也可以进入算法运用,而一些新的技术也被投入使用,例如OZR技术,logo识别技术,以图比图的技术。
直到现在,文本上表述侵权信息的情况已经越来越少,而主要出现在手写体之中。机器是很难识别这些手写体的。另外,A平台还在建立对直播的体系进行算法识别,从而杜绝侵权行为。所以,在这种情况下上千个算法在运作,A平台在此过程中对不同算法进行相应的选择,因为越是实时的算法,其相应的运营成本就越高。举一个案例,如针对LV的包,A平台采取的主动防控,主要是会去做一些关键信息的识别,如商标、ID number等。售假者也会在其商铺中进行巧妙的掩饰与修改,但A平台还是尽力做到主动的防控。
虽然,法律没有相关的规定要求平台主动防控,但是A平台还是加强这方面的工作,主要还是一个社会责任的问题。此外,虽然主动防控的水平发展到相当高,但是道高一尺魔高一丈。所以,A平台还与一些权利人进行了共建,如打假线索的互通,针对一些疑难领域,如造假问题,如何利用A平台的算法进行分析。A平台还曾经绘制一张“中国假货地图”,因为只有A平台有数据可以绘制。
最后,如图,A平台知产保护科技大脑,这是一张完整的框架图。结合A平台强大的大数据、算法、人工智能与云计算的能力,搭建强大的保护体系。
l 第三、数字经济时代技术对知识产权保护的创新与颠覆
刚才只是从现阶段A平台应对形势,结合当前立法,而进行的技术应对措施。而同样,A平台也在技术发展上产生一些创新,从而产生了一些典型案例,下面就根据具体案例展开。
如针对原创者来说,有一位在德国红点获奖的设计师的商品(作品),原本售价一千多,但被一些商家仿制后,价格只售几十块。所以,在这样情况下,好的原创创意并没有获得经济上的匹配。反过头来,在平台视角看,这样的设计是否可以成为外观设计专利,因为其还没有申请外观设计专利,在一些设计权属状况仍不稳定的情况下,如何实现维权,仍是一个问题。
A平台在经历该事件之后进行了反思。其发现当前有大量的原创的特色市场在,但在价值判断上看,知识产权原本是鼓励创新,创新者能够在平台中通过流量分配和利益分配的机制,实现丰厚的利益回报。所以在数据上的看,A平台特色原创市场过去两年的复合增长率已经超过了30%,每年新品的SQ数超过5千万,新品的销售额同比增长超过80%。所以,就开始质疑传统的确权模式是否还适应当前的互联网经济的发展。而互联网中存在所谓的“柔性供应链”,所以好的创意一定能在一周之内创造出来。而这种C2B的模式,在民间确实有强大的气候。所以,A平台能否在这种情况下实现事先的权利确定,保障原创市场的发展。如图,A平台举了许多例子。
原创很难,但复制很容易。一般一个新品的成交量在两个礼拜已经释放完了,而等到权利确权期太长,两个礼拜早就抄袭到处都是了。普通的版权登记25到30天可以拿证,而版权加急的情况下,6到12个工作日可以拿证,一些特别的加急则需要1万多的登记费,但这对于中小型卖家而言成本过高。所以,在此基础上,A平台就创立了原创保护的机制,包括了从用户的准入、权利的备案、抄袭的维权与ID的商业化,搭建了从用户准入、到平台确权、到平台维权,而此处的维权算法技术的自动化处理,还包括了帮助用户通过IP实现商业化的变现。从而实现保护的新模式。
数据不会骗人,现在原创保护的设计已经到了5200多家,整个首发的短视频保护商家已经达到了7万多家,整个短视频的备案数已经达到了两百多万家。这与一些传统的版权登记机构相比,已经在数量上大大超过。所以,互联网技术一定会提高保护的效率,并减低保护成本。整个图片的著作权保护,已经突破了一百万用户量,有几亿的图片在平台中进行保护,在未来随着区块链技术的发展,跨平台之间的保护亦可以实现,那么著作权的保护就能更快扩大权利人的权益。所以,新的商业模式也就应运而生。
新技术发展带来了快速确权的可能。所以,最终我们认为,在平台经济背景下,平台确权应该成为法律确权的有效补充,而这也是A平台一直对外在尝试的。包括了erdos在其平台中的一些广告图片,都已加入了A平台的确权保护体系之中。
l 第四、如何重新定义数字经济时代的知识产权保护体系
对于该点的思考并不是特别完整,所以也举出了几个例子供大家思考。
首先,数字经济时代电子商务环境中“通知-删除”机制是否存在处置过重问题。因为,承袭DMCA的立法,会不会存在过重的问题。有一个蓝牙耳机的商家的图片,已在平台上出售了20多万件,而对于该店铺而言,该蓝牙耳机也是店铺的流量担当与引流款。但是,其存在盗图的问题,被投诉后,按现行的规则是必须要删除链接的。然而,这里我们考虑的问题是一个盗图对该卖家所得到的利益,跟他这累积的20多万的销量进行比较,换言之,就是其行为与结果是否完全匹配,在平台经济的背景下是需要质疑的。因此,在背景下,权利的稳定性与侵权行为本身就是不稳定的,所以按照一刀切的方式是否会造成处置过重或处置不当的问题,给商家经营造成困扰。
其次,电子商务中商标抢注的问题也十分严重。有许多人天天关注A平台生意参谋中的热搜词,然后把热搜词注册成为商标,随后在平台进行维权或“敲诈”。比如把“破洞”或“呼啦圈”注册成为商标,甚至抢注非显著性商标或国外商标,以来维权。那么这些行为如何规制?虽然,新的商标法中对于恶意诉讼有双倍赔偿的机制,但是认定的过程中如何更多依赖于平台的力量,平台的数据,这些能不能成为处理恶意诉讼的中的重要参考。甚至平台是否能够将一些其中的热搜词提供给商标局,从而在注册中规避这些抢注。这些都是A平台可以做的事。
案例:知识产权保护灰黑产频现,对于恶意投诉中,知识产权法保护中的负面作用。所以,A平台在想通知-删除的机制是不是在平台下那么的不可知,是不是把所谓的“必要措施”从“删除链接”改成“移除侵权信息”等较为宽泛的词汇,从而给予平台更大的处理空间。另外,平台拥有的大量的数据,其是可以对平台中的知识产权的价值进行较好的判断的,虽然成熟的方法论,但至少在数据储备上已经做得比较完善。还有就是,在数字经济时代电子商务环境中,我们专利侵权,除了通知删除规则之外,有没有更好的方式能够在平台基本没有专利侵权判断能力的情况下,创立一些新的机制,如保证金、诉讼保全的机制,能够更好地处理问题。
最后,还是回到A平台的坚信——这个世界一切是以数字方式运营的,这个世界皆可数据化,所以我们相信一切数据的业务化,一切业务的数据化。所以,在此前提下,我们的想法是任何的产权,无论是知识产权,都是可以被量化的,只是没有成熟的方法论,但是数据的储备基本是足够的。所以,在此背景下,A平台就提出是否可以通过数据的展开,任何东西,包括知识产权也是可以量化的。从而进行评估与保护。
那么未来,A平台提出了十六字方针来形容未来的知识产权保护体系:技术驱动、平台确权、价值衡量、商业创新。
具体而言,随着算法、区块链等技术的发展,技术一定能不断提升知识产权保护体系的高层次发展。未来平台确权的方式一定能提升效率减低成本,同时通过方法的沉淀以及知识产权价值的不断量化,能够实现价值衡量与商业创新。
Part II 专家点评与自由讨论
主持人:接下来邀请各位评议人进行评论,A平台在知识产权保护方面的数据拥有巨大的优势,能为以后能为知识产权法提供一些具体的适用,从而为法律的变革提供动力与支持。
F君:感谢主讲人总的讲座。我对于平台如何运用技术处理投诉还不是很清楚,所以有几点想请教主讲人总。比如说刚才说的96%的投诉可以在24小时内处理,这里算法使用什么样的手段来判断商标侵权(包括了商标的查询与比对)?
主讲人:这个问题是比较复杂的。我先讲一下人的认知与算法认知的不同,并以此作为一个引子。就是,人为什么会认为耐克与阿迪达斯会是同一类的品牌,人的认知是今天我们看到这两个品牌都是由运动员来做广告代言,且两者的价位相当,买的价位相当,种类差不多,两者又经常在同一个地方同时出现,所以人的认知两者就是同一类。但计算机不是这样的认知,计算机要考虑的关联性要复杂的多,人又不能告诉其这种判断。而计算机如何进行判断呢“很简单,就是有1万个人搜索耐克,其中9999人又同时搜索了阿迪达斯,那么对于计算机而言两者的相关关系就达到了99.9%。这就是计算机的思考方式,对于计算机而言,可以将这个商品拆解成千上万个不同纬度的属性(Attributes),而当权利人的信息进行入了算法系统之后,就变成了一个trigger,而后就会就根据标准的信息跟这个商品的信息不断进行比对。随着,系统算法的能力(机器学习、深度学习)的不断的累积,因为我们还会建立逆反馈的机制,今天的建立的侵权,而商家也会有反馈(校验),而以此循环往复的校验,从而使得A平台算法的处理能力和准确度不断提升。我再举一个例子,如主讲人世石与阿法尔go的对弈,其在对弈主讲人世石时,其实自身已经对当前棋局进行了上百盘的运算,所以算法通过各种维度不断的校验,使得算法的能力不断得到提升。由此可以做到更好的判断侵权的能力。算法不是通过价格有多低,商标里面用了什么字,不是我们看到的信息层面上简单判断。而是在多个维度下,用了很多的行为数据,比如说这个人有没有存在低价引流的情况,所以算法的思考体系与人还是不一样的。
Z君:我们面对千万的投诉量,是如何利用技术进行自动化的判断和处理。在A平台成立开始到现在,A平台已经累积了近一个亿的投诉数据量。而这些数据基本都是通过A平台小二搜集的,我们对所有数据信息进行了投诉成立或不成立数据进行了拆分和沉淀,比如有全部的商家的信息,所有的权利人的信息,以及证明的信息与投诉理由。所以,到了今天,当前A平台的模式有主动防控的趋势,因为经过了历史的案例的学习,所以对于有些案件是基于历史判例进行对比的,但知识产权侵权是非常复杂的,所以有些案件是完全相符,则可以运用完全相同的在先判例进行判断侵权而否,这就是第一类,聚类——即基于历史所有的数据进行的判断;而第二种就是知识产权法律下,投诉提交材料本身的完整度,比如说商标识别中对于logo的识别,在其所有的图片和详情描述中是否提及了该商标;第三类可以总结为基于行为的判定,历史数据中的积累了大量的恶意投诉的行为的沉淀,所以在这种情况下可以基于行为数据进行判断。所以,大概就是这三种算法和数据运用的模式。
F君:谢谢回答,我大概知道了是怎么样一个逻辑。第一类就是对历史上的案件,沉淀下来形成了一种判断方法;第三类是运用行为,背后掌握了行为人的过往数据,从而对现有行为进行一定的判断。
Z君:而其实您说的其实是信用方面的数据,主要通过信用关系。而我上述的第三类其实是根据历史上所有恶意投诉的行为,对一些特别怪异的行为,比如在一些如双十一的节点上,系统就可能判断这个行为存在恶意投诉。但算法智能是辅助,细节上,一般80%会自动化处理,20%还会回到人工处理的环节。人工校验算法的正确度。
F君:所以我的理解是比如卖家被人投诉过,商品下架的情形,还有价格比较低的情况,还有产品质量比较低,从而形成了综合判断。
主讲人、Z君:其实事实上我们运用的数据维度会特别多,不光上述几种。其实我大概有几百种不同的数据维度来判断侵权成立与否。但单一维度我们一般不会使用,如权利人的信用或被投诉人的信用等。但所有自动化的背后都是有人工在监控的。
主持人:我有一个问题,后续的问题。从被投诉人的角度来看,其体验是如何?比如他如何与系统进行交流,如何得到信息和通知?
Z君:在此中A平台与商家的沟通,在线上都有相当完整的渠道的。首先,如果其今天被投诉,则会有邮件、旺旺、牵牛等即时通讯工具,其可以及时地看到通知,在卖家的个人信息中看到完整的投诉信息。系统可以给其完整的通知信息以及申诉方式,申诉也需在3个工作日内完成。而当前自动化的申诉已占到60%。
J君:这里是否在投诉和申诉环节之后就结束了?比如说被投诉后,就许多人直接不申诉。
主持人:算法是否在收到投诉之后就直接自动删除,还是其他?需要告诉对方其侵权内容直接被拿掉吗?
主讲人:这也不一定,主要看系统如何判断,系统会推算出来,不用通知对方其内容被拿掉。
W君:我记得刚才您说96%的投诉都会在24小时内被处理,那么处理是直接删除,还是给卖家一个法律依据?
主讲人:通知进来基本就是删除,所以删除率是83%,而有部分“乱投诉”就驳回或不予理睬。
F君:刚才说的处理措施的程度问题,比如说盗图,在技术上直接把盗用的图片直接删除掉,是否可行?
主讲人:这个问题呢,是A平台一直想做的事情。大家都应该知道二八原则,但平台是一九原则,百分之九十的销量在百分之十的卖家身上,而一个卖家百分之十的商品承担了其百分之九十的销量。所以,聚集效应在电商中表现得特别明显。所以,在这种情况下,其盗用的图片所获的收益是远远小于删除其链接而导致的损失。但这个过程中存在许多博弈,但权利人不一定这么看,其就是认为应该删除该链接。而我们的想法是否能够准确的度量,给权利人一定的量化的说明,从而平衡双方利益,实现对等利益的删除,我们有时觉得通知-删除确实对卖家而言太重了。是否需要根据流量分配的机制,谨慎删除,这里值得深思。
主持人:在以前做律师时办的国内第一起相关案子,就是EME(EMI?)诉新浪网的案子。核心的理由是新浪的网站中出现了对其作品的侵权,有链接直指EME的作品目录,而接下来的页面才出现了侵权内容。我方的要求是不要把涉及侵权信息的网页全部删除,起码对于仅仅呈现侵权作品目录的网页不需要删除。就类似于A平台当前的问题,删除链接没有理由将整个货架全部删除。
F君:主动防控如果通过所有信息判断卖家存在侵权,那么A平台会采取什么措施?
主讲人:我们采取跟驾照扣分的方式,偶发的侵权只是扣分,第二次扣跟多。国际上通用的三振出局的方式。而对于A平台而言,当权利人投诉的问题,主动防控能力远远大于被动防控能力。刚才讲的,投诉与主动删除的比例在16年时是1:16,然后现在是1:46。在具体方式上,A平台采取多维度的主动防控规则,对于计算机语言而言,神经网络与神经元的问题都运用其中。在此方面的投入和效率都是非常高的。当前,A平台与国外的大型平台相比,其优势在于数据量足够充足,在算法领域中,是样本越多,能力越强,算法的能力主要依赖于样本与数据的支撑。A平台在业界的主动防控能力和假货检索能力是世界领先的。
Y君:回答F君的问题,品牌对于此问题的理解的,对于品牌的特质形成一定的前置性的技术,对于投诉量变得越来越少。高峰期对于这些数据进行的分析。对于原创保护来说,erdos也是受益者,这对于整个问题,预售款才开始逐渐实现的。服装的20多天的售卖期已经是很理想的。
主讲人:我再补充几个案例。小狗吸尘器的案例,这个是淘品牌,网上就换成了“吸小狗毛的吸尘器”,但是不正当竞争的逻辑,所以在这种情况下A平台就通过算法保护原创品牌。
听众:侵权者也在想对策,PS一些授权书来进行申诉。
主讲人:大家对技术比较感兴趣。现在主动防控的事情,算法需要各种样本的训练来最终上线。对于99.5%的甄别技术的问题,一定要经历样本的训练实现。现在有想不到的商业模式,特别在知识产权领域中,专利代理内部发商品,从而自行投诉,监守自盗。数据不会骗人,生态中出现的代理人自发侵权信息在网页上,然后通知了权利人收钱后进行自我通知删除。对于恶意通知深恶痛绝,主要为了卖家能够有了更好的体验。知识产权系统内部的利益复杂,各方的利益和诉求是不同的,但一定要坚信数据的能力,数据可以拉近各方的距离。要坚守A平台企业向善的价值判断。
J君:算法涉及的参数变量,总不见得跟立法相同。在商标抢注的问题上,法院打击力度不大,这点上平台感触特别大,抢注对平台影响却很大,而A平台的规则与立法是有差别的。这对于A平台有什么影响吗?
主讲人:是否会遇到麻烦,A平台拥有的数据资产是立法或司法者中不拥有的。所以,在这种情况下,数据的拥有者如何将这些数据提供给立法或司法者,从而给予立法者司法者一些意见。因为,平台判断的恶意商标,但政府不一定认同。我们现在团队提出的理念是“work for society”,A平台希望开放这些拥有的数据,为法院或商标局提供一定参考。只要A平台的程序不能被打败,可以输个案。坚守程序不能输,因为好不容易构建的生态玩法不能由此失衡。
主持人:电商平台发展向上的动力,是否知识产权保护的问题会成为主流,在全国所有的平台来看,是不是所有的电商都已形成共识?因为有些灰色地带也可以带来利益。
主讲人:这问题就是思考A平台的价值观。首先就是要相信内在的价值,不质疑友商的做法。对国内的一些需求,对于这种需求的不能磨灭,历史阶段不能简单地定性;社会与人可以互相促进的,要从长远的角度看,比如看电影的角度,原本的盗版横行,而现在都愿意走入电影院,这就是人的意识的提升,这就是一种变化。对于开始的灰黑产业,A平台的绝大投诉都来自中国,但这个领域不能用数据去推理,但一些模式是会不断变化的。互联网模式与工业时代的竞争模式是不同的,是赢者全得的模式。互联网企业有两个重要的KPI,用户数与用户时长,这是互联网企业争夺的焦点。
主讲人:商业模式我们是不考虑天猫与A平台之间的区别,在互联网中只存在用户模式。对于友商而言,在不做价值判断的前提下,其实现了传统电商“人找货”转向了新的“货找人”的模式,有些做法也可以被A平台所学习。品牌入驻的核心背后是货物的供给。而应该重点考虑供给和新的消费。
主讲人:我们也会思考A平台是否可以成为国内外电商的一个标杆实现一种标准化、自律的楷模。我们想通过软件或平台作为服务的模式,即SaaS与PaaS模式,当然不是每个平台都会做价值判断的,所以社会需要呼吁的。不可能在行业内部实现这样的问题,不能光靠一家企业是不足够的。如何将被利用数据变为基础设施,由立法实现一些标准的确立。
主持人:我们的意思是否A平台可以通过努力,为立法提供一些标准,从而推广。
主讲人:我们也思考过版权中的区块链加平台确权的问题。但现在问题是,不是所有企业都有上云分享的意愿。
W君:立法者的问题,规定避风港的初衷是平台只做形式判断,但事实上商家平台还是在进行实质判断的模式,是为了商业模式的推进。这是平台的社会责任的要求。另外,实践中的法律都是做平等化处理,比如一年365天是不一样的。但是对于商家在一年中某些时段是不一样的,这对于立法提出了挑战,法律如何做差异化的处理,但这种差异化的处理是不是具有正当性,也是需要进行思考的。
主讲人:我在引申地讲一些思考。对于W君的问题,如何实现知识产权的量化。如何区别对待不同卖家,对于扣分制度是否需要进行更为细致的区隔。A平台没有执行难的问题,但需要突破的是处罚的量化,平台的管制一定要回到精细化的处理,所以对于这种问题,需要数据的支撑。A平台有这样的数据储备,但推到社会,其还不具备这样的数据储备,可能不能实现量化,这比平台要难得多。当然,也许根据整个社会诚信体系的搭建,这个可以实现。(本文终)