APP推广合作
联系“鸟哥笔记小乔”
国家首次提出打击洗稿!洗稿之痛,到底痛在哪里?
2018-07-16 21:18:53

今天,国家版权局、互信办、工信部、公安部等四部门宣布联合启动 “剑网2018”专项行动。这个行动旨在打击网络侵权盗版,自2010年开展至今已是第9年。


值得关注的是,新媒体的“洗稿”问题在今年被首次提及,换言之,这是国家有关部门第一次提出打击洗稿。相关违规账号或面临新一轮严查,甚至关闭。


此次行动将整治自媒体通过“洗稿”方式抄袭剽窃、篡改删减原创作品的侵权行为,并规范搜索引擎、浏览器、应用商店、微博、微信等涉及的网络转载行为。


虽然其中并无提及更多细则,但仍不失为一个重要信号。消息一出,也再次引发部分从业者关于洗稿的讨论,以及对于背后一系列问题的思考。



洗稿这个词,新媒体人应该都不陌生了。


在内容创业时代,每个创作者都明白原创的艰辛,所以没有一个词可以像“洗稿”那样让我们深恶痛绝。毕竟,原文照搬的抄袭都是肉眼可见的铁锤,洗稿却能把你的东西改得亲妈都认不出但又让你觉得明明就是你的。

 

这是一种什么感觉呢,知名自媒体人魏武挥曾用“吃了苍蝇”来形容被洗稿的感觉。


此前,“和毛利午餐”因洗稿纠纷在公号上大战几个回合后,甚至以洗稿为题写起了连载小说,虽注明纯属虚构,但可见胸中愤懑。


从霍炬差评对簿公堂、六神磊磊手撕周冲、樱桃画报致信闪送、格十三发文指被众多账号洗稿至今……谈及洗稿,能被人很快记起的,往往至少有一方是头部大号。这些案例相较不为人所知的那些,还只是沧海一粟。


但目前,无论是法律、技术、平台亦或行业规范,似乎都很难解决这个问题。大多数情况下,原创者只能在家气到跺脚,破口开骂。不过问题仍然存在,而且是整个行业的痛点。


如何界定洗稿,如何推动解决洗稿难题,这背后有哪些错综复杂的阻碍?借着今天新推出的整治消息,我们尝试重新对这个话题做了一些梳理和探讨。或许不会起到更多帮助,但希望能抛砖引玉。



是为人类知识更新做贡献,还是剽窃?



洗稿并不是法律上的概念,而是传媒行业特有的名词。


关于洗稿的定义,国内传媒法专家魏永征教授曾在文章中介绍过,“洗稿”一词出于香港新闻界,当时指的是某个新闻事件,没有到场采访的记者从广播电视或网上的报道获取信息,撰文发表,或同行间分头采访后对事实交换共享,基本都不涉及版权问题。


但今天所说的洗稿,语义已经发生了变化。简单说就是,通过调整变换一篇原创文章的段落、字词、语序等,将其“清洗”成看似全新的内容,但实际上是变相的抄袭和剽窃,即“实质性相似”。


“半信半疑”改成“将信将疑”,“张三李四”改成“张四李三”,将文字转化成图表,图表改成文字,更有甚者,将一段话拆分成几段,或将几段话拼成一段,一篇文章拆成几篇,几篇凑成一篇。花样层出不穷。



有网友这样形容被洗之后的文章,由于很多洗稿都在替换同义词,导致最后“文章呈现出一种迷之外国人写中文作文的感觉,让原作者石化在电脑前,不想追讨,恨不得撇清跟这段奇文的关系”。

 

洗稿也不是什么新媒体的产物,在传统媒体时代或者更早,可以说有原创的地方就有洗稿,只不过呈现形式与带来的影响有些差别。总的来说,关于洗稿的定义并没有标准答案,但有一个大致的行业约定俗成的印象。

 

比如刺猬公社创始人叶铁桥认为,关键在于文字中是否包含了独特的劳动成果,如果是,应当注明源头以示尊重,“为了逃避被认出来,而在原稿基础上做改头换面和整容,就是洗稿”。

 

围绕洗稿,有一些比较常见的关键词:搬运,替换,拼贴,整合,思想抄袭。


随着资本的进驻,内容早已不仅是简单的个人表达,围绕流量、变现等一系列规则,创业者以内容为匙,建立起一个个商业工厂,不同类别的内容就像不同口味的面包,可以被批量制造。

 

原创者日复一日守着键盘码字总是苦兮兮的,而且单兵作战耗时长,运营推广能力弱,搬运党洗洗抄抄加个标题党,反而可能在短时间内以低成本的方式获得高流量。



除此之外还有一些其他因素在推动,比如用户其实不在意,或者说无法察觉文章内容是否洗稿。

 

再如知名自媒体人魏武挥曾提到,有些洗稿是为了应对百度新闻合并同类项的呈现规则,改成不太一样的文字以便获得更多点击。

 

在流量与资本的种种诱惑下,自媒体时代的洗稿大军横空出世,而且已成体系。


不少新闻媒体包括新媒体都研究过这背后的做号江湖,新榜也曾暗访洗稿的灰色产业链,得知洗稿者有人千字10元,也有人月入过万。


整个洗稿市场要比我们想象的成熟得多。其中有买卖双方,有人做中间生意,也有各种洗稿工具、原创检测工具和伪原创教学等等,还有不少传授洗稿技巧的文章和课程,美其名曰“间接为人类知识更新做出贡献”。



让原创者深恶痛绝的洗稿,对这条洗稿产业链上的从业者来说,这只是一项普通的工作而已。



“每天跟洗稿的撕逼都快让我爆血管了!”



即便再多人对洗稿者穷追猛打,目前要解决洗稿问题仍然有很多障碍。


现实诱惑的层面上文已经提到,其他比如洗稿的量大,我们所知的洗稿案例可能不过是九牛一毛。大号洗小号,文章刷屏被发现的概率更高,小号尚可发文鞭挞;小号洗大号,大号可能根本就无从发觉。


由此还带来社交网络上热点事件的伪盛况。新榜曾做过大量热点话题的数据稿件,几乎每次采集数据时都发现同一个话题,往往有很多标题和素材相同或相似的文章。


我们不排除其中有爆文带来的大量转载,但其中也不乏一些账号为蹭热点粗暴洗稿,于是我们能看到同一套素材,换着花样在不同的账号反复出现,仿佛大家用的是同一个素材库。




洗稿的方式和花样之多,又让整个问题变得更为复杂。自媒体之间洗的,新媒体与传统媒体之间洗的,还有自己洗自己的,比如矩阵号之间互相洗稿,一稿多用,外人很难对此判责。


还有跨平台洗稿的,几个内容平台洗来洗去,这也是维权难度最大的一类。


乌鸦电影创始人乌鸦就聊到这方面的困惑,他提到,目前微信公众号平台内的洗稿由于有原创标签保护还不算太严重,“更严重的是跨平台的抄袭和洗稿,其维权成本之高,需要提供的证据之多,流程之复杂,这都让原创者失去了维权的动力”。


这逼得一些自媒体人不得不多平台分发,稍晚一步,在其他平台可能连原创都标不了。


还有一些连原创都不必标的平台。比如自媒体人摇铃铛说,她的公众号文章被一个微博账号连续抄袭了三年,她每次看到都上去私信骂,对方虽然也道歉,但来年照抄不误。

 

“每天跟抄袭洗稿的人撕逼都快让我爆血管了!”提及抄袭和洗稿,摇铃铛整个人都处在一种暴走状态。



这也是推动解决洗稿问题的另一道坎,很多自媒体人并没有精力去处理洗稿。即便不走法律程序只是撰文撕逼(走法律程序就更不用说了),作者都需要搜集提供大量证据,一战就是几个回合。

 

“这他妈太累了,连六神磊磊都说怼人一次累三天,不是每个原创者都受得了这种折腾。”乌鸦感慨说。

 

除了举证难,成本高也是个问题,或者说付出与回报不一定成正比。霍炬当时索赔1块钱,明确说目的不在赔偿而是“测试”。也就是说,不是所有的账号都会选择用曝光等方式争取权益,此前就有被洗稿的小号通过协商让大号置换资源导流,作为补偿。


还有一个问题恐怕来自平台。此前,新榜曾发文《没有自媒体平台纵容默许,哪来的抄袭拼凑做号江湖?》,提到自媒体平台之间由于相互竞争和相对封闭,以及部分平台围绕补贴政策的内部腐败,诸如此类的问题,带来一系列破坏原创的恶果。


此外,有业内人士透露,一些平台会依据自身对内容数量的需求和外界环境的变化,来调整平台对抄袭、洗稿等劣质内容的判定规则和技术方案——当平台需要海量内容时,便对抄袭洗稿睁一只眼闭一只眼、放任和纵容;当外界环境发生变化时(包括主管部门监管或竞争对手起诉等),它们就会动用技术手段干掉那些抄袭洗稿而来的内容和账号(尤其是明显抄袭的内容)。



不过,最麻烦的还是洗稿的界定。


虽然上文也提到洗稿的定义,但在实际案例中,如何判定洗稿仍然是最大的难题,无论对平台还是法官(退一步讲,即便平台有足够的人力进行人工审核,恐怕也很难断)。


正如魏武挥所说,洗稿这种事情,感觉为主,“就是让看过原稿的读者,再读此稿,会有一种强烈的‘咦,我好像哪里看过’这种感觉”。



但主观感觉是很难讲清楚的。摇铃铛认为,“拙劣一点的洗稿还是很容易看出来的,更难界定的是把你文章的中心思想吸收了再用不同的例子和方式去表达”。


关键在于,能否判定是否构成了实质性相似,引起相关受众混淆,否则最多只能算“同题作文”。

 

其实也好理解,从法律的角度来说,假如认定范围过宽,反而会损害宪法保护的创作自由。但究竟是抄袭还是同题作文,这中间的度如何把握,目前还没有人能给出一个标准。



洗稿维权,需要更多的霍矩,还是区块链、哈希?



约束洗稿,显然不能纯靠一张脸皮。如何解决洗稿,其中一个核心问题正是上文提到的“洗稿的界定”,一直以来很多业内人士都在参与探讨:


1. 建立反洗稿联盟,制定行业公约

 

魏武挥之前在文章中就提到这个设想,建立一种反洗稿联盟、行会、公约这样的非盈利组织,由具备声望的媒体发起,制定一些洗稿的认定方式,然后公益性地聘请一些专家从业者来裁定。

 

但方案真要实行起来恐怕很难。自媒体人灰鸽认为,类似这样的组织成立后无非是吆喝几句,作用有限,“断人财路这事儿,维权成本极高,如果不是头部作者,被洗稿后有大家帮忙吆喝吆喝曝光一下已经很不容易了。”

 

2. 平台机制的优化

 

“罗超频道”认为,微信上的洗稿行为,通过二次申诉+人工审核,就可以清理掉大部分。“二次申诉应该不由机器审核,而是人工审核。如果人工审核之后还是认为没有抄袭,再给一次复议机会,换一个人审。”

 

增设人工审核的期待是好的,也不失为一种方法,但个人认为作用不大。一来腾讯不见得会增设如此多人力来做这件事,二来微信目前对洗稿同样没有判定标准,仅凭审核人员判断,恐怕会引来更多纠纷。

 

当然,这其中也有对平台作为的期待。此前,有业内人士认为微信的原创体系反而带来了更严重的洗稿。由于原创标后不开白无法直接转载,导致一些账号选择用洗稿的方式搬运。但由于微信目前在技术上无法辨别洗稿,反而给一些洗稿文打上了原创标。

 

事实上,微信也一直在强化原创的价值,不论是对违规抄袭的打压,作者体系的建立,还是对转载模式的探索。从平台的层面来说,应该更有机会通过机制和功能的调整,例如公号违规机制、打赏功能、流量主分成等作为监督和奖励的手段,创建更适合当下互联网语境的知识共享生态,通过优化内容创作分享的模式改善洗稿。



3. 技术的可能性


“传媒茶话会”曾发文提到,上海治宬网络科技创始人傅耀称,现在绝大多数公司都是依靠技术直接对比文章中字词的相似度,因此拿洗稿无可奈何,但只要改变技术路径,用语义分析便可解决洗稿检测的难题。

 

不过傅耀也提到,开发成本是个问题,目前尚无单家媒体做定制开发。但至少,提供了一种思路。

 

浙江大邦律师事务所律师熊磊之还提到引入区块链,比如将某个内容备案,将来引入各种机制,给有争议的内容打分,“打分的结果对人工智能来说也是机器学习的素材,这种例子多了作为人的认知什么情况下是洗稿,系统会越来越准”。


4. 留下文字标记,作为证据

 

对于推动解决洗稿问题,目前在法律层面值得参考的案例主要是霍炬案和于正案。

 

当时,霍炬案的结果是证据不足,驳回诉讼请求。霍炬一开始就在公众号里写,从开公众号的第一天起他就在文章里使用“文字标记”(一些独一无二的短句或词),其中一个原因就是为了应对将来可能发生的洗稿和抄袭。

 

霍炬说自己等这个案子已经等了很久,甚至用“狂喜”来形容自己的心情,他为这一战做了充分的准备,充分到让人感到有些悲哀——洗稿对对创作者的伤害之深,对这个行业的影响之大,竟然到了需要一个作者长年累月全副武装,在自己的文字里精打细算地埋雷的地步。

 

但他确实身体力行,找到了自己认为有效的方式,也就是“文字标记”。

 

通过独创一些全网无人搜索的短句短词,无形中在作者的文章中打上铁板钉钉的标签,而洗稿者很有可能无意中搬运,掉进文字陷阱。

 

5. 内容拆分,细节比对

 

洗稿不是抄袭,仅做字面上的查重是没有意义的,要对比就要将内容拆分做更细节的对比。

 

“架构师之路”提过一个方法是局部敏感哈希LSH(Locality Sensitive Hash):用相同的规则抽取集合中的少部分元素代表整个集合,如果少部分元素的重合度很高,非常可能整个集合的重复度也很高。也就是说,将一篇文章通过分词转化为集合来表示,然后在与其他文章的集合进行相似度对比(除了分词还可以考虑词频,以及词的权重)。



于正案在这方面也能带来一些思考。虽然是影视作品著作权方面的案例,但案件本质与自媒体的洗稿十分接近。

 

当时法庭考虑对比的因素包括台词、旁白、人物设置、人物关系、具体情节的逻辑编排、语法表达、逻辑关系、历史史实等错误、特殊的细节设计等等。

 

由于著作权的核心是保护表达而不保护思想,在表达并非完全相同的基础上,通过拆分细节在不同层面进行对比,能更深入地了解两部作品是否真正存在抄袭,或者说洗稿。

 

对自媒体来说,可以参考的细节比如有:文章创意、结构、主要情节、行文顺序、引用案例、主要观点、因果关系推导、人物关系、独特短句/用词、文章失误等。

 

如果能从这些细节出发一一比对,无论是发文控诉还是走法律途径,成功率都要高得多。尤其是一些文中特有的细节(比如特殊用词和失误),或许能作为洗稿实锤。

 

6. 个性写作

 

除此之外,霍炬还提过两个建议,一个是不要写基于信息的文章,“这样的文章最容易被洗稿,我只写带有强烈个人烙印,带有强烈感情和个人观点的文章,这种很难洗”。

 

这个建议确实有一定道理,不过可能也有例外,如果一个人真的想洗你的稿,变着花样都能给洗了。


7. 起诉

 

另一个建议是起诉。


“无论结果如何,去起诉吧,去测试可能性,去寻找机会,去帮助司法部门积累案例,无论怎么说都是由意义的”。用霍炬的话说,这就像钉了一根钉子,不致命,但硌手。

 

熊磊之也谈到,虽然全交给司法并不现实,但路径还是有的,“不过先需要多几个霍炬,毕竟司法总是被动的”。




我们常说,内容为王,这是内容创作者最好的时代,这句话究竟意味着什么。


某种程度上来说,内容创业能迅速崛起至今,是因为包容了各种不同生态的内容生产方式,让知识流通和共享的方式发生了翻天覆地的变化。


在此基础上,创作者确实有了最好的自我表达的阵地,甚至可以此为生,但在流量游戏背后,原创者是否也面临“劣币驱逐良币”的风险?

 

洗稿确实是个复杂的命题,但并非无解。重要的是,洗稿者不能永远肆无忌惮,也不会一直有利可图。谁也无法预知那根钉子什么时候会出现,不是所有的钉子都只硌手,关键的部位,再小的钉子也可能致命。


新榜
分享到朋友圈
收藏
收藏
评分

综合评分:

我的评分
Xinstall 15天会员特权
Xinstall是专业的数据分析服务商,帮企业追踪渠道安装来源、裂变拉新统计、广告流量指导等,广泛应用于广告效果统计、APP地推与CPS/CPA归属统计等方面。
20羽毛
立即兑换
一书一课30天会员体验卡
领30天VIP会员,110+门职场大课,250+本精读好书免费学!助你提升职场力!
20羽毛
立即兑换
顺丰同城急送全国通用20元优惠券
顺丰同城急送是顺丰推出的平均1小时送全城的即时快送服务,专业安全,准时送达!
30羽毛
立即兑换
新榜
新榜
发表文章2579
新媒体,找新榜。两微一抖小红书,KOL+KOC+Feeds,内容营销、电商带货、用户运营、版权分发。新榜——互联网内容科技公司,服务于内容产
确认要消耗 0羽毛购买
国家首次提出打击洗稿!洗稿之痛,到底痛在哪里?吗?
考虑一下
很遗憾,羽毛不足
我知道了

我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。


一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
    1)反对宪法所确定的基本原则;
    2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
    3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
    4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
    5)煽动民族仇恨、民族歧视,破坏民族团结;
    6)破坏国家宗教政策,宣扬邪教和封建迷信;
    7)散布谣言,扰乱社会秩序,破坏社会稳定;
    8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
    9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
    10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
    11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法规禁止的其他内容;


2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
    1)轻蔑:贬低、轻视他人及其劳动成果;
    2)诽谤:捏造、散布虚假事实,损害他人名誉;
    3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
    4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
    5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
    6)谩骂:以不文明的语言对他人进行负面评价;
    7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
    8)威胁:许诺以不良的后果来迫使他人服从自己的意志;


3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
    1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
    2)单个帐号多次发布包含垃圾广告的内容;
    3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
    4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
    5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
    6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
    7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
    8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。


4. 色情低俗信息,主要表现为:
    1)包含自己或他人性经验的细节描述或露骨的感受描述;
    2)涉及色情段子、两性笑话的低俗内容;
    3)配图、头图中包含庸俗或挑逗性图片的内容;
    4)带有性暗示、性挑逗等易使人产生性联想;
    5)展现血腥、惊悚、残忍等致人身心不适;
    6)炒作绯闻、丑闻、劣迹等;
    7)宣扬低俗、庸俗、媚俗内容。


5. 不实信息,主要表现为:
    1)可能存在事实性错误或者造谣等内容;
    2)存在事实夸大、伪造虚假经历等误导他人的内容;
    3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。


6. 传播封建迷信,主要表现为:
    1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
    2)求推荐算命看相大师;
    3)针对具体风水等问题进行求助或咨询;
    4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;


7. 文章标题党,主要表现为:
    1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
    2)内容与标题之间存在严重不实或者原意扭曲;
    3)使用夸张标题,内容与标题严重不符的。


8.「饭圈」乱象行为,主要表现为:
    1)诱导未成年人应援集资、高额消费、投票打榜
    2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
    3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
    4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
    5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序


9. 其他危害行为或内容,主要表现为:
    1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
    2)不当评述自然灾害、重大事故等灾难的;
    3)美化、粉饰侵略战争行为的;
    4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。


二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。


三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)

我知道了
恭喜你~答对了
+5羽毛
下一次认真读哦
成功推荐给其他人
+ 10羽毛
评论成功且进入审核!审核通过后,您将获得10羽毛的奖励。分享本文章给好友阅读最高再得15羽毛~
(羽毛可至 "羽毛精选" 兑换礼品)
好友微信扫一扫
复制链接