网络作品“伪原创”手段花样百出 可在线自动生成

来源:法制日报
2017-05-09 11:12:00
分享

原标题:网络作品“伪原创”现象调查

调查动机

互联网内容生产市场的拼杀日趋白热化,优质原创内容可谓互联网上的“兵家必争之地”。在此背景下,不少平台推出网络作品申请原创功能,此举既可以保护原创作者的合法权益,也推动优质内容不断出现。然而,有不少人却瞄准了原创市场,炮制出“伪原创”作品。“伪原创”手段有哪些?《法制日报》记者展开了调查。

内容生产无疑是当前互联网经济的一大“风口”。不管是传统媒体的转型者,还是自媒体人,都将内容生产视作互联网经济的一个富矿,文字、视频、音频等产品不断出现在各种网络平台。

既然是内容生产,就涉及到内容的版权问题,衍生出了网络作品盗版侵权现象。不过,与传统的盗版侵权相比,网络原创作品还面临一种新的侵权形式——“伪原创”,即通过各种手段将原作者的原创作品变成侵权者的“原创”。

“伪原创”手段花样百出

刘思含目前在北京一家视频新媒体公司市场部工作,主要业务是负责公司生产内容的版权保护。

“我们是做科普、知识类视频的新媒体公司,在微信、微博等很多平台上投放医学、汽车等多个领域的内容。我们制作的每一个原创内容由三个部分组成,视频和详细的画外音讲解,还有相对精简的文字。”刘思含说。

一个原创内容包含视频、音频、文字三部分,按理说是不容易被他人直接“拿走”的,但刘思含恰恰遇到了这种情况。

2016年12月27日,刘思含所在的公司上传了一篇关于汽车外观的原创内容。“今年2月中旬,某微信公众号发出一篇文章,用了我们原创视频的截图,复制粘贴了文字版,把画外音整理成文字。在这个基础上,剽窃者给文章加了个开头和从网上扒来的图片。就这样,对方把我们的原创内容变成了他的原创作品。”刘思含说。

刘思含在微信后台与对方交涉,对方不承认。之后,刘思含所在的公司向平台投诉,并要求对方把稿子删掉,对方回复,“既然你们都投诉了,那就交给平台方处理吧”。

“被抄袭的不仅是我们的汽车公众号,我们制作的其他领域的视频,每周会发现并举报几次剽窃行为。”刘思含说。

记者调查发现,目前网上的“伪原创”抄袭方法还有不少。例如“洗稿”,就是把类似的几篇文章拼在一起,之后申请“原创”。

目前,常见的平台审查机制主要由机器完成,即按文字内容的比例来判断是否存在抄袭。不过,机器审查存在一个弱点,就是很难识别视频和漫画。

“我们公司以创作漫画或视频为主,抄袭者直接对视频进行截屏,将原创文章中的文字内容转换成图片,不使用文字,机器就很难识别出抄袭。”刘思含说,“我们与粉丝的互动是问答式的。在读者留言中会有一些提问,我们在互动中作出相应解答。我了解到,有的公号甚至抄袭我们和读者互动的内容,将这些问答内容搬到自己的文章中。”

在线自动生成“伪原创”

记者在调查中发现,除了刘思含提到的各种“伪原创”手法,还有一种模式——在线自动生成“伪原创”。

记者通过阅读多个“伪原创”工具的说明并试用,梳理出其制作过程和原理。“伪原创”的目标是通过同义词替换的方式,让搜索引擎认为是一篇原创文章,从而提高在搜索结果中的排名。“伪原创”工具或在线生成网站都有自己的同义词库,有的通过免费模式向用户开放一部分,另一部分更大的同义词库则要用户付费后才可以使用。

“用‘伪原创’工具可以把在互联网上复制的文章瞬间变成您自己的原创文章。”一个“伪原创”网站的说明这样写到。此类“伪原创”工具还可以在文章中随意植入想被读者看到的关键词或网址,以达到宣传作用。

记者把原创文章复制粘贴到这样的网站上,一键即可生成同义词替换过的文章,被替换的词通常用不同的字体和颜色标记出来。

在这个过程中,记者发现,专业类文章替换较少;生活类的文章替换掉的词较多;文章越长,替换率越高。在线“伪原创”工具还附带相似度检测、关键词排序、关键词统计、关键词组合工具等在线工具,文章整体替换的比例在10%左右。替换后的文章可读性降低,网站建议对文章进行人工修改提升可读性。一个“伪原创”网站在说明中称,“‘伪原创’文章最好将文章开头和结尾用自己的语言组织,这样的效果更好一些”。

记者使用相似度检测对原创和“伪原创”进行对比发现,机器识别出相似度在85%至98%之间。

记者在网站上看到一个生成记录,内容文本字符长度为734个字的文章,共替换了44个词长度为90个字符,替换比率为12.26%。原文和替换之后的文章相似度为92.6%,如此高的相似度怎么办?这些网站给出了进一步的“解决方案”。

“在线生成文章,将其粘贴入前两步已做好的‘伪原创’文章后一段即可”。记者点击“在线生成文章”发现,生成的并不是可读的文章,而是一段看似是中文的乱码。将这段乱码贴在文章最后,相似度降低到84.3%。

除了用乱码降低相似度,这些网站介绍称还可以在文章中插入图片,建议用户打乱文章顺序等方法。

此外,记者发现,网上还可以搜索到大量关于“如何制作‘伪原创’”的教程。

原创维权依然麻烦

作者的原创内容遭“伪原创”剽窃,将会有哪些损失?

“就商业价值而言,一篇文章招广告,卖价要看这个公众号的粉丝量有多少。大一点儿的公众号,一篇头条文章去年的价格大约是5万元;剽窃我们的公号,估计一篇头条文章的卖价在几千元到两三万元之间。保守估计也可以卖出几千元。”刘思含说。

刘思含告诉记者,从后台数据来看,如果是关于热点问题的原创,剽窃的作品可能在至少一个星期时间内对原创产生影响。对于科普内容而言,大部分都是没有时效性的,剽窃对于原创的影响时间持续更久。

面对“伪原创”侵权,原创者是否想过维权?又该如何维权?

“对原创作者来说,他们需要投入大量精力去制作优质内容,让他们去做维权的事情非常消耗精力。特别对于个人原创者而言,或许这一天或者一个星期特别有灵感,能写一篇特别好的文章,结果被抄袭的事情一闹,可能这一段时间他什么也做不了了。”刘思含说。

据刘思含介绍,对于公司而言,遭遇剽窃后的主要诉求就是让对方把文章删除。“我们会时不时在后台搜一搜关键字,看是否有未经授权的转载。没有经过授权的,就算是有些人标注了来自我们的公号,我们还是会联系对方把文章删掉。大部分抄袭的人都挺心虚,都会删稿。遇到不删除的,效率比较高的做法就是向平台方举报”。

记者调查了解到,不同的平台对原创举报的处理周期不同。有的平台,原创作者当天投诉,过几个小时就会出处理结果,有些平台审核过程会比较麻烦。“尤其是公司机构,需要出示一个企业声明,载明哪篇文章被抄袭,要加盖公章,扫描,上传。整个过程耗时短则两三天,也可能更长。”刘思含说,“走法律途径保护原创获得赔偿的方式,对公司机构而言太耗精力,不划算。”

刘思含所在的公司铺设了“全网”运营渠道,不管在什么平台上发现抄袭,都可以与平台方联系,将抄袭的文章删掉。“但是,对于个人原创者,这个工程则无法完成。一是他们发作品平台非常有限,不可能跟很多平台合作保护自己的原创。二是他们没有精力去沟通。”刘思含说。

近期,有平台推出一个叫做“维权赔付”的功能,意思是通过后台与平台方签订协议,如果遭遇抄袭由平台帮原创者维权。平台方先赔付50元,然后平台再帮原创作者走诉讼途径维权。诉讼成功后,再赔付100元。

“不管被剽窃的是什么内容,不管是视频还是文字,都是同一个价格。签订这个协议,意味着平台按照固定的价格赔付作者。然而,制作漫画和视频的成本高于纯文字的内容,我们认为这个赔付金额太少了。如果不签协议,我们确实不会走诉讼的途径。”刘思含说。

分享

推荐