业内人士表示,刷单、刷量可影响消费者的决定,为商家赢得更多生意,平台也可给投资人一份好看的数据,因而数据造假已成为行业的大问题,甚至成为许多点评类网站的“潜规则”。据北京青年报记者了解,数据造假成本低廉,2元即可买1万视频点击,与此同时,追责的成本非常高,此前有视频网站起诉刷量公司,9.5亿次的造假换来50万元的赔偿。

  日前,旅行平台马蜂窝被曝数据造假,2100万条点评中有85%以上是从竞争对手网站抄袭来的。不论马蜂窝如何义正言辞地表示“文中所述数量与事实不符”,但马蜂窝平台上的确存在数据造假问题,这是毋庸置疑的。

  业内人士表示,数据造假问题,包括刷单、刷量、刷分、搬运原创内容等,已成为行业的大问题,也是目前许多点评类网站的“潜规则”。北青报记者了解到,这些数据造假成本低廉,2元即可买1万视频点击,或3毛钱购买到一条微博评论。与此同时,追责的成本非常高,此前有视频网站起诉刷量公司,9.5亿次的造假换来50万元的赔偿。

  马蜂窝承认数据造假行为

  此前,乎睿数据提供的数据显示,马蜂窝的海量点评中85%以上来源于竞争对手网站,马蜂窝的2100万条“真实点评”中1800万来自于抓取其他网站。马蜂窝上有7454个抄袭账号,合计从携程、艺龙、美团、Agoda、Yelp上抄袭搬运了572万条餐饮点评与1221万条酒店点评。

  而马蜂窝在回应中先是承认了数据造假的问题,其次表示没有文中所述的那么多。“点评内容在马蜂窝数据量中仅占比2.91%,涉嫌虚假点评的账号数量占比更小,马蜂窝已对这部分账号进行清理。”

  但这样的说法又被对方指出“偷换概念”。“这个‘数据量’是条数还是数据大小?如果这 2100 万‘真实点评’占的是条数的 2.91%,那反推马蜂窝的游记、攻略有7 亿条?明显不是。如果这 2100 万‘真实点评’占的是数据大小的 2.91%,那这个比较有什么意义?一条点评 100 字,大小只有几百字节,但游记里一张图片就好几 MB。一篇游记的数据量可能是一篇点评的几万倍,拿点评的数据量只占 2.91% 来说点评不重要?”对方还罗列了马蜂窝在首页显示“2100万条”真实点评的宣传,来说明点评对马蜂窝的重要性。

  几天后,在马蜂窝召开的新品发布会上,其CEO也当场承认,数据造假问题是存在的,只是文中所述内容与事实不符。有业内人士表示,数据造假问题已经是业内的一种“潜规则”,有人的地方几乎就有数据造假的问题,而目前不论是行业还是个体,都很少对该问题进行重视和追责,也就使得数据造假进一步成为一种“潜规则”。

  为何刷单?数据造假是初创公司“捷径”

  据业内人士介绍,在数据造假上,有两种造假的需求主体,一是商家,二是平台。对商家来说,在具有影响力的平台刷单、刷量,可以提升商家的排名和影响力,更多的好评和更靠前的影响力会影响消费者的消费决定,从而为自己赢得更多的生意。因此,在许多电商网站上,甚至许多线下的营销公司等都纷纷做起了代理生意,指导商家如何通过各种途径,包括刷单、促销、刷评价等方式,为自己带来利益。

  一位餐饮店铺的老板对北青报记者表示,自己新开了店铺,因为知名度和地理位置的关系,流量一直不大。“现在许多消费者都依靠网络平台寻找店铺,因此我们很重视这块。找了专门的营销公司帮着做,他们先帮我们提升店内的浏览量和点击率,然后再提升交易量和好评数,很有一套。假的带真的嘛,现在店里客人真的比之前多了很多,我觉得很值。”

  而对平台来说,为何对许多商家刷评论或刷单的行为“睁一只眼闭一只眼”,甚至平台自己也会偷偷去刷呢?因为对许多内容平台来说,数据就是生命,只有平台整体保持有足够多、足够优质的评价,消费者才会形成一种使用习惯,真是消费者打开次数多了、消费次数多了,就会带来更多的消费与评价。另一方面,是融资的需要。拿给投资人一份好看的数据,是每个初创公司的共同追求,短期内提升数据很难?数据造假可能是一条“捷径”。

  此前有平台被发现大规模搬运其他平台的评价,该平台承认了存在店铺违规转载的情况,并表示:“该事件发生是因为平台新上线试运营的推荐栏目,在未经授权的情况下对相关内容进行了违规转载。”平台新栏目上线,没有评价怎么办?转载其他平台的,这也是很多评价类平台都存在的问题。

  刷单成本低至2元起

  北青报记者调查发现,这种机械的刷单价格十分低廉,由于刷单、刷量、刷评论等相关技术已经很成熟,因此造假的成本其实非常低。

  例如在微博平台,一家专门做微博营销的公司开出的价格是5元起,“微博转发,点赞,微博投票,价格分别如下:首次体验价5元100个,100=10元,1000=80元,1万=600元;评论:30元=100个(注:指定一条微博至少100次起刷,不够100按100算)。去别人微博底下评论的赞,最低30元100个,微博阅读量10元1万,80元10万;视频播放量20元1万。”这家公司同时帮助用户增加粉丝,粉丝还分为初级、高级、精品和顶级几类:“高级、初级都是凑数的哦(就数量没质量),高级是有头像,初级就数量什么都没有;顶级、精品是真人,有自带粉丝跟博文的。”据透露,许多顶级和精品的账号都来源于盗取真实用户的账号,攻陷后,这些此前被精心维护的账号就成了别人手中的“武器”。

  而为视频网站的作品刷量,报价2元起。据一家营销工作室负责人介绍,目前所有的视频网站包括优酷土豆、腾讯、爱奇艺、搜狐、乐视、PPTV等都可以操作“刷量”,价格不等。其中,爱奇艺的分为两档,一档为“掉量的”,也就是以机器刷量,这种方式容易被爱奇艺以技术手段发现并屏蔽,10元1万次,7天内包补;另一档为“不掉量的”,价格为80元1万次,不过该档“不保证速度,需要排队,数据延迟更新,不接急单”。另外几家视频网站的刷量报价从2元1万到60元1万不等,有的承诺“掉量补”,有的则保证“快速”。一些刷量的商户显示月销近5000笔,由此获得的不法收益也较为可观。此前,爱奇艺就起诉了一家“刷量”的公司,并被判获赔50万元。

  而一位做“水军”业务营销公司的老总告诉北青报记者,一部影片在豆瓣的刷分投入在5000元起。他说,基本上每部影片或电视剧在推广期都有安排豆瓣刷分、微博炒作等渠道。虽然豆瓣方面一直查得很严,但豆瓣对影视产品来说还是非常重要,因此大量公司还是会去做。具体怎么做?该老总说,要根据具体影片、电视剧具体分析:电影相对于电视剧来说难度更大,“电影评论比较集中,一上映评论打分就蜂拥进来,基本是当天就开分(显示评分)。”未上映的新剧和新片“还没开分”,操作空间比较大;而已经上映的,就要做搜集数据、技术分析了。具体价格也要根据客户需求来看,较为小众的,较好操作,5000-20000元左右即可;而类似前段时间被质疑声音较多的《后来的我们》这种级别的,“可能要几十万”。他说,一般刷分不能单纯刷,还要和长短评论、点赞、讨论区搭配起来做,而这个价格通常是比较高的,“长短评、讨论区、点赞都有单价,就看项目需要多少量。具体是,长短评40元/条,讨论区40元/条,点赞2元/个;做这些项目都会附加四五星打分。”

  而对于餐饮类平台,价格则相对较高,询价中一公司介绍,“专业团队操作点评,点评价格3到6星VIP账号是60元一条,1到2星账号是40元一条。量大可以优惠。”为了保证可信度,对方还表示只用当地账号写。

  此前还有业内人士发现,蜻蜓FM通过强行后台自启动等方式对月活数据进行造假,一位用户随后便在知名社区“知乎”上爆出蜻蜓FM后台自启动代码。通过反向编译蜻蜓FM安卓版本软件,他发现该软件中隐藏有名为“普罗米修斯”和“宙斯”的强行自启代码。前者可以无声无息地在用户手机中,后台启动无窗口透明界面,伪造DAU(日活跃用户数);后者则可以自主触发广告商的广告,并回传给第三方数据公司,从而完成“用户自主点击广告”的操作进行广告费的欺骗。

  另外,蜻蜓FM的CEO在宣布用户数1.5亿的两个月之后就宣布用户数突破2亿,也就是说两个月之内涨了5000万用户,不少业内人士纷纷表示数据一定有问题,而数据造假的目的应该是增加广告收入和促进融资。虽然蜻蜓FM回应这些软件是新功能上线时进行AB对照测试、统计相关用户指标,以便产品决策的技术框架,但依然无法解释为何会增加广告点击量和日活数。

  平台也会主动抓取内容

  而平台自己也会利用“爬虫”等技术手段抓取用户信息或评论。据一位工程师向北青报记者介绍,一些网站可以利用“网络爬虫”来抓取,“爬虫”就是将正常人可以浏览的内容,用公开的查询接口读取出来,再归纳成文档。由于评价的内容是公开的,因此很容易被“爬虫”抓取,一些网站不仅抓取评价内容,连注册用户的内容也完全照搬。

  例如,小红书就曾被一网站批量侵权。多位小红书用户称,自己在小红书上的原创内容遭到点评网“达人”栏目的搬运,将自己的账号、头像和图片内容都搬运到点评网上。“前几天朋友告诉我在点评网上看到跟我的小红书账号一模一样的名字、头像、笔记内容,甚至是视频(我在此之前毫不知情)。和几个小红书的小伙伴私下聊一下,发现点评网上出现的一堆‘达人’账号,都是批量操作批量盗用小红书的博主账号。”点评网回应称,经调查,该事件发生是因为点评网新上线试运营的推荐栏目在未经授权的情况下对相关内容进行了违规转载,已第一时间完成所有内容排查与全部清理下线,并通过技术手段确保该类问题不再出现。

  百度此前也曾遭遇类似问题。百度公司未经许可在百度地图和百度知道中大量使用了来自大众点评网的信息,在百度地图和百度知道产品中搜索某一商户,页面会显示用户对该商户的评价信息,其中大部分信息都来自于大众点评网。后者将之诉诸法院,法院调查发现,由百度地图公证抽取的商户点评信息资料,其中涉及餐饮行业的1055个商户共使用来自于大众点评网的评论信息86286条,平均每家商户使用81条。有784家商户使用的评论信息中超过75%的比例来自大众点评网,且所有评论信息均全文显示并主要位于页面前列。因此,最后百度被判赔偿后者300万元的损失。

  法律规定刷单刷量者要承担责任

  事实上,刷量行为不仅会降低网站或商户的信用,更会造成不公平竞争。上述案例中不少平台或公司都由此被告上了法院,最终被法院判处赔偿。不过,为何还有大量的刷单、刷量行为呢?据一营销公司介绍,一是由于商家刷量的同时,也会为平台增加活跃度,因此很多平台睁一只眼闭一只眼,不会进行举报;二是举证难,许多营销公司刷量时会利用人工、技术等多种手段,伪装成真实评价,不易被发觉,更不易被取证;三是维权成本高,走司法途径等需要花费一定的时间成本和经济成本,而且最终被赔偿的金额也不高,例如爱奇艺被刷量9.5亿次,最终仅被赔偿50万元。

  不过上海徐汇法院知识产权审判庭庭长王利民则认为,应当维权。他说,在现代社会信息化浪潮中,信息、数据成为推动社会进步的重要力量,大数据以及相应应用技术尤为重要,已经成为市场经营者掌握竞争优势的重要因素。法律制度对于大数据信息所蕴藏巨大商业价值的保护与规制,应秉持保障交易安全、促进技术发展、尊重诚实信用以及公认商业道德的基本思路,刷量的行为会损害视频网站的商业利益,也会损害消费者的合法权益,应承担相应侵权责任。

  文/记者 温婧