很早之前就在博客统计中发现了来自各色奇怪网站的流量,而且之前也遇见过搜索引擎搜自己的博客,结果是各种奇怪的网站排在前面。之前也没在意,反正分了我的流量,我也没啥损失,加了原文链接的还能导点流量过来。今天再次想到了其中之一的“推酷网”,便尝试再搜了一下,看看到底有多少这样的无良网站恶意侵权,不试不知道,一试吓一跳。
搜索引擎
我以一篇博客的标题“深入理解 RecyclerView 系列之一:ItemDecoration”为关键字,在 Google、百度、必应进行搜索。
还是 Google 最给力:
必应倒还能搜出来,而且结果还挺整齐:
百度我就不说啥了,不过没搜出广告我也还挺欣慰的:
出于无聊的心态,我就点开了搜出来的结果,发现其中大部分都是经过备案的网站,那我在工业和信息化部ICP/IP地址/域名信息备案管理系统就查一下备案信息咯。
窃贼之一:推酷网
有原文链接,有广告,格式基本可以看。
窃贼之二:内存溢出
没有原文链接,有作者名字,没有广告,格式勉强可以看。
窃贼之三:Code Cloud
没有任何原作信息,垃圾广告一大堆,格式勉强可以看。
有趣的是,这个网站所有者还有一个微博,每次扒别人一篇文章,还会发一篇微博公告一下(当然没有原作说明),不过粉丝不多:微博 ilizhike。
窃贼之四:清屏网
没有任何原作信息,广告位还没租出去,格式基本不能看。
窃贼之五:第七城市
没有任何原作信息,满屏垃圾广告,格式完全不能看。
窃贼之六:阳和移动开发
没有任何原作信息,满屏垃圾广告,格式基本不能看。
窃贼之七:码迷
没有任何原作信息,满屏垃圾广告,格式基本不能看。
窃贼之八:电脑玩物
没有任何原作信息,有广告,格式基本能看。
窃贼之九:壹读
原文信息写的是开发者头条,满屏垃圾广告,格式基本不能看。
遗憾的是,这个从这个网站起,就都没有备案信息了 :(
窃贼之十一:cnblogs 安卓MAN
没有任何原作信息,格式基本能看。
窃贼之十二:oschina 丁佳辉
原文信息写的是 cnblogs 安卓MAN,格式基本能看。
(暂)完
好了,也就不费更多工夫再多查了,大部分窃取全文的都是有直接流量收益的。
像 推酷 这样的站点,要是学学 开发者头条,只引用链接,其实也还是不错的,如果只是为了分析内容,抓取只做分析用也是极好的,还能省不少存储空间呢不是?
至于在博客平台上进行窃取的,其实很早很早以前我也干过全文转载的事儿,不过我好歹还是加了原文链接呀,其实之所以全文转载,主要是怕只记原文链接将来哪天就访问不到了。不过那也是学生时代干的蠢事了。
其实我也不想怎么着,就是百无聊赖,扒一扒这些网站背后都是什么人,按理说知道备案信息之后,是能找到真人的不是?