什么是刮板站点? –塞马尔特答案

抓取网站是使用某些Web抓取技术从其他博客和网站复制内容的网站。镜像此内容的目的是通过广告或出售用户数据来产生收入。各种刮板网站的形式和类型各不相同,从垃圾邮件内容网站到价格汇总和互联网上的购物商店不等。

可以将不同的搜索引擎(尤其是Google)视为抓取网站。他们从多个网站收集内容,将其保存在数据库中,建立索引,然后将提取或抓取的内容呈现给Internet上的用户。实际上,搜索引擎抓取或提取的大多数内容都已获得版权。

专为广告制作:

一些刮板站点的创建是为了使用不同的广告程序在线赚钱。在这种情况下,它们被命名为AdSense网站或MFA专用。贬义词是指没有任何兑换价值的网站希望吸引,吸引和吸引访问指定网站的访问者来获得广告点击。 Made for AdSense网站和博客被视为强大的搜索引擎垃圾邮件。他们用差强人意的结果稀释了搜索结果。某些刮板网站已知链接到其他网站,旨在通过私有博客网络提高搜索引擎排名。在Google更新搜索算法之前,黑帽SEO专家和营销人员中曾经有过各种类型的抓取网站。他们使用此信息进行垃圾邮件处理,并执行各种功能。

合法性:

已知刮板站点违反版权法。如果以不尊重任何许可的方式进行操作,那么即使从开源站点获取内容也违反了版权。例如,在Wikipedia上使用了GNU Free Documentation License和Creative Commons ShareAlike许可证,并且要求Wikipedia的重新发布者必须告知读者内容是从百科全书复制而来的。

技术:

刮板网站所针对的技术或方法因来源而异。例如,竞争对手通常可以将具有大量数据或内容的网站(例如消费类电子产品,航空公司和百货商店)作为目标。他们的竞争对手希望随时了解品牌的当前价格和市场价值。另一种类型的抓取工具从特定关键字排名较高的网站上提取摘要和文本。他们倾向于提高他们在搜索引擎结果页面(SERP)上的排名,并背负原始网页的排名。 RSS提要也容易受到刮板的影响。刮板通常与链接服务器场关联,并且在刮板站点一次又一次链接到同一网站时会被感知。

域劫持:

创建刮板站点的程序员可以购买过期的域,以将其重新用于SEO。这种做法允许SEO专家利用该域名的所有反向链接。一些垃圾邮件发送者试图匹配过期站点的主题和/或从Internet存档中复制整个内容,以维护该站点的真实性和可见性。托管服务通常提供查找过期域名称的工具,黑客或垃圾邮件散布者使用此信息来开发自己的网站。