由周四发布的“网络垃圾”(Webspam)报告可知,谷歌搜索在2021年过滤的垃圾网站数量、竟是2020年的六倍。据悉,作为Alphabet旗下子公司,Google有一套名为SpamBrian的人工智能垃圾过滤系统,并且可在超过 99% 情况下实现“不受垃圾所困扰”(spam-free)的搜索体验。

2021谷歌搜索Webspam报告

(来自:Google Search Central Blog

此前,SpamBrain已被这家搜索巨头用于防止用户点击那些可能被注入了恶意软件的有害网站、或旨在诱骗人们泄露个人信息 / 汇款的诈骗站点。

Google表示,鉴于垃圾信息散播者在持续不断地找到绕过过滤机制的方法,基于人工智能的筛查系统也是相当必要的。

需要指出的是,搜索是Google的重要收入来源之一。而高质量和安全的网站搜索结果,也对该公司来说至关重要。

经过多年摸索,垃圾网站制作方早已精通搜索引擎优化(SEO)技术,来人为地提升其搜索排名。

作为应对,Google也迫切需要排除掉那些利用欺诈算法的垃圾网站。

截至目前,Google已借助SpamBrain将垃圾站点砍掉70%,其中包括被黑客入侵并植入有害代码的感染站点。若被其得逞,受害者将被窃取登录凭据等机密信息。

其它类型的垃圾站点,还涉及将恶意软件注入受害者的计算机、或诱导重定向至恶意站点。庆幸的是,Google声称SpamBrain能够将这类害群之马排除在搜索结果之外。

SpamBrain

Google政策沟通经理Ned Adriance在一封电子邮件中提到:

欺诈者经常拙劣地模仿其它网站,常见套路是填充替换关键词、假借品牌徽标、并附上想要引诱受害者拨打的电话号码。

而Google的SpamBrain算法方案,能够基本上确保此类欺诈型站点出现在相关搜索结果页面中,且过滤了75%的乱码垃圾站点。

这些垃圾站点往往在一堆无意义的文本中填充大量关键词,以试图提升其搜索排名。有时甚至会砸钱挂上垃圾链接,来诱骗搜索引擎的爬虫和抬升PageRank品质评分。

对于用户来说,时间总是相当宝贵的。而Google的各种解决方案,就希望为用户带来更好的内容检索体验。

【背景资料】

Google于2018年推出的SpamBrain系统,且与近20年前刚开始治理恶意网站时相比,去年搜索过滤的垃圾站点数量已暴增200倍。

即便如此,这场“道高一尺魔高一丈”的垃圾信息攻防战,显然不会轻易完结。

本文提到: