如何让网页内容避免被adblock plus插件拦截

前阵子笔者的团队上线了一个Landingpage用于广告投放,不料网页内容却被 adblock plus 这个款插件拦截。从网页内容上看均是对用户非常重要的决策信息,而并非骚扰用户的广告,所以按常识这些内容不应该被屏蔽。
后来笔者通过分析HTML代码分析,发现前端工程师将图片及CSS文件放置在hosts/**/ad/201510/目录下,猜想插件应该是根据 /ad/这个目录结构判断图片内容为广告,最后验证这个猜想是对的。

作为一个死磕党的优秀党员,仅仅知道adblock会屏蔽/ad/目录下面的内容,显然是不会满足的。
于是,顺藤模瓜发现了这货:adblock plus chinalist easylist
接下来,就让笔者来扒一扒神奇插件adblock plus的拦截规则
1、常规广告拦截过滤规则 General advert blocking filters
包含常见的广告内容js及目录,例如

2、常规网页元素过滤规则 General element hiding rules
包含常见的广告class、id元素的命名,例如

3、联盟广告过滤规则 Ads-Union
包含常见的联盟广告调用JS和域名,这个过滤规则最恨,几乎涵盖了所有的联盟广告平台,例如臭名昭著的百度联盟、一起发、阿里妈妈、tanx、AG无双、好耶等等

4、弹窗 Popups
包含常见的弹窗广告

5、特定广告过滤规则 Specific advert blocking filters

6、特定元素过滤规则 Specific element hiding rules
这个规则将一些网站固定的某个广告位加以过滤

7、CSS样式白名单 CSS Whitelist
这个白名单包含了一些知名网站的忽略规则

8、链接白名单 URL Whitelist

9、恶意软件域名过滤规则 Malware Domains rules
10、Fixed EasyPrivacy
————-分割线————
下面的模块包含了全球通用的广告过滤规则,全世界网站主的噩梦
11、General advert blocking filters
12、General element hiding rules
13、Third-party advertisers
14、Third-party adverts
15、Specific advert blocking filters
16、Specific element hiding rules
17、Whitelists to fix broken sites

以上,这些就是adblock plus的所有过滤规则了,知晓这个规则可以让网站的正常内容避免被过滤,拉低转化率。
甚至可以研究这些规则,让广告免于触发过滤机制。
或者对于网站主也可以像inoreader一样加一个提示:

inoreader

rel=canonical最佳做法

通过在网页中添加 rel=canonical 链接,可以向搜索引擎发出重要提示,使之了解在对网络中的重复网页编制索引时应首选使用的网页版本。Yahoo!、Bing 和 Google 等多个搜索引擎都支持添加此链接。rel=canonical 链接可以使被收录的重复内容得以统一(例如导入链接),而且可以指定您希望在搜索结果中显示的网址。

建议您在使用 rel=canonical 时遵循以下最佳做法:
● 规范网页应包含其对应重复网页的大部分内容。
● 仔细检查您的 rel=canonical 目标网页是否存在(不是错误页面或“404 错误”页面)
● 确认 rel=canonical 目标不包含 noindex robots 元标记
● 确保您在搜索结果中是要显示 rel=canonical 网址(而非重复网址)
● 在网页的或 HTTP header 中添加 rel=canonical 链接
● 只能为一个网页指定一个 rel=canonical。如果指定多个 rel=canonical,搜索引擎就会忽略所有 rel=canonical。

参考:Allan Scott(Google 索引团队软件工程师)5 common mistakes with rel=canonical

聊聊Google的研究成果:56.1%的广告展示是无效的

该研究在Google及DoubleClick广告平台开展,涉及PC及移动浏览器,不包括APP及视频应用程序。
有效展示的定义:当一个广告图片50%的像素在屏幕上出现一秒钟即为有效展示!
(非常低的标准) 主要的研究成果:
1、广告主的可见状态。少量的广告主造成了大量的无效展现。研究发现56.1%的展现是无效的,同时广告主的平均(广告)可见状态是50.2%
VIEWABILITY DISTRIBUTION ACROSS DOMAINS
impressions-are-not-seen
2、页面位置的重要性。最可视的位置是处在每屏底部的右上方,而不是页面的顶部

most viewable

Average viewability by vertical position (728 x 90)

Average-viewability-by-vertical-position-320-50

Average-viewability-by-vertical-position-468-60

Average-viewability-by-vertical-position-160-600

Average-viewability-by-vertical-position-320-50
3、关于广告的尺寸。最可视的广告尺寸是垂直矩形
The most viewable ad sizes are vertical units

4、网页位置不是可视性的最佳指标。
Above the fold is not always viewable while below

5、不同的行业(广告)可视性不同。
Viewability varies significantly across content verticals
对于广告主来说,意味着:
1、不同的位置、不同的尺寸、行业、网站组,实际上是有不同的可视性,作为广告主需要根据自身行业情况策划和定位广告,以提高广告的可见度。针对目标站点,制作更吸引人的内容,以实现更高的可视率。
2、特别要注意投放媒体的质量,因为小部分网站主质量非常差。

对于网站主来说:
网站主在规划广告尺寸及位置时,应该重点考虑广告的可视、点击率

H5页面SEO规范

1、 使用规范的html5协议语言
2、 规范的DOCTYPE声明,HTML5采用
3、 增加移动化的META信息,方便搜索引擎和浏览器识别渲染,例如:

4、 URL要求简单、规范、唯一
唯一:网页与URL一一对应,不应该出现多个版本的URL。
规范:url一旦生成则不能更改,不同的类目、应用遵循统一的规则。文件与目录具有描述性,用户可以通过url预测网页的内容
简单:url必须使用小写字符;!, @, #, $, %, ^, &, * 一类的特殊字符应该使用短划线代替。
5、 引导爬虫抓取
例如:百度爬虫,该spider的主要目的是保证站点资源入库,包括pc资源和mobile资源。使用的UA是:
Mozilla/5.0 (Linux;u;Android 2.3.7;zh-cn;) AppleWebKit/533.1 (KHTML,like Gecko) Version/4.0 Mobile Safari/533.1 (compatible; +http://www.baidu.com/search/spider.html)
要求对该爬虫开放希望被抓取的所有资源,由于BaiduSpider的IP主要集中在北京,所以对抓取不做地域IP适配。
6、 Title、Description、keyword遵循PC规范。

建议避免以下情况:
1、 使用明显带有PC特征的Meta。
例如<meta http-equiv=”X-UA-Compatible” content=”IE=edge,chrome=1″> or <meta http-equiv=”X-UA-Compatible” content=”IE=7″ />
2、 使用<iframe> <object> <embed> 等TAG
3、 使用swfobject.js
4、 直接在原PC URL上自适配到手机页

H5页面SEO的站长工具
如果您想测试几个网页,可以进行移动设备适合性测试
如果您拥有网站,则可以访问自己的Google网站站长工具帐户,然后通过在移动设备上的易用性报告获取一个完整列表,其中会列出您网站上的所有此类易用性问题。

附一:百度移动搜索排名策略
百度移动搜索排名策略

附二:百度:2015年中国移动网站趋势报告

参考资料:
1、手机站优化指南V1.1-[百度官方版]
2、如何在移动搜索中保持优势-2013-12 baidu mobile-骆旭剑

2个高效检查链接跳转过程的工具

在工作中,数字营销从业者时常会碰到一些需求,例如:
1、检查URL链接究竟经过了那些跳转,以判断URL的标记是否生效。
2、检查URL的cookies生成情况,例如CPS链接
3、不通过点击广告,掌握Landingpage的地址,避免产生广告消耗

以苏宁易购的广告为例:
我们在优酷看见苏宁的广告
suning
右键复制需要检查的URL

方法一:使用Redirect Detective查询(推荐)
20150125200702
suningredirect

方法二:chorme审查元素工具或者Firebug插件 查询
HTTP

通过工具,我们可以发现:
1、本次我们查看的优酷广告,是由Tanx平台提供;
2、苏宁通过品友DSP投放该广告;
3、苏宁使用了UTM标记,监控本次广告投放
标记如下:?utm_source=py&utm_medium=dspxk7&utm_campaign=mm_10982364_973726_8930541,0aed0a16000054c4d64e1618001de0fa&utm_content=8

注:通过和宫鑫老板求证,复制广告链接然后在浏览器中粘贴打开网页,会造成广告扣费。因为此类行为和点击无异,跳转数据都会发送到服务器。而使用Redirect Detective等工具的排查,通常会被搜索引擎过滤

close