超级外链工具专题文章第6篇,对某站点942个链接进行人工检测,得出该检测报告,希望给你一个明确的指引,知道被刷链接的情况
图173-1:检测报告封面
在编写我的超级外链工具http://www.netcyw.cn/t1.html时,需要了解的第一件事情就是每种链接都会有什么表现,工具要能够对每一种表现作出正确的处理,工具在运行过程中不能弹出错误,不能闪退,不能中断。经过一一检测之后发现问题多多,简直是所有能够在网络中出现的问题都出现了。
数据来源
图173-2:数据的部分截图
本文介绍的内容是链接的问题,所以在此就不说数据是由谁提供的了,粗略的一带而过:数据来自于在百度搜索结果中排名靠前的一个外链工具,数据有942条。
检测方法
由于数据量较大,刚开始打算编写一个程序进行检测,编程语言是VB,使用的控件是XMLHttp。写好后测试时发现,使用这个控件还不足以体现链接出现的各种问题。然后使用了笨办法:在浏览器中一个一个的打开链接,然后查看页面的打开情况。942条纯手工测试,花了两天的时间。
浏览器使用chrome,测试环境为win7sp2 32位,电信网络,ip归属地为云南省,没有使用代理服务器,没有翻墙,被查询站点:www.baidu.com。
测试结果
测试的结果有很多种情况,先把测试结果贴出来,然后再一一介绍每一种情况。
1、正常。指能够正常的打开页面,有两种情况:返回状态时2xx或先301、302再2xx。
2、找不到ip。域名和ip地址的对应关系是通过dns服务器提供的,如果dns服务器中查询不到,就返回找不到ip。
3、超时。网页已经建立了链接,但是对方网站长时间未返回数据,可能是被墙的网站,也可能是国外的网站访问速度太慢。
4、框架拒绝。利用框架iframe,可以将一个网站插入到另一个网站中中,如果不希望自己的网站被别人插入,可以拒绝。关于这个问题后面会专门撰文讨论。下图是爱站网的响应头文件,其中的X-Frame-Options:DENY表示不允许在框架中展示。
图173-3:框架拒绝的头文件
5、4xx。指返回的状态码是4开头,表示服务器上文件不存在,有两种情况:(1)由服务器返回,这是真正的文件不存在,用户的请求未到达对方的用户层面;(2)由用户层面返回,服务器已经找到文件,并且将用户请求转交给服务器的用户层面,用户层面通过脚本返回4xx状态码。对于前者一定没有记录,对于后者可能会有记录,但是一般不会将记录展现出来,只有对方站长可见。
6、重置。指连接已重置。从技术上说连接重置的原因有很多,但是对于一个正常的网站(非正常网站可能是站长故意为之),短时间内由于各种原因可能会出现连接重置的情况,更多的时候则是被墙了。下面以alexa.tool.la为例,从下面的图中可以看出在国内无法打开,在国外可以打开。
图173-4:浏览器中链接已重置
图173-5:chinaz.com的国际测速
图173-6:chinaz.com的国内测速
7、网站关闭。指整个网站已经关闭了,不仅仅只是查询功能。下图的网站打开后提示域名可以出售,显然整个站点都已经关闭了。
图173-7:域名可以转让
8、拒绝连接。对方的服务器拒绝连接请求,一般是对方的站点指定地区的用户连接,比如:不希望来自中国的ip地址连接。
9、失效。网站存在,但是已经不提供查询功能了。
10、5xx。指返回的状态码是5开头,表示服务器错误,一般是对方站点有技术问题才会返回这样的状态码,可能是对方站长故意为之,不让网站打开,也可能是访问量太大,无法完成用户请求。
11、未发送。指没有向对方服务器发送任何数据。网络已经建立连接,但是对方的网站有问题,发送的请求数据对方无法应答。
从上面的分析可以看出如果将第1种“正常”的链接认为是有效的,那么正常链接占比为49%,不正常的占比为51%。
其中有一些链接并不能作为无效的链接对待,分别为:
- 超时:换个时间或网络可能会正常打开,被墙的话翻墙后可以访问
- 框架拒绝:不用框架的方式就可以执行成功了
- 连接重置:正常的站点出现连接重置一般是被墙了,翻墙后就可以访问
- 5xx:服务器的访问量不大时,或服务器问题解决后就可以打开
如果将上面的几种情况认为是有效的。那么有效链接和无效链接占比如下图。
从图中可以看出32.2%的链接是无效的,这些无效的链接应该删除。在编写我的外链工具的过程中已经删除了这32.2%链接,仅保留剩下67.8%的有效链接。这里就引出了我想对大家说的一句话:
之所以我的外链工具的链接数看起来比较少,是因为我删除了无效的链接
无效的链接留着也只是滥竽充数,使用外链工具的时候,既浪费用户的时间,又浪费服务器的资源。
有效链接
下面我们将有效的链接拿出来看看,占比如下图:
“框架拒绝”可以通过修改外链工具的代码解决,因此“正常”和“框架拒绝”可以认为是正常的链接,两者占比=72.3+10.02=82.32%,也就是说在有效的链接中有82.32%的链接是可以正常打开页面的。
“超时”中的一部分和“重置”可能是服务器被墙的原因,占比=11.89+4.23=16.12%,也就是说可能有16.12%的链接需要翻墙才能打开。
“超时”中的一部分和“5xx”可能是服务器问题导致暂时打不开,等到换个时间(比如:超过并发连接数限制)或等到服务器问题解决后可以打开。其中5xx占比=1.56%。
无效链接
下面来看看无效链接的情况,占比如下图:
“找不到ip”和“网站关闭”都是整个网站已经关了,占比=68.32+6.6=74.92%,这么高比例的站点进行整站关闭,一般有两种情况:(1)站点太小,开设的业务不足以养活一个站点,很大可能是站长在开设网站时盈利模式不清晰或者没有经过市场调研;(2)网络环境的变化使一些站点没有继续存在下去的必要,在测试过程中出现频率最高的就是网盘搜索类站点,前几年网盘铺天盖地的出现,网盘搜索孕育而生,但是随着国家对版权问题出重手,网盘几乎在一夜之间消失殆尽,自然网盘搜索类站点就没有存在的必要了。
“4xx”和“失效”是网站不再提供相关的查询服务了,占比=11.88+4.95=16.83%,一般是网站业务的调整导致的,一个网站存在的目的是为了赚钱,如果盈利不理想,网站就可能不提供服务了。
“拒绝连接”的网站很奇怪,由于网站打不开,也不知道里面提供了什么内容,没有被墙,却自己主动拒绝连接,占比5.28%。
“未发送”的网站也是一种奇怪的错误,已经和对方网站建立了连接,但是发送的请求却无应答。既然不能应答,接受连接请求做什么。
为了做好这个超级外链工具,我进行942个链接的手动检测,得出来上面的检测报告。大家在使用超级外链工具时一定要明白一点:并不是每一个链接都是随时有效的,对方站点可能随时关闭查询功能,甚至整站关闭,也可能会由于访问量太大超过了对方站点的并发连接数而拒绝连接,也可能需要被墙,翻墙可以增加不少的链接(要知道这些链接是不翻墙的人访问不了的),也可能由于国外站点的网络问题,有时候打得开,有时候是网络超时。
转载请注明:网创网 www.netcyw.cn/b173.html