220.181.108.*ip段的百度蜘蛛(提权蜘蛛),123.125.71.*ip段的百度蜘蛛(劣质文章捉取蜘蛛),123.125.68.*ip段的百度蜘蛛(考察蜘蛛)
图21250-1:
作为一个站长,略懂网站日志分析,网站会更安全。网站日志可以从ftp或服务器上面下载。下载后,我们可以通过相应的来源ip段进行分析,判别这ip段是否属于真实的蜘蛛。
下面小编就对笔者负责的站点日志进行分析。
第一、 小编从服务器上面下载了8-2网站日志
第二、 打开网站日志
通过上图,我们可以看出,这里面很乱看得有点累,而且很难分析到底有哪些ip访问了我们的站点,哪些页面被蜘蛛捉取了。竟然很乱,那么我们可以简单的处理,让难变易。小编这里是通过txt格式转换成xls。这样我们就可以一行一列的进行分析。转换后,我们可以通过案列进行分列,这样就可以一列一列的详细的按规律来显示出来。
通过上图,我们就可以清晰明了的分析客户ip来源了,具体哪些文章页面、哪个栏目被收录,我们都可以一眼明了,甚至还可也看出网站被爬取的状态。但从这里还是不能清晰的汇总出到底有哪几个ip段访问我们的站点。
至此,我们还要通过execl的数据筛选功能进行ip段类似的进行汇总,例如,220.181.108.121和220.181.108.78等c段之前都是一样的话,那么我们就可以通过c段相同的汇总在一起。具体操作,选择数据-自动筛选-自定义-包含-填写要归类一起的ip段。
从这里,我们就可以直接的看出有哪些ip类型访问了我们的站点,那么我们就要了解这些ip类型是好还是坏。
作为站长要知道哪些ip段是好,哪些ip段是不好,这样就可以尽量的避免站点问题的持续衍生下去。通常的ip段解读
一 220.181.108.*ip段的百度蜘蛛(提权蜘蛛):
这个ip段访问你的站点,那么说明你的站点目前很健康,一天访问次数越多,说明百度蜘蛛对你的站点非常的友好。一经抓取的页面,被释放的时间非常短。
二 123.125.71.*ip段的百度蜘蛛(劣质文章捉取蜘蛛):
这个ip段访问你的站点,那么说明你的文章质量不高,伪原创或者采集的相对比较高。虽然抓取了,可不会立马释放,释放时间比较久。出现越多者不好吧!
三 123.125.68.*ip段的百度蜘蛛(考察蜘蛛):
这ip段访问你的站点,一般是对于新站比较频繁,这ip段是考核蜘蛛,若对于老站经常出现这ip段的话,那么你的站点就有可能被降权,出现这情况,因立马对站点做修正处理。
四 117.28.255.*ip段的百度蜘蛛(假冒蜘蛛):
这只其实是一只假的百度蜘蛛,至于他是什么蜘蛛我们也无从得知.。但我们有一个方法可以判断真假百度蜘蛛:
点击桌面的“开始”图标-在搜索栏输入“CMD”-输入“nslookup”,
输入后点击确定,然后再功能框里面输入ip地址,ip地址只能手动输入,不能黏贴。
如果该ip地址是真的百度蜘蛛的话,那该就会显示“baidu”标识,如果没有看到“baidu”字样的服务器名就是假的百度ip。
五 222.77.187.* ip段的百度蜘蛛:
这个ip段访问,说明你经常使用chinaz工具,这个ip段是chinaz模拟百度蜘蛛来访问我们站点的结果。
网站日志分析,是作为一个站长每天必做的事情,对网站日志的分析要十二分的重视,切勿爱分析分析一下,不爱分析就都不管了。分析网站日志是一个站点长远发展的必经之路。好了,小编就对略懂网站日志分析,网站更安全介绍到此,欢迎高手留言交流!
转载请注明:网创网 www.netcyw.cn/b21250.html
官方倚天私服网(YtSf.Com),首家您值得信赖的倚天私服,倚天搜服,网站找服就认准YtSf(倚天搜服网汉字的拼音首字母)