作为一个站长,略懂网站日志分析,网站会更安全。网站日志可以从ftp或服务器上面下载。下载后,我们可以通过相应的来源ip段进行分析,判别这ip段是否属于真实的蜘蛛。
下面小编就对笔者负责的站点日志进行分析。
第一、 小编从服务器上面下载了8-2网站日志
第二、 打开网站日志
通过上图,我们可以看出,这里面很乱看得有点累,而且很难分析到底有哪些ip访问了我们的站点,哪些页面被蜘蛛捉取了。竟然很乱,那么我们可以简单的处理,让难变易。小编这里是通过txt格式转换成xls。这样我们就可以一行一列的进行分析。转换后,我们可以通过案列进行分列,这样就可以一列一列的详细的按规律来显示出来。
通过上图,我们就可以清晰明了的分析客户ip来源了,具体哪些文章页面、哪个栏目被收录,我们都可以一眼明了,甚至还可也看出网站被爬取的状态。但从这里还是不能清晰的汇总出到底有哪几个ip段访问我们的站点。
至此,我们还要通过execl的数据筛选功能进行ip段类似的进行汇总,例如,220.181.108.121和220.181.108.78等c段之前都是一样的话,那么我们就可以通过c段相同的汇总在一起。具体操作,选择数据-自动筛选-自定义-包含-填写要归类一起的ip段。
从这里,我们就可以直接的看出有哪些ip类型访问了我们的站点,那么我们就要了解这些ip类型是好还是坏。
作为站长要知道哪些ip段是好,哪些ip段是不好,这样就可以尽量的避免站点问题的持续衍生下去。通常的ip段解读
一 220.181.108.*ip段的百度蜘蛛(提权蜘蛛):
这个ip段访问你的站点,那么说明你的站点目前很健康,一天访问次数越多,说明百度蜘蛛对你的站点非常的友好。一经抓取的页面,被释放的时间非常短。
二 123.125.71.*ip段的百度蜘蛛(劣质文章捉取蜘蛛):
这个ip段访问你的站点,那么说明你的文章质量不高,伪原创或者采集的相对比较高。虽然抓取了,可不会立马释放,释放时间比较久。出现越多者不好吧!
三 123.125.68.*ip段的百度蜘蛛(考察蜘蛛):
这ip段访问你的站点,一般是对于新站比较频繁,这ip段是考核蜘蛛,若对于老站经常出现这ip段的话,那么你的站点就有可能被降权,出现这情况,因立马对站点做修正处理。
四 117.28.255.*ip段的百度蜘蛛(假冒蜘蛛):
这只其实是一只假的百度蜘蛛,至于他是什么蜘蛛我们也无从得知.。但我们有一个方法可以判断真假百度蜘蛛:
点击桌面的“开始”图标-在搜索栏输入“CMD”-输入“nslookup”,
输入后点击确定,然后再功能框里面输入ip地址,ip地址只能手动输入,不能黏贴。
出现下图所示为真实百度蜘蛛:
出现下图所示为真实冒牌蜘蛛:
从上两图我们可以看出如果该ip地址是真的百度蜘蛛的话,那该就会显示“baidu”标识,如果没有看到“baidu”字样的服务器名就是假的百度ip。
五 222.77.187.* ip段的百度蜘蛛:
这个ip段访问,说明你经常使用chinaz工具,这个ip段是chinaz模拟百度蜘蛛来访问我们站点的结果。
网站日志分析,是作为一个站长每天必做的事情,对网站日志的分析要十二分的重视,切勿爱分析分析一下,不爱分析就都不管了。分析网站日志是一个站点长远发展的必经之路。好了,小编就对略懂网站日志分析,网站更安全介绍到此,欢迎高手留言交流!
尊重原创,注明出处,你就是在为互联网环境净化做出自己的一份努力。本文章由SEO皇冠网http://www.hg-seo.com/huangguanseo/99.html运营部编撰发布,文章首发皇冠营销网 - 关注SEO,SEM优化发展趋势分享营销推广技巧博客,原创文章,转载请留原创链接,谢谢配合~
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件! 如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
稳了!魔兽国服回归的3条重磅消息!官宣时间再确认!
昨天有一位朋友在大神群里分享,自己亚服账号被封号之后居然弹出了国服的封号信息对话框。
这里面让他访问的是一个国服的战网网址,com.cn和后面的zh都非常明白地表明这就是国服战网。
而他在复制这个网址并且进行登录之后,确实是网易的网址,也就是我们熟悉的停服之后国服发布的暴雪游戏产品运营到期开放退款的说明。这是一件比较奇怪的事情,因为以前都没有出现这样的情况,现在突然提示跳转到国服战网的网址,是不是说明了简体中文客户端已经开始进行更新了呢?