网站日志是用于记录用户和搜索引擎蜘蛛对网站的访问行为,主要记录用户的IP地址、访问的网页地址、访问时间、访问状态信息等信息。通过查看网站日志可以帮助我们了解网站访客的行为,锁定攻击者的IP地址,避免伪蜘蛛对自己网站的采集以及网站死链的清理等一些列问题。可以说,查看网站日志是每一位合格站长的必修课,但是对于一些刚开始建站的朋友,面对密密麻麻的字母数字组成的网站日志文件难免云山雾绕,不知所以。其实,查看网站日志并没有什么难得,下面我们就来具体了解一下如何查看网站日志。

首先,我们需要明确的一点是,网站日志是根据访客的每一次操作行为而记录下来一条记录,所有的记录组成一份网站日志。所以说,当我们查看网站日志时需要将网站日志中的每一条记录分别开来进行查看,使用Windows自带的记事本文件是不会分条显示日志的,你可以使用Excel导入数据功能将网站日志文件导入到Excel中,或者使用Notepad++查看。下面是Apache网站日志的一行记录,我们就以这行记录为例来具体了解一下网站日志各部分的意义。

101.226.66.174 - - [21/Apr/2017:14:35:29 +0800] "GET /wordfence-security%e6%8f%92%e4%bb%b6%e4%bd%bf%e7%94%a8%e8%af%a6%e8%a7%a3/ HTTP/1.1" 200 13949 "http://blog.quietguoguo.com/wordfence-security%e6%8f%92%e4%bb%b6%e4%bd%bf%e7%94%a8%e8%af%a6%e8%a7%a3" "Mozilla/5.0 (Windows NT 6.1; WOW64; Trident/7.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; .NET4.0E; InfoPath.3; rv:11.0) like Gecko"

101.226.66.174:这是访客的IP地址(有可能是机器人,搜索引擎)

– :这一项是空白,这个位置是用于标注访问者的标识。

:-这一项还是为空白,这地方用来记录用户HTTP的身份验证。如果某些网站要求用户进行身份验证,那么这一项就是记录用户的身份信息。

[21/Apr/2017:14:35:29 +0800]:这里记录的是访客的访问时间。后面+0800表示的是该服务器时间所对应的时区与格林尼治时间相差+8个小时,即该服务器位于东八区。

“GET /wordfence-security%e6%8f%92%e4%bb%b6%e4%bd%bf%e7%94%a8%e8%af%a6%e8%a7%a3/ HTTP/1.1”:这一行的信息是整条记录中最重要的一部分。它表示以GET方式,使用HTTP/1.1协议访问了/wordfence-security%e6%8f%92%e4%bb%b6%e4%bd%bf%e7%94%a8%e8%af%a6%e8%a7%a3/路径上的资源,这一部分的格式为”%m %U%q %H”,即”请求方法/访问路径/协议”。

200:这是HTTP的 一个状态码,具体的状态码你可以点击这里进行查看。而此处的200表示客户端请求成功。

13949:这是此次请求中服务器向客户端发送的数据量,单位为byte。你可以通过将此字节数相加得出该时段服务器发送的数据量。

“http://blog.quietguoguo.com/wordfence-security%e6%8f%92%e4%bb%b6%e4%bd%bf%e7%94%a8%e8%af%a6%e8%a7%a3”:这是访客的来源(Referer)。这一段是告诉我们访客是从哪里来到这一个网页。有可能是你的网站其他页,有可能是来自搜索引擎的搜索页等。通过这条来源信息,你可以揪出盗链者的网页。

“Mozilla/5.0 (Windows NT 6.1; WOW64; Trident/7.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; .NET4.0E; InfoPath.3; rv:11.0) like Gecko”:这里记录的是访客所使用的浏览器userAgent,包括用户使用的操作系统、浏览器型号等,你可以通过这里了解访客的浏览器信息。

学会了查看网站日志,接下来便是分析网站日志了,你可以通过分析网站日志来查看自己网站是否被别人盗链了,是否有人恶意攻击你的网站,是否有部分网站内容存在死链,近期是否有搜索引擎搜录网站内容,是否有人恶意采集你的网站等问题。