专业IT科技资讯平台,关注科技、手机、电脑、智能硬件、电脑知识!
当前位置:主页 > 建站 > 技术分享 >

怎样看原始日志(网站日志)文件

导读:

  刚好关于流量统计和分析以前还没有谈过,这两天分几个方面专门谈一下。今天先来谈怎样看服务器原始

  刚好关于流量统计和分析以前还没有谈过,这两天分几个方面专门谈一下。今天先来谈怎样看服务器原始日志文件(server raw logfile)。

  网站服务器会把每一个访客来访时的一些信息自动记录下来,存在服务器原始日志文件中。

  一般主机提供商会在控制面板提供给你下载这个文件,如果你的主机提供商不提供原始日志文件的话,你就该换地方了。

  原始日志文件只是一个纯文字形式的文件,只要用文字编辑软件如WordPad或Notepad打开就可以了。

  下面是我从上个月这个blog本身的日志文件中随机选取的一行,我们来看一下它包括哪些信息:

  221.201.77.63 – - [02/Jul/2006:15:30:41 +0800] “GET /seoblog/2006/04/17/user-friendly-website/ HTTP/1.1″ 200 19031 “http://www.baidu.com/s?

  wd=PRADA%B9%D9%B7%BD%CD%F8%D5%BE&cl=3″ “Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Alexa Toolbar)”

  用户IP地址

  221.201.77.63

  这是访问人所使用的IP 地址,能够告诉你来访的人来自什么地理位置。如果你查一下这个IP地址所属位置,可以看到这位访客来自中国北京。

  日期/时间

  02/Jul/2006:15:30:41

  这是某一个文件被访问的时间,和IP地址结合起来,你就可以跟踪某一个特定的用户,从一个网页到另一个网页的访问顺序。

  时区

  +0800

  这个数字是相对格林威治时间的时区差多少。

  服务器动作

  GET /seoblog/2006/04/17/user-friendly-website/ HTTP/1.1

  服务器要做的动作要么是GET,要么是POSP。除了一些CGI脚本外,通常都应该是GET,也就是从服务器上获取某个网页或图片文件。

  例子里的这行意思就是按HTTP/1.1协议(protocol)获取文件/seoblog/2006/04/17/user-friendly-website/

  返回状态码

  200

  下一行是服务器反应是否成功。200就是说成功获取了文件,如果是返回了404,就是文件没有找到。401是需要密码,403禁止查看,500服务器错误,当然还有其他很多代码。

  文件大小

  19031

  这一行指的是所获取的文件大小,在我们的来自例子里是19031byte。

  访客来源

  http://www.baidu.com/s?wd=PRADA%B9%D9%B7%BD%CD%F8%D5%BE&cl=3

  这一段是告诉我们访客是从哪里来到这一个网页。有可能是同一个网站的其他页,有可能是来自搜索引擎的搜索页。

  例子里的是来自百度,搜索关键词是”PRADA官方网站”。

  这段信息是非常重要的。

  浏览器类型

  Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Alexa Toolbar)

  这最后一段所表示的是浏览器和用户电脑的一些信息。

  比如上面这一段所表示的是用户所使用的电脑是与Netscape兼容的Mozilla浏览器,Windows NT操作系统,浏览器是IE6.0,装有Alexa Toolbar。

  在这一段如果用户使用的是其他类型电脑或浏览器,你还可能看到这些代码:

  msnbot/1.0 (+http://search.msn.com/msnbot.htm)

  Baiduspider+(+http://www.baidu.com/search/spider.htm)

  Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; Maxthon; Alexa Toolbar)

  http://www.gougou.com RSS Online Reader

  Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

  意义不用解释,一看就知道了。

  跟踪用户轨迹

  这是很多网站运行者需要研究的地方。

  从日志文件中剔除对图片的访问,剔除中间插进来的其他访客的信息,只把来自某一个IP地址的用户在一段时间内所看的网页列出来,我们就能看到这个用户在你的网站上都做了哪些行动,看了哪些网页。

  用户行为信息给网站运行者提供很大的帮助。
    来源: Zac