第一,log是什么格式
如下所示的ex120807.log就是一個日志文件。擴展名為.log格式即為日志文件( it外包 )。
第二,網站日志文件在哪
通常一個網站日志文件在空間管理后臺的logofiles文件夾下面( 電腦維護 )。每天系統會自動生成一個LOG日志文件。
網站日志文件是安全的,只有站長自己登陸空間管理后臺才能看見LOG日志文件。每天生成一個日志文件,一個日志文件里面往往記錄了網站下所有的記錄,包括用戶與蜘蛛的訪問信息,如:訪問頁面、IP信息、返回狀態等等等。所以,網站日志文件對于我們站長進行網站分析與優化有一定價值。
第三,log日志分析和查看
明白了log是什么格式,也知道了網站日志文件在哪,站長們接下來可以將網站日志文件下載到電腦里面打開進行分析。
通常打開一個網站日志文件,可以看到下面這樣的一段代碼。一個網站日志文件,根據網站訪問和爬行記錄,由N段這樣的代碼組成,每一段代碼表示一條記錄。
接下來,筆者以這樣一段代碼來介紹如何進行log日志分析。
2012-08-07 04:08:46 GET /images/index5_22.gif - - 113.4.225.46 HTTP/1.1 Mozilla/5.0+(compatible;+MSIE+9.0;+Windows+NT+6.1;+Trident/5.0;+360SE) http://www.ittribalwo.com/show.asp?id=968 200 360
1. 2012-08-07 04:08:46:是用戶訪問時間。
2. GET:服務器的處理動作,包括GET和POST。網站日志中絕大部分都是GET,只有在進行CGI處理的時候才會出現POST。GET,就是用戶從服務器上獲取了頁面或者別的文件。
3. GET后面“/…”:是用戶訪問的頁面,只有一個斜杠表示網站首頁。
4. 113.4.225.46:用戶IP地址。通過用戶IP,可以查詢到用戶來自哪個國家、省份、城市。
5. HTTP/1.1:用戶訪問該頁面是通過HTTP1.1協議進行傳輸的( 服務器維護 ),也就是超文本傳輸1.1版本協議。
6. Mozilla/5.0+(compatible;+MSIE+9.0;+Windows+NT+6.1;+Trident/5.0;+360SE:表示用戶所使用的電腦是Mozilla瀏覽器,Windows NT操作系統等等。
7. http://www.ittribalwo.com/show.asp?id=968 200 360:這是代碼中最重要的信息。前面自然是用戶訪問自己網站的某一個頁面, 后面的200,表示用戶訪問頁面的時候返回的狀態碼。200后面的360代表的是被訪問頁面的體積。
常見的狀態碼有:200,301,302,404,500等。
200:表示服務器成功地接受了客戶端請求。這是最佳的,表示網站頁面正常。
301:表示用戶所訪問的某個頁面已經做了301重定向(永久性)處理( 辦公設備維護 )。
302:則是暫時性重定向。如果網站日志分析發現有過多的302,需要確認是否將301做錯為302。如果是,趕緊修改,搜索引擎不喜歡302重定向。
404:則代表所訪問的頁面已經不存在,或者是訪問的url根本就是錯誤的。
500:服務器的錯誤。
相關文章