你的網站不收錄,讀完此文可能「救」你網站一命!

做網站優化不能單憑個人臆斷來決定網站發展方向,而是應該有計劃,有目的的去維護網站,否則就算是累死編輯,寫上千篇高質量原創,網站也未必能獲得優質排名,文章也未必會被抓取。那麼我們怎麼才能知道網站哪裡除了問題呢?其實我們只要拿到這份網站體檢“心電圖”就能很快找到問題所在。

你的網站不收錄,讀完此文可能“救”你網站一命!

什麼是網站“心電圖”

我所說的網站“心電圖”其實就是網站日誌。網站日誌裡能讓我們看到用戶以及各個搜索引擎蜘蛛的抓取情況,那個欄目甚至是哪篇文章幾點被抓取過多少次,都是可以看到的,我們可以通過服務器反饋的代碼瞭解網站到底是哪裡出了問題。

網站日誌中比較常見的問題:

1、反饋代碼200:這個是正常抓取代碼,表示頁面能夠正常訪問,出現這個代碼沒什麼太多問題。

2、反饋代碼300:屬於正常代碼,個人認為是根據用戶的需求跳轉到對應頁面。

3、反饋代碼301:沒什麼毛病,用戶訪問某一個頁面,自動跳轉到另一個頁面,301是可以傳遞權重的,如果我們網站改版了,URL有所變化,那麼做301跳轉到新的URL上提交給百度,這樣過段時間頁面權重會集中在新的URL上,302代碼同理,不多做介紹。

4、反饋代碼304:有問題,這個代碼個人感覺還是比較重要的,做網站如果304比較多會影響到收錄的,這個是我親身測試過,304代碼的意思是用戶或者搜索引擎蜘蛛訪問某一個頁面,但是頁面和上次來訪時結果是一樣的,也就是說,你這個頁面長期未更新,如果每次都這樣,那麼搜索引擎蜘蛛會降低對這個頁面的青睞度,抓取頻次會下降,這樣一來直接導致我們網站收錄量降低。

5、反饋代碼403:沒太大問題,這種反饋代碼是比較正常的,因為我們不可能讓用戶訪問所有資源,服務器雖然接到了用戶的請求,但是還是拒絕處理,這個問題對我們seo來說並不是特別嚴重的問題。

6、反饋代碼404:有問題需要關注。所謂404大家應該都知道了,就是頁面丟失了,用戶訪問卻沒有對應信息,就會在服務器裡反饋404錯誤。

5、而500等這些代碼都是屬於服務器問題了,如果總是反饋500這些,我們可以找服務器的運營商解決問題,比較常見的如下:

①500服務器內部錯誤,找運營協商解決。

②501服務器不具備完成請求的功能,找運營商解決問題。

……

好吧,懶得寫了,自己網上搜搜都有,總之工作上遇到500問題直接甩鍋給服務器運營商就可以了。

我們可以通過反饋的代碼,來解決一些比較直觀的問題,304問題頁面更新頻率低,看看能不能通過一些相關文章調取解決此類問題,另外一些經常不更新的頁面,設置nofollow也能避免經常出現304問題。

而404不用多說了發現就及時處理掉,提交一份死鏈文檔,給搜索引擎看,如果由於之前誤操作刪除了某一個欄目導致死鏈非常多,可以通過robots來屏蔽掉整個欄目,如果某一個動態欄目總是出現死鏈直接屏蔽抓取,用 這個Disallow: /?* 。

網站日誌在哪裡找?

網站日誌一般都是服務器裡生成的,具體怎麼操作,正所謂知之為知之不知為不知,我是不懂,也就不打誑語了,反正我的服務器後臺有一個log文件夾,裡邊都是每天生成的網站日誌,網站日誌尾綴都是.log,如果找不到直接問服務器運營商要,煩死他們丫的,哈哈……

至於網站分析工具,那還是真挺多的,我現在就用愛站工具包,不過如果你的網站日誌比較大,它就要收費了。還有網上有一個拉格好在線分析,不過最近貌似不能用了。比較專業的seo喜歡用什麼光年、逆火一類的分析工具,但我看基本就是為了做圖表好看一些,當然我就用過一兩次,可能有些老牌seo比較青睞這個,具體如何取捨看個人需求。

總結:網站日誌就是我們網站的“心電圖”哪裡有問題,直接看它就能找到,解決了這些基本問題收錄慢慢就可以保障了,但是隨著各大搜索引擎算法不斷完善,想要獲取好的排名,還需要多瞭解一些算法要求,像內容質量,網頁佈局等等,都是需要不斷調整,以後有機會我再聊聊關於最近的一些算法問題。

本文為北京趙巖seo博客獨家原創,如需轉載按照下邊的要求,否則我可能有時間的話會維權的……


分享到:


相關文章: