定偉:百度如何處理不相關靜態搜索結果頁(搜索聚合頁)

其實宏觀來看,所有網站都只有兩種類型的網頁:內容頁和聚合頁。

內容頁是具體的信息頁,是網站的根本,也是用戶真正需要的頁面;而其他頁面實際上都是通過對內容頁的聚合,按照一定的規則把內容頁中的部分內容和內容頁的鏈接聚合到一個頁面上,按照URL層級設計、頁面內容及鏈接佈局,分出了以上所提到的內容頁之外的其他各類頁面。或搜索聚合,或標籤聚合,或格式化數據聚合,或屬性聚合,或專題化聚合。在數據庫中看,內容頁會有很多屬性和標籤,這些屬性和標籤就為“聚合”提供了便利條件。分類目錄頁、TAG聚合頁、專題頁等都是根據內容的單一屬性或標籤進行的聚合;網站首頁和頻道首頁是對內容進行了多屬性和標籤的聚合,只是為每個屬性或標籤單獨設立了一個數據調用模塊。在這些聚合中處處都透露著“站內搜索”的影子。既然除了內容頁之外都是聚合頁,那麼站內SEO相對就容易研究了。比如在常見的頁面類型中,研究除了內容頁之外哪類頁面是最容易獲得搜索排名的,這類頁面本身從URL設計、關鍵詞定位、內容佈局、內容頁的聚合方式、內鏈設計及外鏈獲取上相對於其他類型的聚合頁面有什麼優勢等問題。TAG頁是聚合頁,網站的傳統目錄和專題頁也是聚合頁,只是模板不同而已,那為什麼網站的目錄頁和專題頁就可以獲得良好的收錄和排名,TAG頁就不可以呢?此時就需要挖掘一下網站目錄頁和專題頁的特點和優勢,並把這種優勢也融入到TAG頁的設計中去。

可以通過人工為內容打標籤、讓技術配合使用中文分詞和TF-IDF自動為內容打標籤、直接為內容中的TAG詞添加鏈接等方法來為TAG頁增加內鏈。關於外鏈,由於TAG詞數量太多,所以不可能為每個TAG詞都導入外鏈,但TAG詞之間也肯定會通過站內搜索相關或語義相關,甚至按照數據庫ID順序平鋪推薦的方式進行內部推薦,此時只需要按照一定的規則提取出部分有代表性的TAG詞,如果結構上為這些TAG詞導入外鏈可以惠及絕大部分TAG頁面,那就為這些TAG詞專門導入外鏈就可以了。

關於聚合,大家可以多關注一下美麗說,能直觀地看出這是一個由各種聚合頁組成的網站,並且沒有傳統導航、麵包屑,“聚合”中的頁面質量、內鏈搭建和技術細節有很多可以研究的內容。聚合”只是一種表現形式而已,SEO如果只關注關鍵詞庫及聚合本身就有些膚淺了。站在SEO的角度,要考慮到網站實際內容量和內容類型,以及關鍵詞庫的質量和詞性分類等,站在網站運營和用戶需求角度考慮的就是數據的二次萃取和挖掘了。

網站內容繁多,把用戶最需要、最有價值的內容挖掘出來,以什麼樣的形式呈現給用戶,這才是需要更深入研究的。SEO不要只停留在關鍵詞和內容簡單聚合的表層,還需要嘗試著深入研究一下自身網站用戶的直接、橫向和縱向需求,以儘可能符合用戶需求、儘可能豐富的形式為用戶提供一種有價值的“聚合”。對於指定關鍵詞,在指定文檔中,往往詞頻越大的關鍵詞越能反映文檔的主題;

LEE在9月6日發佈了《不相關靜態搜索結果頁將被嚴厲處理》的公告:

百度網頁搜索反作弊團隊近期發現一部分網站遍歷熱門關鍵詞生成大量的站內搜索結果頁來獲取搜索引擎流量,其中存在大量的不相關內容嚴重損害了搜索引擎的用戶體驗並且侵佔了相應領域的優質網站收益,對於此類網站我們將做出嚴厲的處理,希望存在此問題的站長及時進行整改調整。

這個問題已經存在很長時間了,其實和百度一直打擊的垃圾TAG頁面是一樣的,TAG只是站內搜索的另一種展現形式而已。

客觀來看,TAG頁和站內搜索頁都是一種很有價值的頁面,在專業網站內,使用這種形式對網站內容進行二次萃取,把網站內容以聚合或專題的形式展現出來,讓搜索用戶可以更加快捷方便的找到和瀏覽自己需要的信息。百度原來也很青睞這種頁面,因為這些頁面可以在一定程度提升百度搜索結果的質量。

但是隨著精明的SEO的介入,發現了這種頁面更容易獲得搜索排名和流量,進而使得這種頁面大部分淪為了惡意搶奪搜索流量的垃圾頁面。SEO們為了搜索流量,不顧關鍵詞的質量以及自己網站是否有相關內容,而隨意導入關鍵詞和生成頁面。並且為了加大頁面和關鍵詞的相關度,SEO們不是在

搜索結果相關度上想辦法,而是把重心放在了人為堆砌關鍵詞和導入錨文本鏈接上。SEO們不管詞本身是什麼,只要有搜索量(或指數),甚至只要是一個詞,無論有沒有搜索量,都直接導入站內,根據一定規則生成TAG或搜索結果頁。由於詞本身質量以及和網站定位相關性問題,再加上網站本身內容多少的問題,造成了今天很多網站都在使用這種方法制造垃圾頁面的現象。

在此拋開LEE所給出的例子,來討論一下這種原本優質頁面在今天之所以會變為垃圾頁面的根本原因:

1.關鍵詞本身規範問題

SEO不管關鍵詞的類型,都直接導入站內,使用統一的模板生成頁面。比如有些網站會硬性把“電磁爐”“電磁爐圖片”“電磁爐品牌”等詞導入站內生成統一的搜索頁面,但是搜索頁面中只有內容的標題和發佈時間,只是簡單搜索,並沒有給用戶呈現“圖片”“品牌”的相關內容。當網站中這種雜詞量級達到一定程度,宏觀上看,整個類型的頁面都是垃圾頁。

2.關鍵詞和網站之間相關度問題

SEO不管關鍵詞和網站之間的相關度,什麼詞都敢向站內導,比如手機網站可能導入了一些房產、旅遊關鍵詞,旅遊網站可能導入了一堆美容、汽車或者工業關鍵詞等,甚至有些正規內容網站導入了“買賣新娘”“濟南人妖”等和自己完全不搭邊的關鍵詞。網站本身的定位和這些關鍵詞就不搭邊,網站內就更不可能有相關內容了,無論通過什麼手段弄出來的頁面的質量都不會好到哪兒去。

3.關鍵詞數量和網站內容量平衡關係

SEO所收集處理的關鍵詞類型以及關鍵詞和網站內容相關性都比較好,但是沒有事先檢查網站的內容量是否足以支撐這些關鍵詞。比如有的網站只有5W的內容,但是卻導入了100萬的關鍵詞,即使關鍵詞質量再好、關鍵詞和網站主題再相關,用5W的內容去整合出100W的頁面,那這些頁面不是空頁面(搜不出內容),那宏觀來看就肯定有大量重複頁面。從而導致整個類型的頁面也都是垃圾頁面。

4.站內搜索質量問題

有些網站可能把以上問題都解決了,在放出關鍵詞之前也做了一步確定工作,確定用該關鍵詞能搜出相關內容。但是網站站內搜索質量太差,導致所有聚合TAG或站內搜索頁的內容和關鍵詞本身很不相干,這並不是什麼特殊的問題,大部分網站都會存在這個問題,“搜索”是一件很難的事兒,百度做了這麼多年搜索,搜索結果還經常被大家吐槽,更何況其他非專業搜索公司做的“搜索”了。

但是既然想用“搜索”做一些事兒,那就要保證最起碼的搜索質量,不要搜索“會計培訓”而給出一堆“小吃培訓”“Java培訓”之類的內容。大部分網站的站內搜索如果自己沒有比較強的技術團隊,也沒有第三方比較強的搜索技術支持,搜索結果的質量都不會很高,從而建立在低質站內搜索技術基礎上的TAG和站內搜索頁的質量也就不敢恭維了。由此做出的相關類型的頁面也就被歸到垃圾頁面的行列中了。

以上從四個方面簡單分析了百度所打擊的TAG詞頁面和站內搜索頁面垃圾化的原因,其實也就是解決了這些問題,再做出來的頁面就不在百度的打擊範圍之內了,然而不同類型的網站在解決這四個問題時所需要做的工作都是不同的,需要大家各自想辦法解決,這也算是SEO存在的一個價值吧。TAG詞和站內搜索頁都是質量很好的頁面,但是這個“質量很好”是建立在網站內容量足夠大和技術儲備比較強的基礎上的,很多中小型網站只意識到這種類型頁面容易獲得流量,但是並沒有分析其他優質網站製作這些頁面背後的工作,往往比著葫蘆畫瓢,最後遭受到了百度的懲罰。

不相關靜態搜索結果頁會受到嚴厲懲罰

部分網站遍歷熱門關鍵詞、生成大量的站內搜索結果頁來獲取搜索引擎流量,其中存在大量不相關內容,嚴重損害了搜索引擎用戶的搜索體驗,並且侵佔了相應領域的優質網站收益。百度質量團隊明確表示:對於此類網站會做出嚴厲的處理。在上一篇《網站內容創作的大忌》中我們提到了“製作低質靜態搜索結果頁或TAG標籤頁”屬於大忌,在此篇,我們把這個問題延展開來,提供更多的樣例給各位參考。

樣例一:頁面主題為“在線行書字體轉換器”,但該搜索結果頁面中為各種商品列表,內容完全不相關。

定偉:百度如何處理不相關靜態搜索結果頁(搜索聚合頁)

樣例二:頁面主題為“奇瑞開瑞優優油耗”,但頁面搜索結果中各種主題的內容都有,完全不相關。

樣例三:頁面主題為“綠色軟件下載吧”,但搜索結果中的內容並非圍繞該主題的軟件下載,完全不相關。

所以,雖然百度嚴厲打擊這兩種頁面,但是網站並不是不可以繼續使用這兩種頁面獲得流量了,而是把內容和技術門檻提高了很多,讓大家在關注各種流行的獲取搜索流量的手法或產品時,也要深入的思考一下這些手段和產品背後的初衷和意義,而並不是為了搜索流量簡單製造垃圾網頁(中小站點也完全可以製作出高質的TAG頁和站內搜索頁,只要不觸碰以上四個問題,搜索質量問題技術解決不了,完全可以依靠人工打標籤的方式進行解決,根據網站自身規模和實力進行考量即可)。

同理,在百度打擊垃圾外鏈的方面,也可以有類似的分析,大家可以根據自己的經驗進行總結,並不要只是停留在單個鏈接本身是垃圾鏈接還是優質鏈接的表面問題上,其實大部分SEO問題都可以自己經過分析得到原因和答案。



分享到:


相關文章: