03.05 百度勁風算法上線

百度勁風算法上線

文件夾圖標

百度搜索近期將上線的“勁風算法”,旨在控制惡意構造聚合頁的問題對搜索用戶的影響,為保障搜索用戶的體驗、保證搜索結果公平,該算法針對搜索結果中通過惡意構造聚合頁面內容來獲取搜索排名的行為。

聚合頁,是指頁面並無文章主體內容,而是多個頁面的索引鏈接圍繞在特定主題下的信息整合頁。

簡單來說,勁風算法的面世,主要打擊業內一些單純以獲取流量為目的,不管用戶搜索需求滿足度以及搜索體驗的聚合頁。

惡劣聚合頁問題主要包括以下四種類型:


1內容跨領域


頁面內容與站點本身所屬領域不符,或站點無專注領域,多為採集拼湊內容。


問題示例1:站點內容領域分散


百度勁風算法上線


內容與站點領域不符指的是網站中包含了太多領域的詞彙。

例如:做遊戲、又做教育,還參與了加盟,甚至有電影。


這不僅搜索引擎無法識別你網站自身的專注領域,用戶訪問你站點的聚合頁後,得到的體驗也是極差的。


2題文不符


頁面內容與標題及頁面中標記的標籤不符。


問題示例2:頁面內容與標題不符


百度勁風算法上線


所指的標題可以理解為是聚合頁面的關鍵詞,例如:聚合頁所部署的關鍵詞是SEO培訓,而裡面調取的內容則是遊戲、電影等介紹,與關鍵詞本身不相關的內容。

這樣即便搜索用戶進入到該聚合頁,仍是不能很好的解決用戶需求。


3靜態搜索結果頁


由網站搜索功能生成的靜態搜索結果頁。


問題示例3:靜態搜索結果頁


百度勁風算法上線


利用站內搜索功能,批量生成靜態頁面,這種操作是批量生成聚合頁的慣用手法。多為內容量較大的網站盛行。

這種頁面生成的技術含量難點在於自身搜索引擎的技術能力。而很多網站又沒有專業的搜索引擎團隊,即便生成出來的內容,相關性差、頁面可讀性低。


4空短、失效聚合頁


空短、無有效信息、失效的聚合頁。


問題示例4:無有效信息的聚合頁


百度勁風算法上線


批量生成的聚合頁,以SEO為首,單純以獲取流量為目的的頁面。大多都會存在聚合頁內,調取的內容過少,甚至為空的現象。

這種類型的頁面可想而知,毫無用戶體驗可言。所以勁風算法對其進行懲罰也是早晚的事情。

以上四類惡劣聚合頁問題就是這次勁風算法的主要內容。


命中勁風算法後,如何進行整改及恢復


當百度上線某個算法的時候,都可藉助歷史趨勢數據或網站監控的一些功能,來了解這些算法對網站帶來的影響。


1針對網站領域過於分散的


建議確定好一個主要的領域,且將其他領域的內容robots掉,屏蔽搜索引擎抓取,且不再參與搜索引擎排名;

或對其他領域的內容進行刪除,並將刪除的內容URL在百度搜索資源平臺提交404,確保網站無恙。


2針對題文不相符的


可以對應每一個聚合頁的主題進行審查,確保聚合頁下內容都是針對當前聚合頁主題所延展的相關內容。

通過內容相似度計算的方式將網頁內的主體文本進行提取計算。得出當前聚合頁的主題與內容的相似度得分。

並通過實際觀察,確保相似度得分在哪個值上,是可以解決搜索用戶需求的。


3針對利用搜索批量生成的


針對搜索調取的內容相關進行大幅度提升,從而提升用戶體驗度。

利用相似度判斷方式,讓編輯協助完成(所計劃的相似度得分值)聚合頁的內容撰寫工作。

如最終還是無法確保滿足用戶需求的,建議刪除或者robots操作。


4針對內容為空或過於少,甚至無效的

將更多品類的內容進行搜索整理,從而提升聚合頁下內容整體的豐富度,前期要保證相關性。

其次,可將聚合頁關鍵詞進行分類。

例如:爬蟲抓取、爬蟲算法、搜索引擎爬蟲、baiduspider,被認為是一類聚合頁。

當內容為空或少於X條時,可以通過擴展調取的維度進行補全。

另外,由於所做的404頁面已被收錄或者爬蟲抓取了,建議再提交百度搜索資源平臺的死鏈提交工具進行完備,確保不會讓搜索引擎認為網站存在大量死鏈接。


分享到:


相關文章: