九九精品影院-九九精品在线-九九精品在线播放-九九九国产-国产成+人+综合+亚洲不卡-国产成a人片在线观看视频

域名綜合信息查詢...
  • 綜合
  • Whois
×
歷史記錄
首頁 > SEO優化 > 正文

搜索引擎爬蟲重復抓取問題如何解決?

發布時間:2020-02-21 16:16:30 來源:互聯網 作者:四月 點擊量:2359

針對每一位SEO從業者而言,爬蟲每天來我們的網站進行網頁的抓取,是十分寶貴的資源。但在這中間由于爬蟲無序的抓取,勢必會浪費一些爬蟲的抓取資源。這中間我們就需要解決搜索引擎爬蟲對我們的網頁重復抓取的問題,下面聚名網與你一起來看一下如何解決這個問題。

在聊這個問題之前,我們需要理解一個概念。首先爬蟲本身是無序的抓取,他不知道先抓什么再抓什么,只知道看到了什么,且計算后認為有價值就進行抓取。

搜索引擎爬蟲重復抓取問題如何解決?

而對于我們而言,抓取的整個過程中,我們最要解決是如下幾類

新產生的頁面,沒有被抓取過的
產生了一段時間,遲遲不被抓取的
產生了一段時間,卻一直沒收錄的
產生很久的頁面,但最近更新了
包含內容更多的聚合頁面,如首頁、列表頁
如上幾類,按照順序我們定義哪一類最需要被爬蟲抓取。

針對大型網站,搜索引擎爬蟲抓取資源過剩,而針對小網站,抓取資源稀缺。所以在這里我們強調一下,我們不是要解決搜索引起爬蟲重復抓取的問題,而是要解決搜索引擎爬蟲最快的抓取我們希望抓取的頁面。要把這個思路糾正!

下面,我們聊一下怎么讓搜索引擎爬蟲最快的抓取我們希望被抓取的頁面。

爬蟲是抓取到一個網頁,從這個網頁在找到更多的鏈接,周而復始的過程,那么這個時候我們就要知道要想被爬蟲更大概率抓取,就要給更多的鏈接,讓搜索引擎爬蟲發現我們希望被抓取的網頁。這里我拿上述的第一種情況舉例說明一下:

新產生的頁面,沒有被抓取過的
這類一般都會是文章頁,針對于這類我們的網站每天都會大量產生,所以我們就要在更多的網頁給予這部分鏈接。例如首頁、頻道頁、欄目/列表頁、專題聚合頁、甚至文章頁本身,都需要具備一個最新文章板塊,以此等待爬蟲抓取到我們的任何網頁時,都能發現最新的文章。

同時,試想一下,這么多頁面都有新文章的鏈接,連接傳遞權重,那這新文章,既被抓取了,權重也不低。被收錄的速度會明顯提升。

那針對那些長時間不收錄的,也可以考慮是不是權重太低了,我多給一些內鏈支持,傳遞一些權重。應該會有收錄的可能。當然也有可能不收錄,那你就要靠內容本身的質量了。之前有一篇文章是專門說內容質量的也歡迎大家閱讀:什么內容容易被百度判斷為優質內容?。

所以,我們為了解決搜索引擎爬蟲重復抓取問題不是我們最終要解決的。因為本質上搜索引擎爬蟲是無序的,我們只能通過針對網站的架構、推薦算法、運營策略等進行干預。使爬蟲給予我們更理想的抓取效果。

seo優化鏈接:https://www.juming.com/reg.htm?t=seo_adzxseo
聲明:本網站發布的內容(圖片、視頻和文字)以原創、轉載和分享網絡內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:400-997-2996;郵箱:service@Juming.com。本站原創內容未經允許不得轉載,或轉載時需注明出處:聚名網 搜索引擎爬蟲重復抓取問題如何解決?
關鍵詞: 搜索引擎爬蟲網站seo
熱門競價 更多>
推薦一口價 更多>

登錄聚名,您可以享受以下權益:

立即登錄/注冊