剖析網站日記中百度蜘蛛返回304狀況碼的情形

淺談企業做搜刮排名的幾個主要感化
2016-05-13
江蘇搜索引擎優化:流派站收錄欠好怎樣辦
2016-05-13
Show all

剖析網站日記中百度蜘蛛返回304狀況碼的情形

  比來碰到一個網站被百度蜘蛛抓取首頁後大批返回304狀況碼的題目,從前碰到過301和302,就是沒懂得過304,恰好能夠對這個情形舉行一下剖析和不雅察,以便比擬深刻的懂得該題目的湧現和應對之策。

  百度百科對304狀況碼是這麼說明的:假如客戶端發送瞭一個帶前提的 GET 要求且該要求已被許可,而文檔的內容(自前次拜訪以來大概依據要求的前提)並沒有轉變,則辦事器應該返回這個304狀況碼。簡略的表達就是:客戶端已執 行瞭GET,但文件未變更,也就是我們所懂得的頁面沒更新。

  GET /index.html – 80 – 220.181.135.120 Sosospider+(+/webspider.htm) 304 0 0

  GET /index.html – 80 – 123.129.209.113 Mozilla/5.0+(compatible;+Baiduspider/2.0;++/search/spider.html) 304 0 0

  但網站天天都有較多內容的更新,怎樣會返回未更新的狀況碼呢,檢察瞭網站進幾天的網站IIS日記,發明這幾天對首頁的抓取都是返回的304狀況碼,一樣平常情形下也許會是一下幾種大概:

  1、辦事器緩存原因

  設置緩存的感化一樣平常都是為瞭加快網站的提早加載,就像我們在閱讀器上拜訪網站的時刻也比擬輕易湧現緩存題目,當你翻開一個網站以後,假如該網站有更新大概有 變更,間接點擊首頁會發明照樣之前拜訪的頁面,而ctrl+F5從新加載後才會表現新的頁面,這實在就是緩存的原因。別的,有的時刻和一些較大的網站換友誼鏈接也會碰到,對方加瞭友鏈以後首頁沒有會立時表現,會由於緩存而須要過一段時光能力表現。

  2、網站構造題目

  假如網站構造不克不及有用的讓蜘蛛順遂匍匐,也就是說固然蜘蛛有抓取,但因為網站構造題目致使蜘蛛前後兩次抓取內容雷同,大概說蜘蛛每次抓取首頁都隻抓瞭那塊牢固的內容,那末就必將致使蜘蛛對首頁的抓取返回304狀況碼。

  3、網站速率題目

  谷歌就針對網站的加載時光更 新過算法,把網站加載時光歸入瞭排名身分,就算搜刮引擎排名沒有看重這點,對付用戶體驗也是有很大影響,誰也沒有會情願多花時光在一個須要加載幾十秒乃至幾分 鐘的網站上面。而對付搜刮蜘蛛也是如斯,網站的加載速率也會影響蜘蛛的一般抓取,一樣平常情形下網站都是從上往下的加載,而有的時刻因為速率身分致使網站隻加載瞭頭部,背面部門而沒有實時表現出來,也大概致使蜘蛛隻抓取瞭頭部部門內容,而因為一樣平常網站的頭部都是雷同的,也就輕易湧現瞭抓取返回沒更新的狀況碼。

  別的,收集線路的互通也是一個身分。

  4、網站內容題目

  網上查找瞭下關於304狀況碼的一些內容,很多人都以為是網站內容歷久收羅或是偽首創也能致使蜘蛛返回該狀況碼,由於網站內容收羅或偽首創切實其實會下降網站質量,致使百度沒有收錄等情形,搜刮蜘蛛也會以為網站內容沒有具有收錄的意義,那末也就沒有會抓取新的內容而返回沒有更新的狀況。

  5、看重該狀況碼

  既然304狀況碼是表現未更新的情形,那末常常湧現就須要引發看重,同時也須要不雅察湧現該狀況碼的同時網站各方面數據的變更和趨向,以便對該狀況碼的影響有較好的懂得。

  臨時網站湧現304狀況碼以後經由百度更新收錄有所削減,頭幾天有過斷斷續續的網站沒法拜訪的情形,第二天網站首頁就被K失落,在改換辦事器以後規復網站一般拜訪,越日首頁再次規復,今朝仍須要不雅察和剖析,能力更好控制該狀況碼。

  文章為肖俊博客首創,原文地點:/搜索引擎優化-watch/235.html

Comments are closed.