百度不抓取收錄網(wǎng)站的幾個原因
2025-01-05
網(wǎng)站上線開通后,作為站長都希望網(wǎng)頁盡快被搜索引擎抓取收錄,在關(guān)鍵詞搜索結(jié)果頁面能夠有所展現(xiàn)和曝光,當(dāng)然關(guān)鍵詞排名越高越好,這樣網(wǎng)站才能有訪問流量,進(jìn)而能夠?qū)崿F(xiàn)客戶轉(zhuǎn)化。但有的網(wǎng)站很長時間才會被百度收錄,并且網(wǎng)站關(guān)鍵詞排名也不好,甚至于網(wǎng)站根本沒有收錄,由于不知道具體原因所以無從下手,不知道在哪個方面努力才能達(dá)到需要的效果。
現(xiàn)在我們先了解一下百度抓取收錄網(wǎng)頁的大體機(jī)制,目前百度網(wǎng)絡(luò)蜘蛛抓取新鏈接的途徑有兩個,一是主動出擊發(fā)現(xiàn)抓取,包括爬取服務(wù)器或者跟蹤原有資源的鏈接;二是從搜索資源中心的鏈接提交工具中獲取數(shù)據(jù),其中通過主動推送功能“收集來的數(shù)據(jù)最受百度spider的歡迎,你需要在搜索資源中心中提交網(wǎng)站地圖sitemap.xml,更方便網(wǎng)絡(luò)蜘蛛識別抓取和收錄網(wǎng)頁URL。對于站長來說,如果鏈接很長時間不被收錄,建議嘗試使用主動推送功能,尤其是新網(wǎng)站,主動推送首頁數(shù)據(jù),有利于內(nèi)頁數(shù)據(jù)的抓取。但有時候我們提交了數(shù)據(jù)還是遲遲在搜索結(jié)果頁面看不到網(wǎng)站展現(xiàn),出現(xiàn)這種現(xiàn)象的原因在網(wǎng)絡(luò)蜘蛛抓取這個環(huán)節(jié)可能有以下這些:
1、網(wǎng)站封禁:由于Robots文件設(shè)置有誤,在Robots文件里面設(shè)置禁止百度或其他搜索引擎蜘蛛,結(jié)果當(dāng)然是無法收錄。
2、備案問題:現(xiàn)在百度、360等國內(nèi)搜索引擎網(wǎng)絡(luò)蜘蛛出于各方面考慮,基本不再抓取服務(wù)器部署在海外的新網(wǎng)站,原來用海外主機(jī)的老網(wǎng)站現(xiàn)在基本也只展現(xiàn)首頁。
3、質(zhì)量篩選:百度spider進(jìn)入3.0后,對低質(zhì)內(nèi)容的識別上了一個新臺階,尤其是時效性內(nèi)容,從抓取這個環(huán)節(jié)就開始進(jìn)行質(zhì)量評估篩選,過濾掉大量過度優(yōu)化、低質(zhì)量等頁面。
4、抓取失?。?/strong>由于網(wǎng)站服務(wù)器不穩(wěn)定,網(wǎng)頁打開速度過慢,百度spider訪問抓取網(wǎng)頁時遇到麻煩,當(dāng)然網(wǎng)站收錄效果不好了。
5、配額限制:如果你的站點(diǎn)頁面數(shù)量突然爆發(fā)式增長,這種情況大多數(shù)是網(wǎng)站被黑,被加入了很多非法頁面,這就會影響到優(yōu)質(zhì)鏈接的抓取收錄,所以站點(diǎn)在保證訪問穩(wěn)定外,也要關(guān)注網(wǎng)站安全,防止被黑注入。