作為中文搜索引擎的兩大巨頭,百度和google在網站收錄方面,各自有著自己的側重點和收錄原則,對于大型網站(比如門戶新聞網站)以及其他更新量大的網站,百度和Google的索引速度都很快,基本上都能做到當天更新。但是對于一些更新量小的網站,兩者就有比較明顯的區別,Google對于高權重并提交Sitemaps和Ping的網站,索引速度可以達到分鐘級別,比如幾分鐘就可以在搜索排名中看到自己剛剛編寫的文章,但百度索引速度較慢,如果不是權重較高的站點,有可能一天、三天甚至更久才被收錄??傮w來講,百度對于網站首頁的關注以及權重給的似乎特別高,而Google對于最終的文章內容頁面的關注多于百度。
作為全球最大的多語言搜索引擎,Google在發展歷史過程中已形成了自己的網頁收錄習慣,也建立起自己的一套標準。研究Goolge收錄網頁的習慣有利于更好地迎合Google搜索引擎的口味,達到提高網頁收錄量和收錄排名的目的。
Google PageRank能夠對網頁的重要性做出客觀的評價,PageRank并不計算直接鏈接的數量,而是將從網頁A指向網頁B的鏈接解釋為由網頁A對網頁B所投的一票。這樣,PageRank會根據網頁B所收到的投票數量來評估該頁的重要性。谷歌的搜索引擎同時也分析網頁內容,他并不采用單純掃描基于網頁的文本(網站發布商可以通過元標記控制這類文本)的方式,而是分析網頁的全部內容以及字體、分區及每個文字精確位置等因素,Google同時還會分析相鄰網頁的內容,以確保返回與用戶查詢最相關的結果。
百度對于新站一般都不會立刻收錄,并且在相當長的時間內都不會收錄,當新網站在搜索引擎有了一個不錯且穩定的表現,并且有了較多的反向鏈接,會出現一個閥值。百度判斷其網站內容的質量,會開始收錄這個新站點內容,這時候網站才會出現來自百度的流量。而百度似乎對于自己的網站(百度知道、百度空間、百度百科等)給予較高的權值,并且更青睞于那些更新頻繁的大型門戶網站,而對于反向鏈接似乎沒有給予太多的權重。
綜上所述,從網站收錄速度上來看,Google現在比百度要快,不過由于百度的用戶更多一些,所以網站搜索來源大多還是來自于百度,在搜索引擎中的份額約占70%左右。