Yblog = yourblog,你的優質部落格。願真田幸村紅鎧策馬赤備突擊的身影,帶給我們更多的勇氣。
星期六, 一月 14, 2006
我看中國的百度
論起百度,中國都會說這是中文搜尋門戶網站的龍頭,在中國是超越Google的search engine。本來之前就想抱怨一下百度的,因為它的搜尋機器人讓我很火,不過因為我不是百度的日常用戶與主要觸及的族群,故隱忍不發。

日前瞥見互連網上有人評論百度的事情,既然有人起了頭,就跟吧。

我用百度來搜尋一些關鍵字,同樣會碰到一堆廣告為主的結果,真正要的東西往往不會是在前面的地方。Google確實在這方面就好很多,讓人很清楚知道哪些是廣告,雖然有些關鍵字還是會有廣告成分較高的網頁連結在前面,但只要關鍵字運用得體,還是很快能找到自己要的結果。

百度另一個問題是它的搜尋機器人。對搜尋引擎網站而言,網頁搜尋機器人能夠幫助它們建立各網站的索引檔案,讓使用者搜尋時能夠搜尋到。但百度的機器人逛過我的網站後,即便是某些網頁已經移除了,它還會持續不斷地找,嘗試著去訪問不存在的路徑。Google的搜尋機器人GoogleBot就比較沒這問題,很少有嘗試連接不存在頁面的情形,它會自己將不存在連結移自下次的索引。

百度抓取網頁資料的頻率很高,固然可以達到索引量大的結果,但會對一般網站造成負擔。有時候我發現伺服器的頻寬和處理時間,在每天的特定時刻,都是被自動搜尋機器人給吃掉的。

曾經,我萌生了把百度機器人排除在外的念頭,但後來想想這樣百度的用戶搜尋不到我的網頁索引,就有點猶豫。也許,禁止百度的機器人瀏覽,或許對網站會更好呢。
More... funp HemiDemi MyShare del.icio.us technorati Google Bookmarks Digg
ivan 發表於 7:00 AM | 文章分類: 數位科技, www

迴響留言
連robots.txt裡disallow的東西都去抓,讓我寫信去百度抗議...
由 H 發表於 19:53, Jan 17, 2006
140.129.136.* | 標記為廣告 | 回應此篇迴響
名稱
電子郵件
網址




請輸入你在圖片中看到的文字
最好的方式,就是直接在robots.txt將百度的機器人檔掉,只不過這樣就沒有新的索引在百度的搜尋引擎,這樣很可惜
由 220.247.131.* 發表於 23:41, Jan 17, 2006
標記為廣告 | 回應此篇迴響
名稱
電子郵件
網址




請輸入你在圖片中看到的文字

張貼迴響:
名稱
電子郵件
網址



請輸入你在圖片中看到的文字
引用列表
本篇文章引用網址: http://yblog.org/api/trackback/?id=5790
沒有引用

訪客來源網址(僅列最多的10個外部來源):









Collablog Portal enabled