百度支持nofollow、noarchive兩種種meta標簽。
要防止所有搜索引擎顯示您網站的快照,請將此元標記置入網頁的<HEAD> 部分:
<meta name="robots" content="noarchive">
如果您不想搜索引擎追蹤此網頁上的鏈接,且不傳遞鏈接的權重,請將此元標記置入:
<meta name="robots" content="nofollow">
Baiduspider對站點的抓取方式和普通用戶訪問一樣,只要普通用戶能訪問到的內容,我們就能抓取到。不管是用什么技術,只要能保證用戶能流暢的訪問網站,對搜索引擎就沒有影響。
我們建議盡量選擇有實力的服務商和成熟的技術,不成熟的技術容易導致訪問不穩定,這就有可能影響搜索引擎的抓取了。
百度對海外站點沒有歧視。但Baiduspider服務器在國內,國內普通用戶訪問受限的內容,Baiduspider一樣會搞不定,只要國內能正常訪問,我們就會一視同仁。
如果是內容發生根本性變化,則理論上會被視為一個全新網站,舊有超鏈失效。
搜索引擎策略會對已收錄的站點站點綜合表現進行自動評價,對符合一定標準的站點,會自動提取網站中的favicon作為展現logo。同時,這個機制是自動運行,定期更新的,沒有人工干預的接口。
百度從未提供過網站權重信息數據以及對外查詢服務。第三方站長工具的數據并非百度官方數據,不代表真實的網站情況,百度對使用此類數據而造成的困擾不負任何責任。請網站管理員不要將這些“百度權重”數值當成真實數值來參考使用。
中文互聯網上,Baiduspider ip的hostname以 *.baidu.com的格式命名,非 *.baidu.com即為冒充,建議您使用DNS反查方式來確定抓取來源的ip是否屬于百度。
例如,在linux平臺下,您可以使用host ip命令反解ip來判斷是否來自Baiduspider的抓取。
$ host 123.125.66.120
120.66.125.123.in-addr.arpa domain name pointer
baiduspider-123-125-66-120.crawl.baidu.com.
在windows平臺下,可以用nslookup命令反解ip來判斷是否來自Baiduspider的抓取。
點擊“開始”-“運行”-“cmd”-“輸入nslookup IP地址”-“回車”
C:\Documents and Settings\wangtao>nslookup 123.125.66.120
Name: baiduspider-123-125-66-120.crawl.baidu.com
Address: 123.125.66.120