1、分析搜索引擎的抓取日志
當(dāng)咱們的頁面被錄入之前,首要是需要搜索引擎來爬行、抓取的,當(dāng)搜索引擎抓取到你的頁面后,并且它覺得你的文章質(zhì)量契合它的錄入規(guī)范的時候,它就會把你的頁面錄入進它的索引庫、然后經(jīng)過處理給予你的頁面相應(yīng)的關(guān)鍵字的排行,而分析日志,能夠清楚的知道咱們哪些頁面被抓取了,哪些頁面沒有被抓取,網(wǎng)站的每個目錄的抓取狀況,這樣咱們能夠采納相應(yīng)的辦法來推進搜索引擎的錄入。
2、在主頁多展現(xiàn)未被抓取的頁面URL
首要,把未抓取的URL列表提取出來,然后再把這些URL展現(xiàn)在主頁,以增加被搜索引擎抓取的機會。許多網(wǎng)站之所以在主頁有最新文章版塊、隨機展現(xiàn)版塊,其實是為了增加被搜索引擎抓取的機會然后增加網(wǎng)站頁面的錄入。全部網(wǎng)站權(quán)重最高的是主頁的URL頁面,也是baidu蜘蛛最為活躍的頁面,所以在主頁展現(xiàn)通常能夠增加錄入。
3、多發(fā)布網(wǎng)站列表頁的外鏈
在SOSO的官方SEO指南中,從前提到過這一點,也就是說咱們能夠?qū)W⒂诹斜眄,多發(fā)一些列表頁的外鏈,因為列表頁里邊的有效URL比較多,當(dāng)搜索引擎蜘蛛抓取到列表頁后,就會抓取列表頁中的所有URL,然后增加咱們的錄入。
4、利用robots.txt文件以及nofollow、noindex標(biāo)簽幫忙搜索引擎錄入
搜索引擎的資本是有限的,搜索引擎每天只能抓取互聯(lián)網(wǎng)中的一有些頁面,并且在抓取的頁面中,也僅僅錄入一有些頁面,所以搜索引擎的資本很稀缺。在這種狀況下,咱們要把咱們最主要頁面的URL盡量的展現(xiàn)給搜索引擎,而對于一些沒有錄入價值的頁面,能夠阻撓錄入、盯梢。那么robots文件與nofollow標(biāo)簽就能夠派上用場了,例如一些沒有錄入意義的聯(lián)系咱們、企業(yè)招聘、登錄、注冊等這些連接,咱們能夠直接用nofollow標(biāo)簽來阻撓搜索引擎的盯梢,對于網(wǎng)站的模板目錄以及動態(tài)URL,咱們能夠使用robots文件直接阻撓搜索引擎錄入,還能夠把noindex標(biāo)簽添加到頁面的head有些阻撓搜索引擎錄入,當(dāng)咱們把這些無意義的頁面都阻撓抓取后,搜索蜘蛛就會在網(wǎng)站抓取更多有意義的頁面,然后增加有效錄入。
5、調(diào)整搜索引擎的抓取頻率
在baidu的站長東西中,baidu提供了調(diào)整搜索引擎的抓取頻率的東西。站長能夠經(jīng)過此東西調(diào)節(jié)spider每天拜訪您網(wǎng)站的頻次,baidu也會根據(jù)服務(wù)器壓力主動調(diào)整抓取頻率,同時建議您穩(wěn)重調(diào)節(jié)此抓取壓力值,以避免網(wǎng)站抓取反常。因而,如果咱們想進步它的抓取頻率,能夠在baidu的站長東西后臺自行調(diào)整抓取速度。