1、分析搜索引擎的抓取日志
當咱們的頁面被錄入之前,首要是需要搜索引擎來爬行、抓取的,當搜索引擎抓取到你的頁面后,并且它覺得你的文章質量契合它的錄入規范的時候,它就會把你的頁面錄入進它的索引庫、然后經過處理給予你的頁面相應的關鍵字的排行,而分析日志,能夠清楚的知道咱們哪些頁面被抓取了,哪些頁面沒有被抓取,網站的每個目錄的抓取狀況,這樣咱們能夠采納相應的辦法來推進搜索引擎的錄入。
2、在主頁多展現未被抓取的頁面URL
首要,把未抓取的URL列表提取出來,然后再把這些URL展現在主頁,以增加被搜索引擎抓取的機會。許多網站之所以在主頁有最新文章版塊、隨機展現版塊,其實是為了增加被搜索引擎抓取的機會然后增加網站頁面的錄入。全部網站權重最高的是主頁的URL頁面,也是baidu蜘蛛最為活躍的頁面,所以在主頁展現通常能夠增加錄入。
3、多發布網站列表頁的外鏈
在SOSO的官方SEO指南中,從前提到過這一點,也就是說咱們能夠專注于列表頁,多發一些列表頁的外鏈,因為列表頁里邊的有效URL比較多,當搜索引擎蜘蛛抓取到列表頁后,就會抓取列表頁中的所有URL,然后增加咱們的錄入。
4、利用robots.txt文件以及nofollow、noindex標簽幫忙搜索引擎錄入
搜索引擎的資本是有限的,搜索引擎每天只能抓取互聯網中的一有些頁面,并且在抓取的頁面中,也僅僅錄入一有些頁面,所以搜索引擎的資本很稀缺。在這種狀況下,咱們要把咱們最主要頁面的URL盡量的展現給搜索引擎,而對于一些沒有錄入價值的頁面,能夠阻撓錄入、盯梢。那么robots文件與nofollow標簽就能夠派上用場了,例如一些沒有錄入意義的聯系咱們、企業招聘、登錄、注冊等這些連接,咱們能夠直接用nofollow標簽來阻撓搜索引擎的盯梢,對于網站的模板目錄以及動態URL,咱們能夠使用robots文件直接阻撓搜索引擎錄入,還能夠把noindex標簽添加到頁面的head有些阻撓搜索引擎錄入,當咱們把這些無意義的頁面都阻撓抓取后,搜索蜘蛛就會在網站抓取更多有意義的頁面,然后增加有效錄入。
5、調整搜索引擎的抓取頻率
在baidu的站長東西中,baidu提供了調整搜索引擎的抓取頻率的東西。站長能夠經過此東西調節spider每天拜訪您網站的頻次,baidu也會根據服務器壓力主動調整抓取頻率,同時建議您穩重調節此抓取壓力值,以避免網站抓取反常。因而,如果咱們想進步它的抓取頻率,能夠在baidu的站長東西后臺自行調整抓取速度。