企業(yè)與個人網絡營銷一站式服務商
        網站建設 / SEO優(yōu)化排名 / 小程序開發(fā) / OA
        0731-88571521
        136-3748-2004
        做網站SEO優(yōu)化中關鍵詞分詞技術
        信息來源:長沙網站制作   發(fā)布時間:2011-12-31   瀏覽:

          背景資料:

          策先生——策恩“世界名鞋淘寶客”推廣大賽特約評委

          曾于第一季推廣大賽期間對參賽選手表現進行每周精簡點評,專治疑難雜癥,為一眾參賽選手所知曉。為人低調且神秘,專注網站推廣數年。現任第二季策恩“世界名鞋淘寶客”推廣大賽評委,行蹤不甚明朗。

          說到中文分詞,我覺得只要從事SEO工作有關的朋友都應該深刻理解這一知識,理解搜索引擎是如何識別詞與詞之間的關系,如何判別語句的含義的。因為您只有充分的了解、貫穿應用中文分詞才可以在關鍵詞收集、分析、布局,包括標題的攢寫做得更加得心應手,才會寫出更加出色的軟文。中文分詞已經是SEO知識中的核心知識。

          SEOER必須要理解搜索引擎是如何工作的這一點尤其重要,也是最基礎的。

          我們先來了解中文分詞的概念,什么是中文分詞?

          中文分詞技術屬于自然語言處理技術范疇,對于一句話,人可以通過自己的知識來明白哪些是詞,哪些不是詞,但如何讓計算機也能理解?其處理過程就是分詞算法。

          目前搜索引擎對于中文分詞可以分為三大類:基于字符串匹配的分詞方法、基于理解的分詞方法和基于統計的分詞方法。

          1、基于字符串匹配的分詞方法

          搜索引擎在接受用戶搜索的時候第一個會判斷用戶搜索的“詞”跟數據庫里面的“詞”是否匹配,匹配度如何來進行掃描;

          按照輸入的“關鍵詞”或是“句子”不同長度優(yōu)先匹配的情況,可以分為最大(最長)匹配和最小(最短)匹配;

          如下:

          1)正向最大匹配法(由左到右的方向);

          例子:策恩“世界名鞋淘寶客”推廣大賽。

          正向最大切分出的關鍵詞是:策恩、世界名鞋淘寶客、推廣大賽(不上圖了,大家百度一下,然后查看快照即可)

          2)逆向最大匹配法(由右到左的方向);這個跟第一點是一樣的分詞方式,只是關鍵詞的前后順序換過來,在搜索引擎數據庫查詢得到的結果是一樣的。

          3)最少切分(使每一句中切出的詞數最小);

          例子:策恩“世界名鞋淘寶客”推廣大賽

          最少切分出來的詞是:策恩、世界、名鞋、淘寶客、推廣、大賽;

          4)雙向最大匹配法(進行由左到右、由右到左兩次掃描)||

          2、基于理解的分詞方法

          這種分詞方法是通過讓計算機模擬人對句子的理解,達到識別詞的效果。其基本思想就是在分詞的同時進行句法、語義分析,利用句法信息和語義信息來處理歧義現象。這種方法一直對抗著長期偽原創(chuàng)的做法,在09年一般的換換同義詞,近義詞的偽原創(chuàng)百度會收錄,到了2010年偽原創(chuàng)的幅度需要做到更大才可以有效,在今年的六月底,百度的一次大更新過后,很多同學發(fā)現原來的采集的站,或是偽原創(chuàng)力度不大的網頁內容被百度大量的放出來,不在收錄,說明百度這一分詞技術方法越來越成熟,越來越完善了。偽原創(chuàng)也是越來越難了。

          3、基于統計的分詞方法

          從形式上看,詞是穩(wěn)定的字的組合,因此在上下文中,相鄰的字同時出現的次數越多,就越有可能構成一個詞。因此字與字相鄰共現的頻率或概率能夠較好的反映成詞的可信度。搜索引擎通過這一方法在“下拉框”或是“相關搜索”中可以充分提現出來。最近幾年大家發(fā)現很多網絡公司有一項業(yè)務是【刷百度相關關鍵詞】,當用戶輸入某個關鍵詞的時候,我們可以做到指定在百度下拉框出現自己想要的關鍵詞,利用的就是這個基于統計的分詞原理。

          最后說下關鍵詞在標題的應用,理解中文分詞與網站標題的關系。

          1、搜索詞與網站標題完全匹配

          當用戶在百度搜索的時候,搜索詞如果和您的網站標題完全匹配,而且你的網站也達到了一定的權重的時候就會有好的排名,這個也解釋了標題一定要出現關鍵詞,就是原因,反之,如果搜索的詞不和您的網站標題完全匹配的時候搜索引擎就進行分詞,分詞的方式參與了中文分詞原理的綜合方式。

          2、搜索詞不匹配才進行分詞

          當詞語與您的網站標題不匹配的時候就會進行分詞,分詞的方式會參與,正向、逆向、統計、理解、同義詞、以及新詞和歧義詞。這個時候搜索引擎理解起來會比較難,從而影響到網頁的排名;

          說到這里我提下之前在一個策恩淘寶客大賽交流QQ群189321234發(fā)過一些淘寶上熱搜的關鍵詞出來,在上次夢江跟我的一次訪談中一位策恩的淘寶客說到這些詞在淘寶上搜索次數很大,但是在百度的話幾乎是零,當時我建議優(yōu)化“行業(yè)詞+策恩、行業(yè)詞+策恩皮鞋”這類型的關鍵詞,還說我會在往后寫文專門說清楚,我再舉一個例子,希望可以更加清楚點。

          標題:休閑皮鞋策恩波文、時尚男人韓版風

          按照最大匹配法來分:休閑皮鞋、策恩波文、時尚男人、韓版風。里面至少包含了“休閑皮鞋、休閑皮鞋策恩、策恩波文,策恩皮鞋波文”這4個詞,這樣既優(yōu)化了在百度的熱門詞“休閑皮鞋”,精準詞:休閑皮鞋策恩,同時也優(yōu)化了在淘寶的熱門詞精準詞“策恩波文、策恩皮鞋波文”,盡可能的做到跟用戶搜索的詞匹配度較高,我當時說的就是這個意思。




        上一條: 新做的網站怎樣解決網站只收錄首頁的四大方法
        下一條: 做好網站之后在百度知道上自行推廣七大注意七大技巧
        案例鑒賞
        多年的網站建設經驗,斌網網絡不斷提升技術設計服務水平,迎合搜索引擎優(yōu)化規(guī)則
        精辟網文
        多年的網站建設經驗,網至普不斷提升技術設計服務水平,迎合搜索引擎優(yōu)化規(guī)則
        長沙私人做網站    長沙做網站    深圳網站建設    株洲做網站    東莞做網站    南京防腐木    湖南大拇指養(yǎng)豬設備    株洲做網站    
        版權所有 © 長沙市天心區(qū)斌網網絡技術服務部    湘公網安備 43010302000270號  統一社會信用代碼:92430103MA4LAMB24R  網站ICP備案號:湘ICP備13006070號-2  
        中文字幕日韩一区二区三区不卡| 亚洲国产精品无码一线岛国| 国产真人无码作爱免费视频| 在线精品无码字幕无码AV| 无码国产乱人伦偷精品视频| 十八禁视频在线观看免费无码无遮挡骂过| 免费无码一区二区三区蜜桃| 欧洲无码一区二区三区在线观看| 乱色精品无码一区二区国产盗| 人妻中文无码久热丝袜| 无码人妻一区二区三区免费看| 制服在线无码专区| 白嫩少妇激情无码| 亚洲欧美成人久久综合中文网| 日韩精品中文字幕无码一区| 亚洲熟妇无码八AV在线播放| 丰满熟妇人妻Av无码区| 最好看2019高清中文字幕| 久久久噜噜噜久久中文字幕色伊伊| 无码人妻少妇久久中文字幕蜜桃| 亚洲AV无码AV男人的天堂不卡| 久久久久久久久久久久中文字幕| 无码av不卡一区二区三区| 免费看成人AA片无码视频羞羞网| 久久亚洲AV无码精品色午夜麻豆| 最近2019免费中文字幕视频三| 无码国产精品一区二区免费式影视| 日韩va中文字幕无码电影| 无码av不卡一区二区三区| 日本高清不卡中文字幕免费| 免费无码国产V片在线观看| 精品国产aⅴ无码一区二区| 亚洲AV无码不卡在线观看下载| 中文字幕乱码人妻无码久久| 久久综合精品国产二区无码| 无码精品A∨在线观看十八禁| 在线播放无码后入内射少妇| 亚洲∧v久久久无码精品| 久别的草原在线影院电影观看中文| 中文字幕免费在线观看| 自慰无码一区二区三区|