...">
瀏覽量:177次
百度分詞技術(shù)就是百度針對(duì)用戶提交查詢的關(guān)鍵詞串進(jìn)行的查詢處理后根據(jù)用戶的關(guān)鍵詞串用各種匹配方法進(jìn)行的一種技術(shù)。所謂分詞就是把字與字連在一起的漢語(yǔ)句子分成若干個(gè)相互獨(dú)立、完整、正確的單詞。詞是小的、能獨(dú)立活動(dòng)的、有意義的語(yǔ)言成分。計(jì)算機(jī)的所有語(yǔ)言知識(shí)都來(lái)自機(jī)器詞典(給出詞的各項(xiàng)信息)、句法規(guī)則(以詞類的各種組合方式來(lái)描述詞的聚合現(xiàn)象)以及有關(guān)詞和句子的語(yǔ)義、語(yǔ)境、語(yǔ)用知識(shí)庫(kù)。中文信息處理系統(tǒng)只要涉及句法、語(yǔ)義(如檢索、翻譯、文摘、校對(duì)等應(yīng)用),就需要以詞為基本單位。當(dāng)漢字由句轉(zhuǎn)化為詞之后,才能使得句法分析、語(yǔ)句理解、自動(dòng)文摘、自動(dòng)分類和機(jī)器翻譯等文本處理具有可行性??梢哉f(shuō),分詞是機(jī)器語(yǔ)言學(xué)的基礎(chǔ)。
看了上述百度的介紹大家對(duì)百度的分詞技術(shù)都了解了把!那么我們看看我們?nèi)绾瓮ㄟ^(guò)這種手段為我們seo網(wǎng)站優(yōu)化助力!
一:字符串匹配的分詞方法
(1)正向匹配法
就是把一個(gè)詞從左至右來(lái)分詞
舉個(gè)例子:”不知道你在說(shuō)什么”
這句話采用正向匹配法是如何分的呢?“不知道,你,在,說(shuō)什么”。
(2)反向匹配法
“不知道你在說(shuō)什么”反向匹配法來(lái)分上面這段是如何分的?!安?,知道,你在,說(shuō),什么”,這個(gè)就分的比較多了,反向匹配法就是從右至左。
(3)就是短路徑分詞法
就是說(shuō)一段話里面要求切出的詞數(shù)是少的。"
“不知道你在說(shuō)什么”短路徑分詞法就是指,把上面那句話分成的詞要是少的?!安恢溃阍?,說(shuō)什么”,這就是短路徑分詞法,分出來(lái)就只有3個(gè)詞了
(4)雙向匹配法。
而有一種特殊的情況,就是關(guān)健詞前后組合內(nèi)容被認(rèn)為粘性相差不大,而搜索結(jié)果中也同時(shí)包含這兩組詞的話,百度會(huì)進(jìn)行正反向同時(shí)進(jìn)行分詞匹配。
二:詞義分詞法
就是一種機(jī)器語(yǔ)音判斷的分詞方法。很簡(jiǎn)單,進(jìn)行句法、語(yǔ)義分析,利用句法信息和語(yǔ)義信息來(lái)處理歧義現(xiàn)象來(lái)分詞,這種分詞方法,現(xiàn)在還不成熟,處在測(cè)試階段
三:統(tǒng)計(jì)分詞法
根據(jù)詞組的統(tǒng)計(jì),就會(huì)發(fā)現(xiàn)兩個(gè)相鄰的字出現(xiàn)的頻率多,那么這個(gè)詞就很重要。就可以作為用戶提供字符串中的分隔符,這樣來(lái)分詞
比如,“我的,你的,許多的,這里,這一,那里”等等,這些詞出現(xiàn)的比較多,就從這些詞里面分開(kāi)來(lái)。
如果一天寫(xiě)10篇文章,一年就可以寫(xiě)3650篇文章,給你的網(wǎng)站寫(xiě)3650個(gè)關(guān)鍵詞并合理布局到你網(wǎng)站中,可以使用關(guān)鍵詞挖掘工具提詞,根據(jù)用戶需求進(jìn)行關(guān)鍵詞的篩選,吸引流量指日可待。分詞還有一種好處,那就是提升內(nèi)頁(yè)的排名。SEO是心理學(xué),去猜想用戶使用什么詞搜索,從而進(jìn)行非常有意思的工作。
[聲明]本網(wǎng)轉(zhuǎn)載網(wǎng)絡(luò)媒體稿件是為了傳播更多的信息,此類稿件不代表本網(wǎng)觀點(diǎn),本網(wǎng)不承擔(dān)此類稿件侵權(quán)行為的連帶責(zé)任。故此,如果您發(fā)現(xiàn)本網(wǎng)站的內(nèi)容侵犯了您的版權(quán),請(qǐng)您的相關(guān)內(nèi)容發(fā)至此郵箱【779898168@qq.com】,我們?cè)诖_認(rèn)后,會(huì)立即刪除,保證您的版權(quán)。
官網(wǎng)優(yōu)化
整站優(yōu)化
渠道代理
400-655-5776