百度分词算法详解 DemosoSEO
来源:互联网
作者:网络
时间:2008-03-12
点击:
摘要:本文通过搜索结果归纳分析+切词通用算法分析的方式对百度预处理阶段的查询处理和中文分词两项技术进行了阐述、总结,如果你对数据结构、算法有一定了解的话,理解起来会相对容易些;个人感觉,得出正向最大匹配算法不够准确,无论是专用词典还是普通词典里的词,都是有不
重新归纳一下百度的分词算法系统:首先用专有词典采用最大正向匹配分词,切分出部分结果,剩余没有切分交给普通词典,同样采取正向最大匹配分词,最后输出结果.
另外,GOOGLE也是采用正向最大匹配分词算法,不过好像没有那个专用词典,所以很多专名都被切碎了.
从这点讲,GOOGLE在中文词典构建上比百度差些,还需要加把子力气才行,不过这也不是什么多难的事.
上一篇:百度蜘蛛饲养技巧
下一篇:网站没被百度收录的十六种原因
与百度分词算法详解相关的文章 OTHER SEO
- [ 百度优化 ] 百度公布的关键词在标题描述中的正确
- [ 百度优化 ] 网站没被百度收录的十六种原因
- [ 百度优化 ] 百度分词算法详解
- [ 百度优化 ] 百度蜘蛛饲养技巧
- [ 百度优化 ] 百度搜索引擎使用指南
- [ 百度优化 ] 百度怎样去优化?
- [ 百度优化 ] 谈谈百度搜索解封经验与技巧
- [ 百度优化 ] 百度蜘蛛
- [ 百度优化 ] 百度搜索引擎收录习惯
- [ 百度优化 ] 百度分词算法详解
- [ 百度优化 ] 深入剖析百度排名算法
与百度分词算法详解相关的互联网资讯 OTHER SEO
网友对百度分词算法详解的评论 COMMENT 
苏州SEO资讯加载中...
评论加载中…