当前位置 : 苏州SEO>百度优化>
百度分词算法详解 DemosoSEO

来源:互联网   作者:网络   时间:2008-03-12   点击:

摘要:本文通过搜索结果归纳分析+切词通用算法分析的方式对百度预处理阶段的查询处理和中文分词两项技术进行了阐述、总结,如果你对数据结构、算法有一定了解的话,理解起来会相对容易些;个人感觉,得出正向最大匹配算法不够准确,无论是专用词典还是普通词典里的词,都是有不

  重新归纳一下百度的分词算法系统:首先用专有词典采用最大正向匹配分词,切分出部分结果,剩余没有切分交给普通词典,同样采取正向最大匹配分词,最后输出结果.

  另外,GOOGLE也是采用正向最大匹配分词算法,不过好像没有那个专用词典,所以很多专名都被切碎了.

  从这点讲,GOOGLE在中文词典构建上比百度差些,还需要加把子力气才行,不过这也不是什么多难的事.

原创文章如转载,请注明:转载自海洋风@苏州SEO [ http://www.demoseo.cn/ ]
本文链接地址:http://www.demoseo.cn/Baidu-Optimization/baidufencisuanfaxiangjie_85.html

  

网友对百度分词算法详解的评论 COMMENT  

苏州SEO资讯加载中...
    评论加载中…