|
2007-10-31
TAG:搜索相关 算法
百度在中国是毫无疑问的搜索引擎中的第一,其在这个领域内也宣称比其他引擎更懂中文搜索。所以对百度搜索引擎的研究可以提高我们对搜索的认识,也为我们研发自己的搜索引擎提供了参照物并可以少走很多弯路。中文搜索引擎的第一个关键解决的是中文分词部分。中文分词的好坏影响到搜索引擎前端用户查询处理到后端的数据索引,所以中文分词的意义巨大。 目前百度 GOOGLE Yahoo搜索引擎采取的中文分词在细节上略有不同,但在大方向还是一致的。基于语义分词,在产生歧义词和登陆词部分采用正向最大匹配、反向最大匹配、双向最大匹配、N-最短路径算法、等等进行消歧 ==来达到用户搜索的命中率和准确率..............
|