花了将近2个多星期时间终于完成了中文分词部分的研发工作,事实上结果比预期的更好,不但在中文分词部分能够达到正规搜索引擎的分词质量,更为重要的是掌握了很多正规搜索引擎应该做的细节点,而且完成了内容聚类和图片搜索的工作。
接下来将把中文分词成果移植到我们已有的系统中,另外抽时间把图片搜索上线(目前搜索了16万张图片的数据)。
这里对公司表示感谢,没有几家公司可以给员工这么大的空间去做这样有意思的事情,而幸运的是我在这样的公司工作,所以心存感谢。