java版结巴分词:jieba-analysis
结巴分词的原始版本为python编写,目前该项目在github上的关注量为170, 打星727次(最新的数据以原仓库为准),Fork238次,可以说已经有一定的用户群。
结巴分词(java版)只保留的原项目针对搜索引擎分词的功能(cut_for_index、cut_for_search),词性标注,关键词提取没有实现(今后如用到,可以考虑实现)。
简介
支持分词模式
- Search模式,用于对用户查询词分词
- Index模式,用于对索引文档分词
如何获取
- git clone https://github.com/huaban/jieba-analysis.git
- cd jieba-analysis
- mvn package install ,安装到本地仓库
- 在你的 pom.xml 文件中添加以下依赖。
本文由用户 jopen 自行上传分享,仅供网友学习交流。所有权归原作者,若您的权利被侵害,请联系管理员。
转载本站原创文章,请注明出处,并保留原始链接、图片水印。
本站是一个以用户分享为主的开源技术平台,欢迎各类分享!