Jcseg(Java中文分词器) v2.6.2官方版 for Win

Jcseg(Java中文分词器) v2.6.2官方版 for Win

立即下载
免费资源
0
0

Jcseg是基于mmseg算法的一个轻量级Java中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene,solr和elasticsearch的搜索分词接口。

软件截图

Jcseg(Java中文分词器) v2.6.2官方版更新说明:

  • 修复了已知问题

Jcseg是基于mmseg算法的一个轻量级Java中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene,solr和elasticsearch的搜索分词接口。

Jcseg核心功能包括中文分词、关键字提取、关键短语提取、关键句子提取、文章自动摘要、自动词性标注、命名实体标注和Restfulapi。其中,中文分词采用mmseg算法和Jcseg独创的优化算法,提供七种切分模式。关键字提取、关键短语提取和关键句子提取基于textRank算法,文章自动摘要基于BM25+textRank算法。词性标注和实体标注基于词库和统计歧义去除计划。

Jcseg的分词功能特性包括支持自定义词库、多目录加载、简体/繁体/简繁体混合词库、中英文同义词追加、中文数字和中文分数识别、中英混合词和英中混合词识别、英文类中文切分、拉丁支持、自定义切分保留标点、阿拉伯数字/小数/中文数字识别、智能圆角半角、特殊字母和数字识别、配对标点内容提取、中文人名识别、停止词过滤、词库更新自动加载、自动词性标注和实体识别等功能。

总的来说,Jcseg是一个功能丰富、性能优越的Java中文分词器,适用于各种中文文本处理应用场景。

下载信息

该资源需登录后下载

去登录
温馨提示:本资源来源于互联网,仅供参考学习使用。若该资源侵犯了您的权益,请 联系我们 处理。