文件名称:Stemmer

介绍说明--下载内容均来自于网络,请自行研究使用

在英语中,一个单词常常是另一个单词的“变种”,如:happy=>happiness,这里happy叫做happiness的词干(stem)。在信息检索系统中,我们常常做的一件事,就是在Term规范化过程中,提取词干(stemming),即除去英文单词分词变换形式的结尾。



应用最为广泛的、中等复杂程度的、基于后缀剥离的词干提取算法是波特词干算法,也叫波特词干器(Porter Stemmer)。详见官方网站。比较热门的检索系统包括Lucene、Whoosh等中的词干过滤器就是采用的波特词干算法。-In English, a word often another word variants, such as: happy => happiness happy here called happiness stem (stem). Information retrieval system, we often do things Term normalization process, extract the stem (stemming), that is the end of the word transform the form of removal of English words. The most widely used, moderate complexity, stemming algorithms based on suffix stripped Porter Stemming Algorithm, also known as the Porter stemmer Porter Stemmer. For details, please refer to the official website. More popular retrieval system include the word in Lucene, Whoosh done filter is used Porter stemming algorithm.
(系统自动生成,下载前可以参看下载内容)

下载文件列表





Stemmer.java

相关说明

  • 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
  • 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度更多...
  • 请直接用浏览器下载本站内容,不要使用迅雷之类的下载软件,用WinRAR最新版进行解压.
  • 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
  • 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
  • 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.

相关评论

暂无评论内容.

发表评论

*主  题:
*内  容:
*验 证 码:

源码中国 www.ymcn.org