当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python cuml.preprocessing.text.stem.PorterStemmer用法及代码示例


用法:

class cuml.preprocessing.text.stem.PorterStemmer(mode='NLTK_EXTENSIONS')

基于 Porter 词干算法的词干分析器。

Porter, M. “一种后缀剥离算法”。计划 14.3 (1980):130-137。

有关算法的主页,请参见http://www.tartarus.org/~martin/PorterStemmer/

自撰写原始论文以来,Martin Porter 已认可对 Porter 算法的多项修改,这些扩展已包含在他网站上的实现中。此外,其他人提出了对该算法的进一步改进,包括 NLTK 贡献者。目前仅支持以下模式 PorterStemmer.NLTK_EXTENSIONS

  • 包括由 NLTK 贡献者设计的或从网络上找到的其他修改后的实现中获取的进一步改进的实现。

参数

mode: Modes of stemming (Only supports (NLTK_EXTENSIONS) currently)

默认(“NLTK_EXTENSIONS”)

例子

import cudf
from cuml.preprocessing.text.stem import PorterStemmer
stemmer = PorterStemmer()
word_str_ser =  cudf.Series(['revival','singing','adjustable'])
print(stemmer.stem(word_str_ser))

输出:

0     reviv
1      sing
2    adjust
dtype: object

相关用法


注:本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cuml.preprocessing.text.stem.PorterStemmer。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。