當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python cuml.preprocessing.text.stem.PorterStemmer用法及代碼示例


用法:

class cuml.preprocessing.text.stem.PorterStemmer(mode='NLTK_EXTENSIONS')

基於 Porter 詞幹算法的詞幹分析器。

Porter, M. “一種後綴剝離算法”。計劃 14.3 (1980):130-137。

有關算法的主頁,請參見http://www.tartarus.org/~martin/PorterStemmer/

自撰寫原始論文以來,Martin Porter 已認可對 Porter 算法的多項修改,這些擴展已包含在他網站上的實現中。此外,其他人提出了對該算法的進一步改進,包括 NLTK 貢獻者。目前僅支持以下模式 PorterStemmer.NLTK_EXTENSIONS

  • 包括由 NLTK 貢獻者設計的或從網絡上找到的其他修改後的實現中獲取的進一步改進的實現。

參數

mode: Modes of stemming (Only supports (NLTK_EXTENSIONS) currently)

默認(“NLTK_EXTENSIONS”)

例子

import cudf
from cuml.preprocessing.text.stem import PorterStemmer
stemmer = PorterStemmer()
word_str_ser =  cudf.Series(['revival','singing','adjustable'])
print(stemmer.stem(word_str_ser))

輸出:

0     reviv
1      sing
2    adjust
dtype: object

相關用法


注:本文由純淨天空篩選整理自rapids.ai大神的英文原創作品 cuml.preprocessing.text.stem.PorterStemmer。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。