用法:
class cuml.preprocessing.text.stem.PorterStemmer(mode='NLTK_EXTENSIONS')
基於 Porter 詞幹算法的詞幹分析器。
Porter, M. “一種後綴剝離算法”。計劃 14.3 (1980):130-137。
有關算法的主頁,請參見http://www.tartarus.org/~martin/PorterStemmer/。
自撰寫原始論文以來,Martin Porter 已認可對 Porter 算法的多項修改,這些擴展已包含在他網站上的實現中。此外,其他人提出了對該算法的進一步改進,包括 NLTK 貢獻者。目前僅支持以下模式 PorterStemmer.NLTK_EXTENSIONS
- 包括由 NLTK 貢獻者設計的或從網絡上找到的其他修改後的實現中獲取的進一步改進的實現。
- mode: Modes of stemming (Only supports (NLTK_EXTENSIONS) currently):
默認(“NLTK_EXTENSIONS”)
參數:
例子:
import cudf from cuml.preprocessing.text.stem import PorterStemmer stemmer = PorterStemmer() word_str_ser = cudf.Series(['revival','singing','adjustable']) print(stemmer.stem(word_str_ser))
輸出:
0 reviv 1 sing 2 adjust dtype: object
相關用法
- Python cuml.preprocessing.LabelBinarizer用法及代碼示例
- Python cuml.preprocessing.LabelEncoder.LabelEncoder用法及代碼示例
- Python cuml.preprocessing.TargetEncoder.TargetEncoder用法及代碼示例
- Python cuml.metrics.pairwise_distances.pairwise_distances用法及代碼示例
- Python cuml.neighbors.KNeighborsClassifier用法及代碼示例
- Python cuml.ensemble.RandomForestRegressor用法及代碼示例
- Python cuml.svm.SVC用法及代碼示例
- Python cuml.svm.SVR用法及代碼示例
- Python cuml.Lasso用法及代碼示例
- Python cuml.tsa.ARIMA.predict用法及代碼示例
- Python cuml.multiclass.OneVsRestClassifier用法及代碼示例
- Python cuml.random_projection.GaussianRandomProjection用法及代碼示例
- Python cuml.MBSGDRegressor用法及代碼示例
- Python cuml.experimental.preprocessing.PolynomialFeatures用法及代碼示例
- Python cuml.PCA用法及代碼示例
- Python cuml.feature_extraction.text.HashingVectorizer用法及代碼示例
- Python cuml.DBSCAN用法及代碼示例
- Python cuml.dask.feature_extraction.text.TfidfTransformer用法及代碼示例
- Python cuml.TruncatedSVD用法及代碼示例
- Python cuml.common.memory_utils.using_output_type用法及代碼示例
注:本文由純淨天空篩選整理自rapids.ai大神的英文原創作品 cuml.preprocessing.text.stem.PorterStemmer。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。