本文簡要介紹python語言中 sklearn.preprocessing.OrdinalEncoder
的用法。
用法:
class sklearn.preprocessing.OrdinalEncoder(*, categories='auto', dtype=<class 'numpy.float64'>, handle_unknown='error', unknown_value=None)
將分類特征編碼為整數數組。
該轉換器的輸入應該是類似整數或字符串的數組,表示分類(離散)特征所采用的值。特征被轉換為序數整數。這會導致每個特征有一列整數(0 到 n_categories - 1)。
在用戶指南中閱讀更多信息。
- categories:‘auto’ 或類似數組的列表,默認=’auto’
每個函數的類別(唯一值):
- ‘auto’:根據訓練數據自動確定類別。
- list :
categories[i]
包含第 i 列中預期的類別。傳遞的類別不應混合字符串和數值,如果是數值則應進行排序。
使用的類別可以在
categories_
屬性中找到。- dtype:數字類型,默認 np.float64
所需的輸出數據類型。
- handle_unknown:{‘error’, ‘use_encoded_value’},默認='錯誤'
當設置為 ‘error’ 時,如果轉換過程中出現未知的分類特征,將會引發錯誤。當設置為‘use_encoded_value’時,未知類別的編碼值將設置為參數
unknown_value
給定的值。在inverse_transform
中,未知類別將表示為 None。- unknown_value:int 或 np.nan,默認=無
當參數handle_unknown設置為‘use_encoded_value’時,該參數為必填參數,將設置未知類別的編碼值。它必須與
fit
中用於編碼任何類別的值不同。如果設置為 np.nan,則dtype
參數必須是 float dtype。
- categories_:數組列表
在
fit
期間確定的每個特征的類別(按 X 中的特征的順序並與transform
的輸出相對應)。這不包括在fit
期間未出現的類別。- n_features_in_:int
擬合期間看到的特征數。
- feature_names_in_:ndarray 形狀(
n_features_in_
,) 擬合期間看到的特征名稱。僅當
X
具有全為字符串的函數名稱時才定義。
參數:
屬性:
例子:
給定具有兩個特征的數據集,我們讓編碼器找到每個特征的唯一值並將數據轉換為序數編碼。
>>> from sklearn.preprocessing import OrdinalEncoder >>> enc = OrdinalEncoder() >>> X = [['Male', 1], ['Female', 3], ['Female', 2]] >>> enc.fit(X) OrdinalEncoder() >>> enc.categories_ [array(['Female', 'Male'], dtype=object), array([1, 2, 3], dtype=object)] >>> enc.transform([['Female', 3], ['Male', 1]]) array([[0., 2.], [1., 0.]])
>>> enc.inverse_transform([[1, 0], [0, 1]]) array([['Male', 1], ['Female', 2]], dtype=object)
相關用法
- Python sklearn OrthogonalMatchingPursuit用法及代碼示例
- Python sklearn OrthogonalMatchingPursuitCV用法及代碼示例
- Python sklearn OneHotEncoder用法及代碼示例
- Python sklearn OAS用法及代碼示例
- Python sklearn OneVsRestClassifier用法及代碼示例
- Python sklearn OneVsOneClassifier用法及代碼示例
- Python sklearn OneClassSVM用法及代碼示例
- Python sklearn OPTICS用法及代碼示例
- Python sklearn OutputCodeClassifier用法及代碼示例
- Python sklearn jaccard_score用法及代碼示例
- Python sklearn WhiteKernel用法及代碼示例
- Python sklearn CalibrationDisplay.from_predictions用法及代碼示例
- Python sklearn VotingRegressor用法及代碼示例
- Python sklearn gen_batches用法及代碼示例
- Python sklearn ExpSineSquared用法及代碼示例
- Python sklearn MDS用法及代碼示例
- Python sklearn adjusted_rand_score用法及代碼示例
- Python sklearn MLPClassifier用法及代碼示例
- Python sklearn train_test_split用法及代碼示例
- Python sklearn RandomTreesEmbedding用法及代碼示例
- Python sklearn GradientBoostingRegressor用法及代碼示例
- Python sklearn GridSearchCV用法及代碼示例
- Python sklearn log_loss用法及代碼示例
- Python sklearn r2_score用法及代碼示例
- Python sklearn ndcg_score用法及代碼示例
注:本文由純淨天空篩選整理自scikit-learn.org大神的英文原創作品 sklearn.preprocessing.OrdinalEncoder。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。