NNDM 是留一交叉驗證的一種變體,它將每個觀察值分配給單個評估折疊,然後嘗試從每個分析折疊中刪除數據,直到評估折疊和分析折疊之間的最近鄰距離分布與最近鄰距離分布匹配訓練數據和模型將用於預測的位置之間的關係。由 Milà 等人提出。 (2022),該方法旨在準確估計模型在其實際預測的位置上的表現。該方法最初是在 CAST 包中實現的。
用法
spatial_nndm_cv(
data,
prediction_sites,
...,
autocorrelation_range = NULL,
prediction_sample_size = 1000,
min_analysis_proportion = 0.5
)
參數
- data
-
類
sf
或sfc
的對象。 - prediction_sites
-
說明要預測的區域的
sf
或sfc
對象。如果prediction_sites
都是點,那麽在計算目標最近鄰距離時,這些點將被視為預期預測點。如果prediction_sites
的任何元素不是單個點,則從prediction_sites
的邊界框內對點進行采樣,然後將這些點用作預期預測點。 - ...
-
傳遞給
sf::st_sample()
的其他參數。請注意,采樣點數由prediction_sample_size
控製;嘗試通過...
傳遞size
將導致錯誤。 - autocorrelation_range
-
長度為 1 的數字,表示景觀自相關範圍(Milà 等人 (2022) 術語中的"phi")。如果默認為
NULL
,則自相關範圍假定為prediction_sites
邊界框對角之間的距離。 - prediction_sample_size
-
長度為1的數字:當
prediction_sites
不僅僅由點組成時,要采樣的點數。請注意,此參數傳遞給sf::st_sample()
中的size
,這意味著...
中的任何元素都不能命名為size
。 - min_analysis_proportion
-
刪除點以匹配最近鄰居距離後必須保留的
data
的最小比例。一旦分析集中僅保留min_analysis_proportion
原始數據,此函數將停止從分析集中刪除數據,即使分析集和評估集之間的最近鄰距離仍然低於訓練位置和預測位置之間的距離。
值
帶有類 spatial_nndm_cv
、 spatial_rset
、 rset
、 tbl_df
、 tbl
和 data.frame
的 tibble。結果包括數據分割對象的列和標識變量 id
。
參考
C. Milà、J. Mateu、E. Pebesma 和 H. Meyer。 2022.“用於Map驗證的最近鄰距離匹配留一交叉驗證”。生態學和進化方法 2022:13,第 1304-1316 頁。doi:10.1111/2041-210X.13851。
H.邁耶和E.佩貝斯瑪。 2022年。“基於機器學習的生態變量全局Map以及評估它們的挑戰。” 《自然通訊》13,第 2208 頁。doi:10.1038/s41467-022-29838-9。
例子
data(ames, package = "modeldata")
ames_sf <- sf::st_as_sf(ames, coords = c("Longitude", "Latitude"), crs = 4326)
# Using a small subset of the data, to make the example run faster:
spatial_nndm_cv(ames_sf[1:100, ], ames_sf[2001:2100, ])
#> # A tibble: 100 × 2
#> splits id
#> <list> <chr>
#> 1 <split [50/1]> Fold001
#> 2 <split [83/1]> Fold002
#> 3 <split [50/1]> Fold003
#> 4 <split [50/1]> Fold004
#> 5 <split [50/1]> Fold005
#> 6 <split [50/1]> Fold006
#> 7 <split [50/1]> Fold007
#> 8 <split [76/1]> Fold008
#> 9 <split [86/1]> Fold009
#> 10 <split [88/1]> Fold010
#> # ℹ 90 more rows
相關用法
- R spatialsample spatial_clustering_cv 空間聚類交叉驗證
- R spatialsample spatial_block_cv 空間塊交叉驗證
- R spatialsample spatial_vfold 帶緩衝的 V 形折疊交叉驗證
- R spatialsample autoplot.spatial_rset 創建用於空間重采樣的 ggplot。
- R variogram 計算空間變異函數
- R anova.trls 用於擬合趨勢表麵對象的方差分析表
- R Kfn 計算點模式的 K-fn
- R Kenvl 計算 K-fns 模擬的包絡和平均值
- R correlogram 計算空間相關圖
- R trmat 評估網格上的趨勢麵
- R Kaver 模擬的平均 K 函數
- R semat 評估網格預測的克裏金標準誤差
- R surf.ls 通過最小二乘法擬合趨勢麵
- R ppgetregion 獲取空間點模式分析的域
- R pplik Strauss空間點過程的偽似然估計
- R surf.gls 通過廣義最小二乘法擬合趨勢麵
- R ppregion 設置空間點模式分析的域
- R Strauss 模擬施特勞斯空間點過程
- R prmat 評估網格上的克裏金曲麵
- R ppinit 從文件中讀取點過程對象
- R trls.influence 趨勢麵的回歸診斷
- R SSI 模擬連續空間抑製點過程
- R predict.trls 趨勢曲麵擬合的預測方法
- R expcov 空間協方差函數
- R Psim 模擬二項式空間點過程
注:本文由純淨天空篩選整理自Michael Mahoney等大神的英文原創作品 Nearest neighbor distance matching (NNDM) cross-validation。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。