當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R read.dta 讀取Stata二進製文件


R語言 read.dta 位於 foreign 包(package)。

說明

將 Stata 版本 5-12 二進製格式的文件讀入數據幀。

《冰雪奇緣》:12 以後將不支持 Stata 格式。

用法

read.dta(file, convert.dates = TRUE, convert.factors = TRUE,
         missing.type = FALSE,
         convert.underscore = FALSE, warn.missing.labels = TRUE)

參數

file

字符串形式的文件名或 URL。

convert.dates

將 Stata 日期轉換為 Date 類,並將 date-times 轉換為 POSIXct 類?

convert.factors

使用Stata值標簽創建因子? (6.0 或更高版本)。

missing.type

對於版本 8 或更高版本,存儲有關不同類型缺失數據的信息?

convert.underscore

將 Stata 變量名稱中的"_" 轉換為 R 名稱中的"."

warn.missing.labels

如果使用值標簽指定變量並且這些值標簽不存在於文件中,則發出警告。

細節

如果文件名看起來是一個 URL(方案‘⁠http:⁠', '⁠ftp:⁠' 或者 '⁠https:⁠’)URL 首先被下載到臨時文件中,然後讀取。 (‘⁠https:⁠’僅在某些平台上受支持。)

Stata數據集中的變量成為 DataFrame 的列。缺失值得到正確處理。數據標簽、變量標簽、時間戳和變量/數據集特征存儲為數據幀的屬性。

默認情況下,Stata 日期(%d 和 %td 格式)轉換為RDate類,帶有 Stata 值標簽的變量將轉換為因子。按說,read.dta除非每個級別都存在標簽,否則不會將變量轉換為因子。使用convert.factors = NA來覆蓋這個。在任何情況下,值標簽和格式信息都作為屬性存儲在返回的數據幀上。 Stata的日期格式被粗略記錄:如果需要使用convert.dates = FALSE並檢查屬性以找出如何 post-process 日期。

Stata 8 引入了一個包含 27 個不同缺失數據值的係統。如果missing.typeTRUE,則會創建一個單獨的列表,其變量名稱與加載的數據相同。對於字符串變量,列表值為 NULL 。對於其他變量,如果觀測值未丟失,則值為 NA;如果觀測值丟失,則值為 0-26。它作為返回值的 "missing" 屬性附加。

Stata 13 的默認文件格式 format-115 與 Stata 5-12 的默認文件格式有很大不同。

具有屬性的 DataFrame 。這些將包括 "datalabel""time.stamp""formats""types""val.labels""var.labels""version" ,並可能包括 "label.table""expansion.table" 。可能的版本有5, 6, 7-7(Stata 7SE,'format-111')、8(Stata 8 和 9,'format-113')、10(Stata 10 和 11,'format-114) ')。和 12(Stata 12,“format-115”)。

屬性 "val.labels" 中的值標簽為每個變量命名一個表,或者是一個空字符串。這些表是命名列表屬性 "label.table" 的元素:每個表都是帶有名稱的整數向量。

例子

write.dta(swiss,swissfile <- tempfile())
read.dta(swissfile)

作者

Thomas Lumley and R-core members: support for value labels by Brian Quistorff.

參考

Stata Users Manual (versions 5 & 6), Programming manual (version 7), or online help (version 8 and later) describe the format of the files. Or directly at https://www.stata.com/help.cgi?dta_114 and https://www.stata.com/help.cgi?dta_113, but note that these have been changed since first published.

也可以看看

memisc (請參閱 Stata.file 的幫助)、包 haven 中的函數 read_dta 和包 readstata13 中提供了不同的方法。

write.dta , attributes , Date , factor

相關用法


注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Read Stata Binary Files。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。