R read.dta 讀取Stata二進製文件

R語言 read.dta 位於 foreign 包(package)。

說明

將 Stata 版本 5-12 二進製格式的文件讀入數據幀。

《冰雪奇緣》：12 以後將不支持 Stata 格式。

用法

read.dta(file, convert.dates = TRUE, convert.factors = TRUE,
         missing.type = FALSE,
         convert.underscore = FALSE, warn.missing.labels = TRUE)

參數

`file`	字符串形式的文件名或 URL。
`convert.dates`	將 Stata 日期轉換為 `Date` 類，並將 date-times 轉換為 `POSIXct` 類？
`convert.factors`	使用Stata值標簽創建因子？ (6.0 或更高版本)。
`missing.type`	對於版本 8 或更高版本，存儲有關不同類型缺失數據的信息？
`convert.underscore`	將 Stata 變量名稱中的`"_"` 轉換為 R 名稱中的`"."`？
`warn.missing.labels`	如果使用值標簽指定變量並且這些值標簽不存在於文件中，則發出警告。

細節

如果文件名看起來是一個 URL(方案‘⁠http:⁠', '⁠ftp：⁠' 或者 '⁠https：⁠’)URL 首先被下載到臨時文件中，然後讀取。 (‘⁠https：⁠’僅在某些平台上受支持。)

Stata數據集中的變量成為 DataFrame 的列。缺失值得到正確處理。數據標簽、變量標簽、時間戳和變量/數據集特征存儲為數據幀的屬性。

默認情況下，Stata 日期(%d 和 %td 格式)轉換為R的Date類，帶有 Stata 值標簽的變量將轉換為因子。按說，read.dta除非每個級別都存在標簽，否則不會將變量轉換為因子。使用convert.factors = NA來覆蓋這個。在任何情況下，值標簽和格式信息都作為屬性存儲在返回的數據幀上。 Stata的日期格式被粗略記錄：如果需要使用convert.dates = FALSE並檢查屬性以找出如何 post-process 日期。

Stata 8 引入了一個包含 27 個不同缺失數據值的係統。如果missing.type 是TRUE，則會創建一個單獨的列表，其變量名稱與加載的數據相同。對於字符串變量，列表值為 NULL 。對於其他變量，如果觀測值未丟失，則值為 NA；如果觀測值丟失，則值為 0-26。它作為返回值的 "missing" 屬性附加。

Stata 13 的默認文件格式 format-115 與 Stata 5-12 的默認文件格式有很大不同。

值

具有屬性的 DataFrame 。這些將包括 "datalabel" 、 "time.stamp" 、 "formats" 、 "types" 、 "val.labels" 、 "var.labels" 和 "version" ，並可能包括 "label.table" 和 "expansion.table" 。可能的版本有5, 6, 7、-7(Stata 7SE，'format-111')、8(Stata 8 和 9，'format-113')、10(Stata 10 和 11，'format-114) ')。和 12(Stata 12，“format-115”)。

屬性 "val.labels" 中的值標簽為每個變量命名一個表，或者是一個空字符串。這些表是命名列表屬性 "label.table" 的元素：每個表都是帶有名稱的整數向量。

例子

write.dta(swiss,swissfile <- tempfile())
read.dta(swissfile)

作者

Thomas Lumley and R-core members: support for value labels by Brian Quistorff.

參考

Stata Users Manual (versions 5 & 6), Programming manual (version 7), or online help (version 8 and later) describe the format of the files. Or directly at https://www.stata.com/help.cgi?dta_114 and https://www.stata.com/help.cgi?dta_113, but note that these have been changed since first published.

也可以看看

包 memisc (請參閱 Stata.file 的幫助)、包 haven 中的函數 read_dta 和包 readstata13 中提供了不同的方法。

write.dta , attributes , Date , factor

相關用法

注：本文由純淨天空篩選整理自R-devel大神的英文原創作品 Read Stata Binary Files。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。