read.dta
位於 foreign
包(package)。 說明
將 Stata 版本 5-12 二進製格式的文件讀入數據幀。
《冰雪奇緣》:12 以後將不支持 Stata 格式。
用法
read.dta(file, convert.dates = TRUE, convert.factors = TRUE,
missing.type = FALSE,
convert.underscore = FALSE, warn.missing.labels = TRUE)
參數
file |
字符串形式的文件名或 URL。 |
convert.dates |
將 Stata 日期轉換為 |
convert.factors |
使用Stata值標簽創建因子? (6.0 或更高版本)。 |
missing.type |
對於版本 8 或更高版本,存儲有關不同類型缺失數據的信息? |
convert.underscore |
將 Stata 變量名稱中的 |
warn.missing.labels |
如果使用值標簽指定變量並且這些值標簽不存在於文件中,則發出警告。 |
細節
如果文件名看起來是一個 URL(方案‘http:', 'ftp:' 或者 'https:’)URL 首先被下載到臨時文件中,然後讀取。 (‘https:’僅在某些平台上受支持。)
Stata數據集中的變量成為 DataFrame 的列。缺失值得到正確處理。數據標簽、變量標簽、時間戳和變量/數據集特征存儲為數據幀的屬性。
默認情況下,Stata 日期(%d 和 %td 格式)轉換為R的Date
類,帶有 Stata 值標簽的變量將轉換為因子。按說,read.dta
除非每個級別都存在標簽,否則不會將變量轉換為因子。使用convert.factors = NA
來覆蓋這個。在任何情況下,值標簽和格式信息都作為屬性存儲在返回的數據幀上。 Stata的日期格式被粗略記錄:如果需要使用convert.dates = FALSE
並檢查屬性以找出如何 post-process 日期。
Stata 8 引入了一個包含 27 個不同缺失數據值的係統。如果missing.type
是TRUE
,則會創建一個單獨的列表,其變量名稱與加載的數據相同。對於字符串變量,列表值為 NULL
。對於其他變量,如果觀測值未丟失,則值為 NA
;如果觀測值丟失,則值為 0-26。它作為返回值的 "missing"
屬性附加。
Stata 13 的默認文件格式 format-115
與 Stata 5-12 的默認文件格式有很大不同。
值
具有屬性的 DataFrame 。這些將包括 "datalabel"
、 "time.stamp"
、 "formats"
、 "types"
、 "val.labels"
、 "var.labels"
和 "version"
,並可能包括 "label.table"
和 "expansion.table"
。可能的版本有5, 6, 7
、-7
(Stata 7SE,'format-111')、8
(Stata 8 和 9,'format-113')、10
(Stata 10 和 11,'format-114) ')。和 12
(Stata 12,“format-115”)。
屬性 "val.labels"
中的值標簽為每個變量命名一個表,或者是一個空字符串。這些表是命名列表屬性 "label.table"
的元素:每個表都是帶有名稱的整數向量。
例子
write.dta(swiss,swissfile <- tempfile())
read.dta(swissfile)
作者
Thomas Lumley and R-core members: support for value labels by Brian Quistorff.
參考
Stata Users Manual (versions 5 & 6), Programming manual (version 7), or online help (version 8 and later) describe the format of the files. Or directly at https://www.stata.com/help.cgi?dta_114 and https://www.stata.com/help.cgi?dta_113, but note that these have been changed since first published.
也可以看看
包 memisc
(請參閱 Stata.file
的幫助)、包 haven
中的函數 read_dta
和包 readstata13
中提供了不同的方法。
write.dta
, attributes
, Date
, factor
相關用法
- R read.dbf 讀取 DBF 文件
- R read.ssd 通過 read.xport 從 SAS 永久數據集中獲取數據幀
- R read.mtp 閱讀 Minitab 便攜式工作表
- R read.octave 讀取八度文本數據文件
- R read.epiinfo 讀取 Epi 信息數據文件
- R read.xport 讀取 SAS XPORT 格式庫
- R read.arff 從 ARFF 文件讀取數據
- R read.spss 讀取 SPSS 數據文件
- R read.systat 從 Systat 文件獲取數據幀
- R write.dbf 寫入 DBF 文件
- R write.foreign 編寫文本文件和代碼來讀取它們
- R write.dta 以 Stata 二進製格式寫入文件
- R S3 讀取 S3 二進製或 data.dump 文件
- R lookup.xport 有關 SAS XPORT 格式庫的查找信息
- R write.arff 將數據寫入 ARFF 文件
- R forcats fct_relevel 手動重新排序因子級別
- R forcats as_factor 將輸入轉換為因子
- R forcats fct_anon 匿名因子水平
- R forcats fct_rev 因子水平的倒序
- R forcats fct_match 測試因子中是否存在水平
- R forcats fct_relabel 使用函數重新標記因子水平,並根據需要折疊
- R forcats fct_c 連接因子,組合級別
- R forcats fct_collapse 將因子級別折疊為手動定義的組
注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Read Stata Binary Files。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。