当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R read.dta 读取Stata二进制文件


R语言 read.dta 位于 foreign 包(package)。

说明

将 Stata 版本 5-12 二进制格式的文件读入数据帧。

《冰雪奇缘》:12 以后将不支持 Stata 格式。

用法

read.dta(file, convert.dates = TRUE, convert.factors = TRUE,
         missing.type = FALSE,
         convert.underscore = FALSE, warn.missing.labels = TRUE)

参数

file

字符串形式的文件名或 URL。

convert.dates

将 Stata 日期转换为 Date 类,并将 date-times 转换为 POSIXct 类?

convert.factors

使用Stata值标签创建因子? (6.0 或更高版本)。

missing.type

对于版本 8 或更高版本,存储有关不同类型缺失数据的信息?

convert.underscore

将 Stata 变量名称中的"_" 转换为 R 名称中的"."

warn.missing.labels

如果使用值标签指定变量并且这些值标签不存在于文件中,则发出警告。

细节

如果文件名看起来是一个 URL(方案‘⁠http:⁠', '⁠ftp:⁠' 或者 '⁠https:⁠’)URL 首先被下载到临时文件中,然后读取。 (‘⁠https:⁠’仅在某些平台上受支持。)

Stata数据集中的变量成为 DataFrame 的列。缺失值得到正确处理。数据标签、变量标签、时间戳和变量/数据集特征存储为数据帧的属性。

默认情况下,Stata 日期(%d 和 %td 格式)转换为RDate类,带有 Stata 值标签的变量将转换为因子。按说,read.dta除非每个级别都存在标签,否则不会将变量转换为因子。使用convert.factors = NA来覆盖这个。在任何情况下,值标签和格式信息都作为属性存储在返回的数据帧上。 Stata的日期格式被粗略记录:如果需要使用convert.dates = FALSE并检查属性以找出如何 post-process 日期。

Stata 8 引入了一个包含 27 个不同缺失数据值的系统。如果missing.typeTRUE,则会创建一个单独的列表,其变量名称与加载的数据相同。对于字符串变量,列表值为 NULL 。对于其他变量,如果观测值未丢失,则值为 NA;如果观测值丢失,则值为 0-26。它作为返回值的 "missing" 属性附加。

Stata 13 的默认文件格式 format-115 与 Stata 5-12 的默认文件格式有很大不同。

具有属性的 DataFrame 。这些将包括 "datalabel""time.stamp""formats""types""val.labels""var.labels""version" ,并可能包括 "label.table""expansion.table" 。可能的版本有5, 6, 7-7(Stata 7SE,'format-111')、8(Stata 8 和 9,'format-113')、10(Stata 10 和 11,'format-114) ')。和 12(Stata 12,“format-115”)。

属性 "val.labels" 中的值标签为每个变量命名一个表,或者是一个空字符串。这些表是命名列表属性 "label.table" 的元素:每个表都是带有名称的整数向量。

例子

write.dta(swiss,swissfile <- tempfile())
read.dta(swissfile)

作者

Thomas Lumley and R-core members: support for value labels by Brian Quistorff.

参考

Stata Users Manual (versions 5 & 6), Programming manual (version 7), or online help (version 8 and later) describe the format of the files. Or directly at https://www.stata.com/help.cgi?dta_114 and https://www.stata.com/help.cgi?dta_113, but note that these have been changed since first published.

也可以看看

memisc (请参阅 Stata.file 的帮助)、包 haven 中的函数 read_dta 和包 readstata13 中提供了不同的方法。

write.dta , attributes , Date , factor

相关用法


注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Read Stata Binary Files。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。