Python pandas.read_sas方法代码示例

本文整理汇总了Python中pandas.read_sas方法的典型用法代码示例。如果您正苦于以下问题：Python pandas.read_sas方法的具体用法？Python pandas.read_sas怎么用？Python pandas.read_sas使用的例子？那么, 这里精选的方法代码示例或许可以为您提供帮助。您也可以进一步了解该方法所在类pandas的用法示例。

在下文中一共展示了pandas.read_sas方法的15个代码示例，这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞，您的评价将有助于系统推荐出更棒的Python代码示例。

示例1: test_encoding_options

# 需要导入模块: import pandas [as 别名]
# 或者: from pandas import read_sas [as 别名]
def test_encoding_options(datapath):
    fname = datapath("io", "sas", "data", "test1.sas7bdat")
    df1 = pd.read_sas(fname)
    df2 = pd.read_sas(fname, encoding='utf-8')
    for col in df1.columns:
        try:
            df1[col] = df1[col].str.decode('utf-8')
        except AttributeError:
            pass
    tm.assert_frame_equal(df1, df2)

    from pandas.io.sas.sas7bdat import SAS7BDATReader
    rdr = SAS7BDATReader(fname, convert_header_text=False)
    df3 = rdr.read()
    rdr.close()
    for x, y in zip(df1.columns, df3.columns):
        assert(x == y.decode())

开发者ID:Frank-qlu，项目名称:recruit，代码行数:19，代码来源:test_sas7bdat.py

示例2: test_encoding_options

# 需要导入模块: import pandas [as 别名]
# 或者: from pandas import read_sas [as 别名]
def test_encoding_options():
    dirpath = tm.get_data_path()
    fname = os.path.join(dirpath, "test1.sas7bdat")
    df1 = pd.read_sas(fname)
    df2 = pd.read_sas(fname, encoding='utf-8')
    for col in df1.columns:
        try:
            df1[col] = df1[col].str.decode('utf-8')
        except AttributeError:
            pass
    tm.assert_frame_equal(df1, df2)

    from pandas.io.sas.sas7bdat import SAS7BDATReader
    rdr = SAS7BDATReader(fname, convert_header_text=False)
    df3 = rdr.read()
    rdr.close()
    for x, y in zip(df1.columns, df3.columns):
        assert(x == y.decode())

开发者ID:securityclippy，项目名称:elasticintel，代码行数:20，代码来源:test_sas7bdat.py

示例3: read_sas

# 需要导入模块: import pandas [as 别名]
# 或者: from pandas import read_sas [as 别名]
def read_sas(
        cls,
        filepath_or_buffer,
        format=None,
        index=None,
        encoding=None,
        chunksize=None,
        iterator=False,
    ):  # pragma: no cover
        ErrorMessage.default_to_pandas("`read_sas`")
        return cls.from_pandas(
            pandas.read_sas(
                filepath_or_buffer,
                format=format,
                index=index,
                encoding=encoding,
                chunksize=chunksize,
                iterator=iterator,
            )
        )

开发者ID:modin-project，项目名称:modin，代码行数:22，代码来源:io.py

示例4: test_from_iterator

# 需要导入模块: import pandas [as 别名]
# 或者: from pandas import read_sas [as 别名]
def test_from_iterator(self):
        for j in 0, 1:
            df0 = self.data[j]
            for k in self.test_ix[j]:
                fname = os.path.join(
                    self.dirpath, "test{k}.sas7bdat".format(k=k))
                rdr = pd.read_sas(fname, iterator=True, encoding='utf-8')
                df = rdr.read(2)
                tm.assert_frame_equal(df, df0.iloc[0:2, :])
                df = rdr.read(3)
                tm.assert_frame_equal(df, df0.iloc[2:5, :])
                rdr.close()

开发者ID:Frank-qlu，项目名称:recruit，代码行数:14，代码来源:test_sas7bdat.py

示例5: get_format_extractor

# 需要导入模块: import pandas [as 别名]
# 或者: from pandas import read_sas [as 别名]
def get_format_extractor(self, stream, schema=None):
        return SASFormatExtractor(stream, schema, self.config)    


# Fix for the stream class provided by DSS
# Seek could be disabled by a one-liner like the following one but read_sas may seek forward
# self.stream.seek = types.MethodType(lambda self, _: False, self.stream)

开发者ID:dataiku，项目名称:dataiku-contrib，代码行数:9，代码来源:format.py

示例6: init

# 需要导入模块: import pandas [as 别名]
# 或者: from pandas import read_sas [as 别名]
def __init__(self, stream, schema, config):
        FormatExtractor.__init__(self, stream)
        
        chunksize = int(config.get("chunksize", "10000"))
        sas_format = config.get("sas_format", "sas7bdat")
        encoding = config.get("encoding", "latin_1")
        dump_to_file = config.get("dump_to_file", False)

        self.hasSchema = schema != None

        read_from = ForwardSeekStream(stream)

        if dump_to_file:
            dirname, _ = os.path.split(os.path.abspath(__file__))
            fullpath = os.path.join(dirname, 'dumped-%s.sas7bdat' % (time.time()))
            with open(fullpath, 'w+') as of:
                # Reading 500kb data everytime
                for data in iter((lambda:stream.read(500000)), b''):
                    of.write(data)
                
            read_from = fullpath

        self.iterator = pd.read_sas(read_from,
                                    format=sas_format,
                                    iterator=True,
                                    encoding=encoding,
                                    chunksize=chunksize)

        self.get_chunk()

开发者ID:dataiku，项目名称:dataiku-contrib，代码行数:31，代码来源:format.py

示例7: test_from_file

# 需要导入模块: import pandas [as 别名]
# 或者: from pandas import read_sas [as 别名]
def test_from_file(self):
        for j in 0, 1:
            df0 = self.data[j]
            for k in self.test_ix[j]:
                fname = os.path.join(
                    self.dirpath, "test{k}.sas7bdat".format(k=k))
                df = pd.read_sas(fname, encoding='utf-8')
                tm.assert_frame_equal(df, df0)

开发者ID:Frank-qlu，项目名称:recruit，代码行数:10，代码来源:test_sas7bdat.py

示例8: test_from_buffer

# 需要导入模块: import pandas [as 别名]
# 或者: from pandas import read_sas [as 别名]
def test_from_buffer(self):
        for j in 0, 1:
            df0 = self.data[j]
            for k in self.test_ix[j]:
                fname = os.path.join(
                    self.dirpath, "test{k}.sas7bdat".format(k=k))
                with open(fname, 'rb') as f:
                    byts = f.read()
                buf = io.BytesIO(byts)
                rdr = pd.read_sas(buf, format="sas7bdat",
                                  iterator=True, encoding='utf-8')
                df = rdr.read()
                tm.assert_frame_equal(df, df0, check_exact=False)
                rdr.close()

开发者ID:Frank-qlu，项目名称:recruit，代码行数:16，代码来源:test_sas7bdat.py

示例9: test_path_pathlib

# 需要导入模块: import pandas [as 别名]
# 或者: from pandas import read_sas [as 别名]
def test_path_pathlib(self):
        from pathlib import Path
        for j in 0, 1:
            df0 = self.data[j]
            for k in self.test_ix[j]:
                fname = Path(os.path.join(
                    self.dirpath, "test{k}.sas7bdat".format(k=k)))
                df = pd.read_sas(fname, encoding='utf-8')
                tm.assert_frame_equal(df, df0)

开发者ID:Frank-qlu，项目名称:recruit，代码行数:11，代码来源:test_sas7bdat.py

示例10: test_path_localpath

# 需要导入模块: import pandas [as 别名]
# 或者: from pandas import read_sas [as 别名]
def test_path_localpath(self):
        from py.path import local as LocalPath
        for j in 0, 1:
            df0 = self.data[j]
            for k in self.test_ix[j]:
                fname = LocalPath(os.path.join(
                    self.dirpath, "test{k}.sas7bdat".format(k=k)))
                df = pd.read_sas(fname, encoding='utf-8')
                tm.assert_frame_equal(df, df0)

开发者ID:Frank-qlu，项目名称:recruit，代码行数:11，代码来源:test_sas7bdat.py

示例11: test_iterator_read_too_much

# 需要导入模块: import pandas [as 别名]
# 或者: from pandas import read_sas [as 别名]
def test_iterator_read_too_much(self):
        # github #14734
        k = self.test_ix[0][0]
        fname = os.path.join(self.dirpath, "test{k}.sas7bdat".format(k=k))
        rdr = pd.read_sas(fname, format="sas7bdat",
                          iterator=True, encoding='utf-8')
        d1 = rdr.read(rdr.row_count + 20)
        rdr.close()

        rdr = pd.read_sas(fname, iterator=True, encoding="utf-8")
        d2 = rdr.read(rdr.row_count + 20)
        tm.assert_frame_equal(d1, d2)
        rdr.close()

开发者ID:Frank-qlu，项目名称:recruit，代码行数:15，代码来源:test_sas7bdat.py

示例12: test_productsales

# 需要导入模块: import pandas [as 别名]
# 或者: from pandas import read_sas [as 别名]
def test_productsales(datapath):
    fname = datapath("io", "sas", "data", "productsales.sas7bdat")
    df = pd.read_sas(fname, encoding='utf-8')
    fname = datapath("io", "sas", "data", "productsales.csv")
    df0 = pd.read_csv(fname, parse_dates=['MONTH'])
    vn = ["ACTUAL", "PREDICT", "QUARTER", "YEAR"]
    df0[vn] = df0[vn].astype(np.float64)
    tm.assert_frame_equal(df, df0)