这个BinStorage()函数用于使用机器可读格式将数据加载和存储到 Pig 中。BinStorge()in Pig 一般用于存储 MapReduce 作业之间产生的临时数据。它支持多个位置作为输入。
用法
下面给出的是BinStorage()函数。
grunt> BinStorage();
示例
假设我们有一个名为stu_data.txt在 HDFS 目录中/pig_data/如下所示。
Stu_data.txt
001,Rajiv_Reddy,21,Hyderabad 002,siddarth_Battacharya,22,Kolkata 003,Rajesh_Khanna,22,Delhi 004,Preethi_Agarwal,21,Pune 005,Trupthi_Mohanthy,23,Bhuwaneshwar 006,Archana_Mishra,23,Chennai 007,Komal_Nayak,24,trivendram 008,Bharathi_Nambiayar,24,Chennai
让我们将这些数据加载到 Pig 中,形成如下所示的关系。
grunt> student_details = LOAD 'hdfs://localhost:9000/pig_data/stu_data.txt' USING PigStorage(',')
as (id:int, firstname:chararray, age:int, city:chararray);
现在,我们可以store这个关系到名为 HDFS 的目录中/pig_data/使用BinStorage()函数。
grunt> STORE student_details INTO 'hdfs://localhost:9000/pig_Output/mydata' USING BinStorage();
执行上述语句后,关系存储在给定的 HDFS 目录中。您可以使用 HDFS 查看它ls command如下所示。
$ hdfs dfs -ls hdfs://localhost:9000/pig_Output/mydata/ Found 2 items -rw-r--r-- 1 Hadoop supergroup 0 2015-10-26 16:58 hdfs://localhost:9000/pig_Output/mydata/_SUCCESS -rw-r--r-- 1 Hadoop supergroup 372 2015-10-26 16:58 hdfs://localhost:9000/pig_Output/mydata/part-m-00000
现在,从文件中加载数据part-m-00000。
grunt> result = LOAD 'hdfs://localhost:9000/pig_Output/b/part-m-00000' USING BinStorage();
验证关系的内容如下所示
grunt> Dump result; (1,Rajiv_Reddy,21,Hyderabad) (2,siddarth_Battacharya,22,Kolkata) (3,Rajesh_Khanna,22,Delhi) (4,Preethi_Agarwal,21,Pune) (5,Trupthi_Mohanthy,23,Bhuwaneshwar) (6,Archana_Mishra,23,Chennai) (7,Komal_Nayak,24,trivendram) (8,Bharathi_Nambiayar,24,Chennai)
相关用法
- Apache Pig BagToString()用法及代码示例
- Apache Pig HoursBetween()用法及代码示例
- Apache Pig TOKENIZE()用法及代码示例
- Apache Pig SQRT()用法及代码示例
- Apache Pig TAN()用法及代码示例
- Apache Pig TOMAP()用法及代码示例
- Apache Pig TOTUPLE()用法及代码示例
- Apache Pig EqualsIgnoreCase()用法及代码示例
- Apache Pig GetHour()用法及代码示例
- Apache Pig EXP()用法及代码示例
- Apache Pig CurrentTime()用法及代码示例
- Apache Pig UPPER()用法及代码示例
- Apache Pig PluckTuple()用法及代码示例
- Apache Pig UCFIRST()用法及代码示例
- Apache Pig LAST_INDEX_OF()用法及代码示例
- Apache Pig GetMonth()用法及代码示例
- Apache Pig COUNT_STAR()用法及代码示例
- Apache Pig GetWeekYear()用法及代码示例
- Apache Pig DaysBetween()用法及代码示例
- Apache Pig ToDate()用法及代码示例
注:本文由纯净天空筛选整理自 Apache Pig - BinStorage()。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。