本文整理汇总了Java中org.apache.pig.data.DataType类的典型用法代码示例。如果您正苦于以下问题:Java DataType类的具体用法?Java DataType怎么用?Java DataType使用的例子?那么, 这里精选的类代码示例或许可以为您提供帮助。
DataType类属于org.apache.pig.data包,在下文中一共展示了DataType类的15个代码示例,这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞,您的评价将有助于系统推荐出更棒的Java代码示例。
示例1: getSchema
import org.apache.pig.data.DataType; //导入依赖的package包/类
@Override
public ResourceSchema getSchema(final String s, final Job job) throws IOException {
ResourceSchema.ResourceFieldSchema remoteAddrFieldSchema = new ResourceSchema.ResourceFieldSchema(new Schema.FieldSchema("remoteAddr", DataType.BYTEARRAY));
ResourceSchema.ResourceFieldSchema accessTimeFieldSchema = new ResourceSchema.ResourceFieldSchema(new Schema.FieldSchema("accessTime", DataType.BYTEARRAY));
ResourceSchema.ResourceFieldSchema methodFieldSchema = new ResourceSchema.ResourceFieldSchema(new Schema.FieldSchema("method", DataType.BYTEARRAY));
ResourceSchema.ResourceFieldSchema urlFieldSchema = new ResourceSchema.ResourceFieldSchema(new Schema.FieldSchema("url", DataType.BYTEARRAY));
ResourceSchema.ResourceFieldSchema protocolFieldSchema = new ResourceSchema.ResourceFieldSchema(new Schema.FieldSchema("protocol", DataType.BYTEARRAY));
ResourceSchema.ResourceFieldSchema agentFieldSchema = new ResourceSchema.ResourceFieldSchema(new Schema.FieldSchema("agent", DataType.BYTEARRAY));
ResourceSchema.ResourceFieldSchema referFieldSchema = new ResourceSchema.ResourceFieldSchema(new Schema.FieldSchema("refer", DataType.BYTEARRAY));
ResourceSchema.ResourceFieldSchema statusFieldSchema = new ResourceSchema.ResourceFieldSchema(new Schema.FieldSchema("status", DataType.INTEGER));
ResourceSchema.ResourceFieldSchema lengthFieldSchema = new ResourceSchema.ResourceFieldSchema(new Schema.FieldSchema("length", DataType.INTEGER));
ResourceSchema resourceSchema = new ResourceSchema();
resourceSchema.setFields(new ResourceSchema.ResourceFieldSchema[]{remoteAddrFieldSchema, accessTimeFieldSchema, methodFieldSchema, urlFieldSchema, protocolFieldSchema, agentFieldSchema, referFieldSchema, statusFieldSchema, lengthFieldSchema});
return resourceSchema;
}
示例2: testIntegerTypeInTuple
import org.apache.pig.data.DataType; //导入依赖的package包/类
@Test
public void testIntegerTypeInTuple() throws IOException {
Query query = new Query();
query.value = "";
Schema fakeSchema = getSchema(makeFieldSchema("a", DataType.INTEGER),
makeFieldSchema("b", DataType.LONG));
Tuple fakeTuple = makeTuple(Integer.valueOf(42), Long.valueOf(84));
sty = getSty(withMockResult(withMockSchema(getServer(), fakeSchema), fakeTuple));
runWithoutOutput(() -> sty.execute(query));
Assert.assertFalse(query.failed());
List<TypedObject> columnOne = query.getResult().getColumn("a").getValues();
List<TypedObject> columnTwo = query.getResult().getColumn("b").getValues();
Assert.assertNotNull(columnOne);
Assert.assertEquals(columnOne.size(), 1);
Assert.assertEquals(columnOne.get(0).data, Long.valueOf(42));
Assert.assertNotNull(columnTwo);
Assert.assertEquals(columnTwo.size(), 1);
Assert.assertEquals(columnTwo.get(0).data, Long.valueOf(84));
}
示例3: testFloatTypeInTuple
import org.apache.pig.data.DataType; //导入依赖的package包/类
@Test
public void testFloatTypeInTuple() throws IOException {
Query query = new Query();
query.value = "";
Schema fakeSchema = getSchema(makeFieldSchema("a", DataType.FLOAT),
makeFieldSchema("b", DataType.DOUBLE));
Tuple fakeTuple = makeTuple(Float.valueOf(2.1f), Double.valueOf(4.2));
sty = getSty(withMockResult(withMockSchema(getServer(), fakeSchema), fakeTuple));
runWithoutOutput(() -> sty.execute(query));
Assert.assertFalse(query.failed());
List<TypedObject> columnOne = query.getResult().getColumn("a").getValues();
List<TypedObject> columnTwo = query.getResult().getColumn("b").getValues();
Assert.assertNotNull(columnOne);
Assert.assertEquals(columnOne.size(), 1);
Assert.assertTrue(Math.abs((Double) columnOne.get(0).data - Double.valueOf(2.1)) < EPSILON);
Assert.assertNotNull(columnTwo);
Assert.assertEquals(columnTwo.size(), 1);
Assert.assertTrue(Math.abs((Double) columnTwo.get(0).data - Double.valueOf(4.2)) < EPSILON);
}
示例4: testBigNumericTypeInTuple
import org.apache.pig.data.DataType; //导入依赖的package包/类
@Test
public void testBigNumericTypeInTuple() throws IOException {
Query query = new Query();
query.value = "";
Schema fakeSchema = getSchema(makeFieldSchema("a", DataType.BIGINTEGER),
makeFieldSchema("b", DataType.BIGDECIMAL));
Tuple fakeTuple = makeTuple(new BigInteger("42"), new BigDecimal("42.1"));
sty = getSty(withMockResult(withMockSchema(getServer(), fakeSchema), fakeTuple));
runWithoutOutput(() -> sty.execute(query));
Assert.assertFalse(query.failed());
List<TypedObject> columnOne = query.getResult().getColumn("a").getValues();
List<TypedObject> columnTwo = query.getResult().getColumn("b").getValues();
Assert.assertNotNull(columnOne);
Assert.assertEquals(columnOne.size(), 1);
Assert.assertEquals(columnOne.get(0).data, new BigDecimal("42"));
Assert.assertNotNull(columnTwo);
Assert.assertEquals(columnTwo.size(), 1);
Assert.assertEquals(columnTwo.get(0).data, new BigDecimal("42.1"));
}
示例5: testStringTypeInTuple
import org.apache.pig.data.DataType; //导入依赖的package包/类
@Test
public void testStringTypeInTuple() throws IOException {
Query query = new Query();
query.value = "";
Schema fakeSchema = getSchema(makeFieldSchema("a", DataType.BYTE),
makeFieldSchema("b", DataType.BYTEARRAY),
makeFieldSchema("c", DataType.CHARARRAY));
Tuple fakeTuple = makeTuple(Byte.valueOf("1"), new DataByteArray("foo".getBytes()), "bar");
sty = getSty(withMockResult(withMockSchema(getServer(), fakeSchema), fakeTuple));
runWithoutOutput(() -> sty.execute(query));
Assert.assertFalse(query.failed());
List<TypedObject> columnOne = query.getResult().getColumn("a").getValues();
List<TypedObject> columnTwo = query.getResult().getColumn("b").getValues();
List<TypedObject> columnThree = query.getResult().getColumn("c").getValues();
Assert.assertNotNull(columnOne);
Assert.assertEquals(columnOne.size(), 1);
Assert.assertEquals(columnOne.get(0).data, "1");
Assert.assertNotNull(columnTwo);
Assert.assertEquals(columnTwo.size(), 1);
Assert.assertEquals(columnTwo.get(0).data, "foo");
Assert.assertNotNull(columnThree);
Assert.assertEquals(columnThree.size(), 1);
Assert.assertEquals(columnThree.get(0).data, "bar");
}
示例6: buildElNinoInputSchema
import org.apache.pig.data.DataType; //导入依赖的package包/类
private Schema buildElNinoInputSchema() throws FrontendException {
// Build Field Schema
List<FieldSchema> fieldSchemas = new ArrayList<FieldSchema>();
fieldSchemas.add(new Schema.FieldSchema("buoy_day_ID", DataType.CHARARRAY));
fieldSchemas.add(new Schema.FieldSchema("buoy" , DataType.CHARARRAY));
fieldSchemas.add(new Schema.FieldSchema("day" , DataType.CHARARRAY));
fieldSchemas.add(new Schema.FieldSchema("latitude" , DataType.DOUBLE ));
fieldSchemas.add(new Schema.FieldSchema("longitude" , DataType.DOUBLE ));
fieldSchemas.add(new Schema.FieldSchema("zon_winds" , DataType.DOUBLE ));
fieldSchemas.add(new Schema.FieldSchema("mer_winds" , DataType.DOUBLE ));
fieldSchemas.add(new Schema.FieldSchema("humidity" , DataType.DOUBLE ));
fieldSchemas.add(new Schema.FieldSchema("airtemp" , DataType.DOUBLE ));
fieldSchemas.add(new Schema.FieldSchema("s_s_temp" , DataType.DOUBLE ));
return new Schema(fieldSchemas);
}
示例7: buildAuditInputSchema
import org.apache.pig.data.DataType; //导入依赖的package包/类
private Schema buildAuditInputSchema() throws FrontendException {
// Build Field Schema
List<FieldSchema> fieldSchemas = new ArrayList<FieldSchema>();
fieldSchemas.add(new Schema.FieldSchema("id" , DataType.LONG));
fieldSchemas.add(new Schema.FieldSchema("age" , DataType.INTEGER));
fieldSchemas.add(new Schema.FieldSchema("employment" , DataType.CHARARRAY));
fieldSchemas.add(new Schema.FieldSchema("education" , DataType.CHARARRAY));
fieldSchemas.add(new Schema.FieldSchema("marital" , DataType.CHARARRAY));
fieldSchemas.add(new Schema.FieldSchema("occupation" , DataType.CHARARRAY));
fieldSchemas.add(new Schema.FieldSchema("income" , DataType.DOUBLE));
fieldSchemas.add(new Schema.FieldSchema("gender" , DataType.CHARARRAY));
fieldSchemas.add(new Schema.FieldSchema("deductions" , DataType.DOUBLE));
fieldSchemas.add(new Schema.FieldSchema("hours" , DataType.INTEGER));
fieldSchemas.add(new Schema.FieldSchema("ignore_accounts", DataType.CHARARRAY));
fieldSchemas.add(new Schema.FieldSchema("risk_adjustment", DataType.INTEGER));
fieldSchemas.add(new Schema.FieldSchema("target_adjusted", DataType.INTEGER));
return new Schema(fieldSchemas);
}
示例8: testOutputSchema
import org.apache.pig.data.DataType; //导入依赖的package包/类
@Test
public void testOutputSchema() throws Exception {
// given
EmptyBagToNull udf = new EmptyBagToNull();
Schema irrelevantSchema = null;
// execute
Schema resultSchema = udf.outputSchema(irrelevantSchema);
// assert
assertNotNull(resultSchema);
assertEquals(1, resultSchema.getFields().size());
assertEquals(DataType.BAG, resultSchema.getField(0).type);
assertEquals(1, resultSchema.getField(0).schema.getFields().size());
assertEquals(DataType.TUPLE, resultSchema.getField(0).schema.getField(0).type);
assertEquals(1, resultSchema.getField(0).schema.getField(0).schema.getFields().size());
assertEquals(DataType.CHARARRAY, resultSchema.getField(0).schema.getField(0).schema.getField(0).type);
}
示例9: testOutputSchema
import org.apache.pig.data.DataType; //导入依赖的package包/类
@Test
public void testOutputSchema() throws Exception {
// given
StringBagsDifference udf = new StringBagsDifference();
Schema irrelevantSchema = null;
// execute
Schema resultSchema = udf.outputSchema(irrelevantSchema);
// assert
assertNotNull(resultSchema);
assertEquals(1, resultSchema.getFields().size());
assertEquals(DataType.BAG, resultSchema.getField(0).type);
assertEquals(1, resultSchema.getField(0).schema.getFields().size());
assertEquals(DataType.TUPLE, resultSchema.getField(0).schema.getField(0).type);
assertEquals(1, resultSchema.getField(0).schema.getField(0).schema.getFields().size());
assertEquals(DataType.CHARARRAY, resultSchema.getField(0).schema.getField(0).schema.getField(0).type);
}
示例10: testExecSingleIdField
import org.apache.pig.data.DataType; //导入依赖的package包/类
@Test
public void testExecSingleIdField() throws Exception {
// given
TupleFactory tupleFactory = TupleFactory.getInstance();
Schema schema = new Schema();
schema.add(new FieldSchema(null, DataType.CHARARRAY));
schema.add(new FieldSchema(null, DataType.CHARARRAY));
schema.add(new FieldSchema("id", DataType.CHARARRAY));
idReplacer.setInputSchema(schema);
String idFieldName = "id";
String newId = "updatedId";
String oldId = "oldId";
// execute
Tuple result = idReplacer.exec(tupleFactory.newTuple(Lists.newArrayList(
idFieldName, newId, oldId)));
assertNotNull(result);
assertEquals(1, result.getAll().size());
assertEquals(newId, result.get(0));
}
示例11: testOutputSchema
import org.apache.pig.data.DataType; //导入依赖的package包/类
@Test
public void testOutputSchema() throws Exception {
// given
Schema schema = new Schema();
schema.add(new FieldSchema(null, DataType.CHARARRAY));
schema.add(new FieldSchema(null, DataType.CHARARRAY));
FieldSchema idFieldSchema = new FieldSchema("id", DataType.CHARARRAY);
schema.add(idFieldSchema);
FieldSchema dedupFieldSchema = new FieldSchema("dedup", DataType.BOOLEAN);
schema.add(dedupFieldSchema);
// execute
Schema resultSchema = idReplacer.outputSchema(schema);
// assert
assertNotNull(resultSchema);
assertEquals(1, resultSchema.getFields().size());
assertEquals(idFieldSchema, resultSchema.getField(0).schema.getField(0));
assertEquals(dedupFieldSchema, resultSchema.getField(0).schema.getField(1));
}
示例12: testOutputSchema
import org.apache.pig.data.DataType; //导入依赖的package包/类
@Test
public void testOutputSchema() throws Exception {
// given
StringBagsMerger udf = new StringBagsMerger();
Schema irrelevantSchema = null;
// execute
Schema resultSchema = udf.outputSchema(irrelevantSchema);
// assert
assertNotNull(resultSchema);
assertEquals(1, resultSchema.getFields().size());
assertEquals(DataType.BAG, resultSchema.getField(0).type);
assertEquals(1, resultSchema.getField(0).schema.getFields().size());
assertEquals(DataType.TUPLE, resultSchema.getField(0).schema.getField(0).type);
assertEquals(1, resultSchema.getField(0).schema.getField(0).schema.getFields().size());
assertEquals(DataType.CHARARRAY, resultSchema.getField(0).schema.getField(0).schema.getField(0).type);
}
示例13: testOutputSchema
import org.apache.pig.data.DataType; //导入依赖的package包/类
@Test
public void testOutputSchema() throws Exception {
// given
Schema irrelevantSchema = null;
// execute
Schema resultSchema = udf.outputSchema(irrelevantSchema);
// assert
assertNotNull(resultSchema);
assertEquals(1, resultSchema.getFields().size());
assertEquals(DataType.BAG, resultSchema.getField(0).type);
assertEquals(DataType.TUPLE, resultSchema.getField(0).schema.getField(0).type);
assertEquals(DataType.INTEGER, resultSchema.getField(0).schema.getField(0).schema.getField(0).type);
assertEquals(DataType.CHARARRAY, resultSchema.getField(0).schema.getField(0).schema.getField(1).type);
}
示例14: testOutputSchema
import org.apache.pig.data.DataType; //导入依赖的package包/类
@Test
public void testOutputSchema() throws Exception {
// given
NullToEmptyBag udf = new NullToEmptyBag();
Schema irrelevantSchema = null;
// execute
Schema resultSchema = udf.outputSchema(irrelevantSchema);
// assert
assertNotNull(resultSchema);
assertEquals(1, resultSchema.getFields().size());
assertEquals(DataType.BAG, resultSchema.getField(0).type);
assertEquals(1, resultSchema.getField(0).schema.getFields().size());
assertEquals(DataType.TUPLE, resultSchema.getField(0).schema.getField(0).type);
assertEquals(1, resultSchema.getField(0).schema.getField(0).schema.getFields().size());
assertEquals(DataType.CHARARRAY, resultSchema.getField(0).schema.getField(0).schema.getField(0).type);
}
示例15: updateUnion
import org.apache.pig.data.DataType; //导入依赖的package包/类
static void updateUnion(final DataBag bag, final Union union) throws ExecException {
// Bag is not empty. process each innerTuple in the bag
for (final Tuple innerTuple : bag) {
final Object f0 = innerTuple.get(0); // consider only field 0
if (f0 == null) {
continue;
}
final byte type = innerTuple.getType(0);
if (type == DataType.BYTEARRAY) {
final DataByteArray dba = (DataByteArray) f0;
union.update(HllSketch.wrap(Memory.wrap(dba.get())));
} else {
throw new IllegalArgumentException("Field type was not DataType.BYTEARRAY: " + type);
}
}
}