当前位置: 首页>>代码示例>>Java>>正文


Java AvroParquetInputFormat类代码示例

本文整理汇总了Java中org.apache.parquet.avro.AvroParquetInputFormat的典型用法代码示例。如果您正苦于以下问题:Java AvroParquetInputFormat类的具体用法?Java AvroParquetInputFormat怎么用?Java AvroParquetInputFormat使用的例子?那么恭喜您, 这里精选的类代码示例或许可以为您提供帮助。


AvroParquetInputFormat类属于org.apache.parquet.avro包,在下文中一共展示了AvroParquetInputFormat类的2个代码示例,这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞,您的评价将有助于系统推荐出更棒的Java代码示例。

示例1: ParquetHdfsFileSource

import org.apache.parquet.avro.AvroParquetInputFormat; //导入依赖的package包/类
private ParquetHdfsFileSource(UgiDoAs doAs, String filepattern, LazyAvroCoder<IndexedRecord> lac,
        ExtraHadoopConfiguration extraConfig, SerializableSplit serializableSplit) {
    super(doAs, filepattern, (Class) AvroParquetInputFormat.class, Void.class, IndexedRecord.class, extraConfig,
            serializableSplit);
    this.lac = lac;
    setDefaultCoder(VoidCoder.of(), (LazyAvroCoder) lac);
}
 
开发者ID:Talend,项目名称:components,代码行数:8,代码来源:ParquetHdfsFileSource.java

示例2: getADAMReads

import org.apache.parquet.avro.AvroParquetInputFormat; //导入依赖的package包/类
/**
 * Loads ADAM reads stored as Parquet.
 * @param inputPath path to the Parquet data
 * @return RDD of (ADAM-backed) GATKReads from the file.
 */
public JavaRDD<GATKRead> getADAMReads(final String inputPath, final TraversalParameters traversalParameters, final SAMFileHeader header) throws IOException {
    Job job = Job.getInstance(ctx.hadoopConfiguration());
    AvroParquetInputFormat.setAvroReadSchema(job, AlignmentRecord.getClassSchema());
    Broadcast<SAMFileHeader> bHeader;
    if (header == null) {
        bHeader= ctx.broadcast(null);
    } else {
        bHeader = ctx.broadcast(header);
    }
    @SuppressWarnings("unchecked")
    JavaRDD<AlignmentRecord> recordsRdd = ctx.newAPIHadoopFile(
            inputPath, AvroParquetInputFormat.class, Void.class, AlignmentRecord.class, job.getConfiguration())
            .values();
    JavaRDD<GATKRead> readsRdd = recordsRdd.map(record -> new BDGAlignmentRecordToGATKReadAdapter(record, bHeader.getValue()));
    JavaRDD<GATKRead> filteredRdd = readsRdd.filter(record -> samRecordOverlaps(record.convertToSAMRecord(header), traversalParameters));
    return putPairsInSamePartition(header, filteredRdd);
}
 
开发者ID:broadinstitute,项目名称:gatk,代码行数:23,代码来源:ReadsSparkSource.java


注:本文中的org.apache.parquet.avro.AvroParquetInputFormat类示例由纯净天空整理自Github/MSDocs等开源代码及文档管理平台,相关代码片段筛选自各路编程大神贡献的开源项目,源码版权归原作者所有,传播和使用请参考对应项目的License;未经允许,请勿转载。