Scala DataFrameReader类代码示例

本文整理汇总了Scala中org.apache.spark.sql.DataFrameReader类的典型用法代码示例。如果您正苦于以下问题：Scala DataFrameReader类的具体用法？Scala DataFrameReader怎么用？Scala DataFrameReader使用的例子？那么恭喜您, 这里精选的类代码示例或许可以为您提供帮助。

在下文中一共展示了DataFrameReader类的3个代码示例，这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞，您的评价将有助于系统推荐出更棒的Scala代码示例。

示例1: DataFrameReaderConfigurator

//设置package包名称以及导入依赖的类
package ml.sparkling.graph.loaders.csv

import org.apache.spark.sql.DataFrameReader


object DataFrameReaderConfigurator {

  implicit class addAbilityToConfigureDataFrameReader(reader:DataFrameReader){
    def applyConfiguration(cSVLoaderConfig: CsvLoaderConfig):DataFrameReader={
      reader.option("header",cSVLoaderConfig.header.toString)
      reader.option("delimiter",cSVLoaderConfig.delimiter)
      reader.option("quote",cSVLoaderConfig.quote)
     cSVLoaderConfig.schema match{
       case None => reader.option("inferSchema",cSVLoaderConfig.inferSchema.toString)
       case Some(schema) => reader.schema(schema)
      }
      reader
    }
  }

}

开发者ID:sparkling-graph，项目名称:sparkling-graph，代码行数:22，代码来源:DataFrameReaderConfigurator.scala

示例2:

//设置package包名称以及导入依赖的类
package test.yumi.pipeline

import com.typesafe.config.Config
import org.apache.spark.SparkContext
import org.apache.spark.sql.{DataFrameReader, SparkSession}
import org.apache.spark.sql.types.StructType
import org.mockito.invocation.InvocationOnMock
import org.mockito.stubbing.Answer
import yumi.Job
import yumi.metastore.Metastore
import yumi.pipeline._

trait MockSessionSpec extends BaseSpec {

  trait MockSessionScope extends BaseMockScope {

    implicit val yumiContext = mock[YumiContext]
    val pipelineFactory = mock[PipelineFactory]
    val activityLoader = mock[ActivityLoader]
    val contextFactory = mock[YumiContextFactory]
    val sparkSession = mock[SparkSession]
    val sparkContext = mock[SparkContext]
    val dataFrameReader = mock[DataFrameReader]
    val dataFrameWriter = mock[DataFrameWriter]
    val emptyParameters = new Parameters

    when(sparkSession.sparkContext).thenReturn(sparkContext)

    when(yumiContext.sparkSession).thenReturn(sparkSession)
    when(yumiContext.sparkContext).thenReturn(sparkContext)
    when(yumiContext.dataFrameWriter).thenReturn(dataFrameWriter)

    when(sparkSession.read).thenReturn(dataFrameReader)

    when(dataFrameReader.format(any[String])).thenReturn(dataFrameReader)
    when(dataFrameReader.schema(any[StructType])).thenReturn(dataFrameReader)
    when(dataFrameReader.option(any[String], any[String])).thenReturn(dataFrameReader)
    when(dataFrameReader.options(any[Map[String, String]])).thenReturn(dataFrameReader)
  }
}

开发者ID:coderdiaries，项目名称:yumi，代码行数:41，代码来源:MockSessionSpec.scala

示例3: DynamoDBDataFrameReader

//设置package包名称以及导入依赖的类
package com.github.traviscrawford.spark

import org.apache.spark.sql.DataFrame
import org.apache.spark.sql.DataFrameReader

package object dynamodb {

  implicit class DynamoDBDataFrameReader(reader: DataFrameReader) {

    
    def dynamodb(region: String, table: String): DataFrame =
      reader
        .format("com.github.traviscrawford.spark.dynamodb")
        .option("region", region)
        .option("table", table)
        .load
  }
}

开发者ID:traviscrawford，项目名称:spark-dynamodb，代码行数:19，代码来源:package.scala

注：本文中的org.apache.spark.sql.DataFrameReader类示例由纯净天空整理自Github/MSDocs等开源代码及文档管理平台，相关代码片段筛选自各路编程大神贡献的开源项目，源码版权归原作者所有，传播和使用请参考对应项目的License；未经允许，请勿转载。