本文整理汇总了Java中org.apache.spark.sql.api.java.UDF1类的典型用法代码示例。如果您正苦于以下问题:Java UDF1类的具体用法?Java UDF1怎么用?Java UDF1使用的例子?那么恭喜您, 这里精选的类代码示例或许可以为您提供帮助。
UDF1类属于org.apache.spark.sql.api.java包,在下文中一共展示了UDF1类的1个代码示例,这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞,您的评价将有助于系统推荐出更棒的Java代码示例。
示例1: start
import org.apache.spark.sql.api.java.UDF1; //导入依赖的package包/类
private void start() {
SparkSession spark = SparkSession.builder().appName("CSV to Dataset").master("local").getOrCreate();
//registers a new internal UDF
spark.udf().register("x2Multiplier", new UDF1<Integer, Integer>() {
private static final long serialVersionUID = -5372447039252716846L;
@Override
public Integer call(Integer x) {
return x * 2;
}
}, DataTypes.IntegerType);
String filename = "data/tuple-data-file.csv";
Dataset<Row> df = spark.read().format("csv").option("inferSchema", "true")
.option("header", "false").load(filename);
df = df.withColumn("label", df.col("_c0")).drop("_c0");
df = df.withColumn("value", df.col("_c1")).drop("_c1");
df = df.withColumn("x2", callUDF("x2Multiplier", df.col("value").cast(DataTypes.IntegerType)));
df.show();
}