Java PageRankData类代码示例

本文整理汇总了Java中org.apache.flink.examples.java.graph.util.PageRankData类的典型用法代码示例。如果您正苦于以下问题：Java PageRankData类的具体用法？Java PageRankData怎么用？Java PageRankData使用的例子？那么, 这里精选的类代码示例或许可以为您提供帮助。

PageRankData类属于org.apache.flink.examples.java.graph.util包，在下文中一共展示了PageRankData类的6个代码示例，这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞，您的评价将有助于系统推荐出更棒的Java代码示例。

示例1: getPagesDataSet

import org.apache.flink.examples.java.graph.util.PageRankData; //导入依赖的package包/类
private static DataSet<Long> getPagesDataSet(ExecutionEnvironment env, ParameterTool params) {
	if (params.has("pages")) {
		return env.readCsvFile(params.get("pages"))
			.fieldDelimiter(" ")
			.lineDelimiter("\n")
			.types(Long.class)
			.map(new MapFunction<Tuple1<Long>, Long>() {
				@Override
				public Long map(Tuple1<Long> v) {
					return v.f0;
				}
			});
	} else {
		System.out.println("Executing PageRank example with default pages data set.");
		System.out.println("Use --pages to specify file input.");
		return PageRankData.getDefaultPagesDataSet(env);
	}
}

开发者ID:axbaretto，项目名称:flink，代码行数:19，代码来源:PageRank.java

示例2: parseParameters

import org.apache.flink.examples.java.graph.util.PageRankData; //导入依赖的package包/类
private static boolean parseParameters(String[] args) {
	
	if(args.length > 0) {
		if(args.length == 5) {
			fileOutput = true;
			pagesInputPath = args[0];
			linksInputPath = args[1];
			outputPath = args[2];
			numPages = Integer.parseInt(args[3]);
			maxIterations = Integer.parseInt(args[4]);
		} else {
			System.err.println("Usage: PageRankBasic <pages path> <links path> <output path> <num pages> <num iterations>");
			return false;
		}
	} else {
		System.out.println("Executing PageRank Basic example with default parameters and built-in default data.");
		System.out.println("  Provide parameters to read input data from files.");
		System.out.println("  See the documentation for the correct format of input files.");
		System.out.println("  Usage: PageRankBasic <pages path> <links path> <output path> <num pages> <num iterations>");
		
		numPages = PageRankData.getNumberOfPages();
	}
	return true;
}

开发者ID:citlab，项目名称:vs.msc.ws14，代码行数:25，代码来源:PageRankBasic.java

示例3: getLinksDataSet

import org.apache.flink.examples.java.graph.util.PageRankData; //导入依赖的package包/类
private static DataSet<Tuple2<Long, Long>> getLinksDataSet(ExecutionEnvironment env, ParameterTool params) {
	if (params.has("links")) {
		return env.readCsvFile(params.get("links"))
			.fieldDelimiter(" ")
			.lineDelimiter("\n")
			.types(Long.class, Long.class);
	} else {
		System.out.println("Executing PageRank example with default links data set.");
		System.out.println("Use --links to specify file input.");
		return PageRankData.getDefaultEdgeDataSet(env);
	}
}

开发者ID:axbaretto，项目名称:flink，代码行数:13，代码来源:PageRank.java

示例4: getPagesDataSet

import org.apache.flink.examples.java.graph.util.PageRankData; //导入依赖的package包/类
private static DataSet<Long> getPagesDataSet(ExecutionEnvironment env) {
	if(fileOutput) {
		return env
					.readCsvFile(pagesInputPath)
						.fieldDelimiter(' ')
						.lineDelimiter("\n")
						.types(Long.class)
					.map(new MapFunction<Tuple1<Long>, Long>() {
						@Override
						public Long map(Tuple1<Long> v) { return v.f0; }
					});
	} else {
		return PageRankData.getDefaultPagesDataSet(env);
	}
}

开发者ID:citlab，项目名称:vs.msc.ws14，代码行数:16，代码来源:PageRankBasic.java

示例5: getLinksDataSet

import org.apache.flink.examples.java.graph.util.PageRankData; //导入依赖的package包/类
private static DataSet<Tuple2<Long, Long>> getLinksDataSet(ExecutionEnvironment env) {
	if(fileOutput) {
		return env.readCsvFile(linksInputPath)
					.fieldDelimiter(' ')
					.lineDelimiter("\n")
					.types(Long.class, Long.class);
	} else {
		return PageRankData.getDefaultEdgeDataSet(env);
	}
}

开发者ID:citlab，项目名称:vs.msc.ws14，代码行数:11，代码来源:PageRankBasic.java

示例6: main

import org.apache.flink.examples.java.graph.util.PageRankData; //导入依赖的package包/类
public static void main(String[] args) throws Exception {

		ParameterTool params = ParameterTool.fromArgs(args);

		final int numPages = params.getInt("numPages", PageRankData.getNumberOfPages());
		final int maxIterations = params.getInt("iterations", 10);

		// set up execution environment
		final ExecutionEnvironment env = ExecutionEnvironment.getExecutionEnvironment();

		// make the parameters available to the web ui
		env.getConfig().setGlobalJobParameters(params);

		// get input data
		DataSet<Long> pagesInput = getPagesDataSet(env, params);
		DataSet<Tuple2<Long, Long>> linksInput = getLinksDataSet(env, params);

		// assign initial rank to pages
		DataSet<Tuple2<Long, Double>> pagesWithRanks = pagesInput.
				map(new RankAssigner((1.0d / numPages)));

		// build adjacency list from link input
		DataSet<Tuple2<Long, Long[]>> adjacencyListInput =
				linksInput.groupBy(0).reduceGroup(new BuildOutgoingEdgeList());

		// set iterative data set
		IterativeDataSet<Tuple2<Long, Double>> iteration = pagesWithRanks.iterate(maxIterations);

		DataSet<Tuple2<Long, Double>> newRanks = iteration
				// join pages with outgoing edges and distribute rank
				.join(adjacencyListInput).where(0).equalTo(0).flatMap(new JoinVertexWithEdgesMatch())
				// collect and sum ranks
				.groupBy(0).aggregate(SUM, 1)
				// apply dampening factor
				.map(new Dampener(DAMPENING_FACTOR, numPages));

		DataSet<Tuple2<Long, Double>> finalPageRanks = iteration.closeWith(
				newRanks,
				newRanks.join(iteration).where(0).equalTo(0)
				// termination condition
				.filter(new EpsilonFilter()));

		// emit result
		if (params.has("output")) {
			finalPageRanks.writeAsCsv(params.get("output"), "\n", " ");
			// execute program
			env.execute("Basic Page Rank Example");
		} else {
			System.out.println("Printing result to stdout. Use --output to specify output path.");
			finalPageRanks.print();
		}
	}

开发者ID:axbaretto，项目名称:flink，代码行数:53，代码来源:PageRank.java

注：本文中的org.apache.flink.examples.java.graph.util.PageRankData类示例由纯净天空整理自Github/MSDocs等开源代码及文档管理平台，相关代码片段筛选自各路编程大神贡献的开源项目，源码版权归原作者所有，传播和使用请参考对应项目的License；未经允许，请勿转载。