本文整理汇总了Python中pyspark.sql.SQLContext.select方法的典型用法代码示例。如果您正苦于以下问题:Python SQLContext.select方法的具体用法?Python SQLContext.select怎么用?Python SQLContext.select使用的例子?那么恭喜您, 这里精选的方法代码示例或许可以为您提供帮助。您也可以进一步了解该方法所在类pyspark.sql.SQLContext
的用法示例。
在下文中一共展示了SQLContext.select方法的1个代码示例,这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞,您的评价将有助于系统推荐出更棒的Python代码示例。
示例1: get_telemetry_crashes
# 需要导入模块: from pyspark.sql import SQLContext [as 别名]
# 或者: from pyspark.sql.SQLContext import select [as 别名]
def get_telemetry_crashes(sc, versions, days, product='Firefox'):
days = utils.get_days(days)
dataset = SQLContext(sc).read.load(['s3://telemetry-parquet/socorro_crash/v2/crash_date=' + day.strftime('%Y%m%d') for day in days], 'parquet')
if product != 'FennecAndroid':
dataset = dataset.select([c for c in dataset.columns if c not in [
'android_board', 'android_brand', 'android_cpu_abi', 'android_cpu_abi2',
'android_device', 'android_hardware', 'android_manufacturer',
'android_model', 'android_version',
]])
return dataset.filter((dataset['product'] == product) & (dataset['version'].isin(versions)))