本文简要介绍
pyspark.pandas.extensions.register_series_accessor 的用法。用法:
pyspark.pandas.extensions.register_series_accessor(name: str) → Callable[[Type[T]], Type[T]]使用 Series 对象注册自定义访问器
- name:str
注册后调用访问者时使用的名称
- 可调用的
类装饰器。
参数:
返回:
注意:
访问时,您的访问器将使用用户正在与之交互的pandas-on-Spark 对象进行初始化。代码签名必须是:
def __init__(self, pandas_on_spark_obj): # constructor logic ...在 pandas API 中,如果传递给您的访问器的数据具有不正确的 dtype,建议提高
AttributeError以保持一致性。在pandas-on-Spark 中,ValueError更常用于在给定方法/函数的值的数据类型意外时进行注释。最终,您可以随意构建它,但 pandas-on-Spark 可能会执行以下操作:
>>> ps.Series(['a', 'b']).dt ... Traceback (most recent call last): ... ValueError: Cannot call DatetimeMethods on type StringType例子:
在您的库代码中:
from pyspark.pandas.extensions import register_series_accessor @register_series_accessor("geo") class GeoAccessor: def __init__(self, pandas_on_spark_obj): self._obj = pandas_on_spark_obj @property def is_valid(self): # boolean check to see if series contains valid geometry return True然后,在 ipython 会话中:
>>> ## Import if the accessor is in the other file. >>> # from my_ext_lib import GeoAccessor >>> psdf = ps.DataFrame({"longitude": np.linspace(0,10), ... "latitude": np.linspace(0, 20)}) >>> psdf.longitude.geo.is_valid True
相关用法
- Python pyspark register_index_accessor用法及代码示例
- Python pyspark register_dataframe_accessor用法及代码示例
- Python pyspark regexp_extract用法及代码示例
- Python pyspark regexp_replace用法及代码示例
- Python pyspark read_json用法及代码示例
- Python pyspark reverse用法及代码示例
- Python pyspark read_parquet用法及代码示例
- Python pyspark read_spark_io用法及代码示例
- Python pyspark read_delta用法及代码示例
- Python pyspark read_orc用法及代码示例
- Python pyspark read_table用法及代码示例
- Python pyspark read_sql_query用法及代码示例
- Python pyspark repeat用法及代码示例
- Python pyspark read_excel用法及代码示例
- Python pyspark read_csv用法及代码示例
- Python pyspark read_sql_table用法及代码示例
- Python pyspark read_sql用法及代码示例
- Python pyspark read_html用法及代码示例
- Python pyspark range用法及代码示例
- Python pyspark rand用法及代码示例
- Python pyspark rpad用法及代码示例
- Python pyspark round用法及代码示例
- Python pyspark randn用法及代码示例
- Python pyspark create_map用法及代码示例
- Python pyspark date_add用法及代码示例
注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.extensions.register_series_accessor。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。
