當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python clx.dns.dns_extractor.parse_url用法及代碼示例


用法:

clx.dns.dns_extractor.parse_url(url_series, req_cols=None)

此函數提取給定 url 的子域、域和後綴。

參數

  • url_df_col(cudf.Series) - 要處理的 URL。
  • req_cols(set(strings)) - 請求提取的列,例如(域、子域、後綴和主機名)。

返回

提取的請求列的信息。

返回類型

cudf.DataFrame

例子

>>> from cudf import DataFrame
>>> from clx.dns import dns_extractor as dns
>>>
>>> input_df = DataFrame(
...     {
...         "url": [
...             "http://www.google.com",
...             "gmail.com",
...             "github.com",
...             "https://pandas.pydata.org",
...         ]
...     }
... )
>>> dns.parse_url(input_df["url"])
            hostname  domain suffix subdomain
0     www.google.com  google    com       www
1          gmail.com   gmail    com
2         github.com  github    com
3  pandas.pydata.org  pydata    org    pandas
>>> dns.parse_url(input_df["url"], req_cols={'domain', 'suffix'})
   domain suffix
0  google    com
1   gmail    com
2  github    com
3  pydata    org

相關用法


注:本文由純淨天空篩選整理自rapids.ai大神的英文原創作品 clx.dns.dns_extractor.parse_url。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。