当前位置: 首页>>代码示例>>Python>>正文


Python HTML.findall方法代码示例

本文整理汇总了Python中lxml.etree.HTML.findall方法的典型用法代码示例。如果您正苦于以下问题:Python HTML.findall方法的具体用法?Python HTML.findall怎么用?Python HTML.findall使用的例子?那么恭喜您, 这里精选的方法代码示例或许可以为您提供帮助。您也可以进一步了解该方法所在lxml.etree.HTML的用法示例。


在下文中一共展示了HTML.findall方法的1个代码示例,这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞,您的评价将有助于系统推荐出更棒的Python代码示例。

示例1: scrape_logos

# 需要导入模块: from lxml.etree import HTML [as 别名]
# 或者: from lxml.etree.HTML import findall [as 别名]
def scrape_logos():
    local("mkdir -p data/logos")

    base_uri = "http://www.sportslogos.net/league.php?id={0}"
    for url in [base_uri.format(page_id) for page_id in xrange(30, 36)]:
        resp = requests.get(url)

        if not resp.ok:
            print "Error retrieving {0}".format(url)
            continue

        tree = HTML(resp.content)

        for thumb in tree.findall(".//div[@class='thumbHolder']"):
            link = thumb.find("a")
            logo = link.find("img")

            title = link.attrib["title"].lower().replace("Logos", "")
            title = title.replace(" ", "_").strip()
            filename = "data/logos/{0}.gif".format(title)

            urllib.urlretrieve(logo.attrib["src"], filename)
开发者ID:ckwang8128,项目名称:circle-of-parity,代码行数:24,代码来源:fabfile.py


注:本文中的lxml.etree.HTML.findall方法示例由纯净天空整理自Github/MSDocs等开源代码及文档管理平台,相关代码片段筛选自各路编程大神贡献的开源项目,源码版权归原作者所有,传播和使用请参考对应项目的License;未经允许,请勿转载。