本文整理汇总了Python中lxml.etree.HTML.findall方法的典型用法代码示例。如果您正苦于以下问题:Python HTML.findall方法的具体用法?Python HTML.findall怎么用?Python HTML.findall使用的例子?那么恭喜您, 这里精选的方法代码示例或许可以为您提供帮助。您也可以进一步了解该方法所在类lxml.etree.HTML
的用法示例。
在下文中一共展示了HTML.findall方法的1个代码示例,这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞,您的评价将有助于系统推荐出更棒的Python代码示例。
示例1: scrape_logos
# 需要导入模块: from lxml.etree import HTML [as 别名]
# 或者: from lxml.etree.HTML import findall [as 别名]
def scrape_logos():
local("mkdir -p data/logos")
base_uri = "http://www.sportslogos.net/league.php?id={0}"
for url in [base_uri.format(page_id) for page_id in xrange(30, 36)]:
resp = requests.get(url)
if not resp.ok:
print "Error retrieving {0}".format(url)
continue
tree = HTML(resp.content)
for thumb in tree.findall(".//div[@class='thumbHolder']"):
link = thumb.find("a")
logo = link.find("img")
title = link.attrib["title"].lower().replace("Logos", "")
title = title.replace(" ", "_").strip()
filename = "data/logos/{0}.gif".format(title)
urllib.urlretrieve(logo.attrib["src"], filename)