当前位置: 首页>>代码示例>>Python>>正文


Python CSSSelector.getiterator方法代码示例

本文整理汇总了Python中lxml.cssselect.CSSSelector.getiterator方法的典型用法代码示例。如果您正苦于以下问题:Python CSSSelector.getiterator方法的具体用法?Python CSSSelector.getiterator怎么用?Python CSSSelector.getiterator使用的例子?那么恭喜您, 这里精选的方法代码示例或许可以为您提供帮助。您也可以进一步了解该方法所在lxml.cssselect.CSSSelector的用法示例。


在下文中一共展示了CSSSelector.getiterator方法的1个代码示例,这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞,您的评价将有助于系统推荐出更棒的Python代码示例。

示例1: unicode

# 需要导入模块: from lxml.cssselect import CSSSelector [as 别名]
# 或者: from lxml.cssselect.CSSSelector import getiterator [as 别名]
while True:
    req = urllib2.Request(url)
    req.add_header("User-Agent", useragent)
    if lasturl:
        req.add_header("Referer", lasturl)
    html = unicode(urllib2.urlopen(req).read(), errors="ignore")
    doc = etree.HTML(html)
    rtr = CSSSelector("ol#rtr")(doc)
    if rtr:
        numresults = len(rtr[0].getchildren())
    else:
        numresults = 0
    print "hit " + url + " got " + str(numresults) + " results"
    rhscol = CSSSelector("div#rhscol")(doc)[0]
    links = [a for a in rhscol.getiterator("a")]
    if len(links) != 3 or "Older" not in links[1].text or "Newer" not in links[2].text:
        print "Cant find older and newer links here, backing up"
        oldurl = page.url
        match = re.search("mbl_hs:(\d+),mbl_he:(\d+),mbl_rs:(\d+),mbl_re:(\d+)", oldurl)
        mbl_hs = int(match.group(1)) + 600
        mbl_he = int(match.group(2)) + 600
        mbl_rs = int(match.group(3)) + 600
        mbl_re = int(match.group(4)) + 600
        url = oldurl.replace(
            match.group(0),
            "mbl_hs:" + str(mbl_hs) + ",mbl_he:" + str(mbl_he) + ",mbl_rs:" + str(mbl_rs) + ",mbl_re:" + str(mbl_re),
        )
        lasturl = oldurl
        time.sleep(10)
        continue
开发者ID:sp00,项目名称:google-pastime,代码行数:32,代码来源:run.py


注:本文中的lxml.cssselect.CSSSelector.getiterator方法示例由纯净天空整理自Github/MSDocs等开源代码及文档管理平台,相关代码片段筛选自各路编程大神贡献的开源项目,源码版权归原作者所有,传播和使用请参考对应项目的License;未经允许,请勿转载。