当前位置: 首页>>代码示例>>Python>>正文


Python Page.from_web_page方法代码示例

本文整理汇总了Python中page.Page.from_web_page方法的典型用法代码示例。如果您正苦于以下问题:Python Page.from_web_page方法的具体用法?Python Page.from_web_page怎么用?Python Page.from_web_page使用的例子?那么恭喜您, 这里精选的方法代码示例或许可以为您提供帮助。您也可以进一步了解该方法所在page.Page的用法示例。


在下文中一共展示了Page.from_web_page方法的2个代码示例,这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞,您的评价将有助于系统推荐出更棒的Python代码示例。

示例1: get_source_if_matches

# 需要导入模块: from page import Page [as 别名]
# 或者: from page.Page import from_web_page [as 别名]
def get_source_if_matches(source_url, source, state, conditions=[(1, 0, 0)], fresh=False):
    """
        Get a source and save it if there are matches.

        min_candidates, min_constituencies, min_parties
    """
    
    result = {
        'url': source_url,
        'source': source,
        'state': state
    }

    # First, get the parsed page object 
    page = Page.get_url(source_url)

    if page is not None:
        print "Page already exists."

        if not fresh:
            result['skip'] = {
                'text': 'Page already exists.'
            }

    else:
        print "Page doesn't exist"

        web_page = WebPage(source_url)

        try:
            web_page.fetch()
        except WebPage.FailedToFetch, e:
            result['error'] = {
                'type': 'WebPage.FailedToFetch',
                'text': str(e),
            }

        if web_page.is_local:
            result['skip'] = {
                'text': 'Already in cache',
            }
        else:
            try:
                page = Page.from_web_page(web_page, source)
                page.save()
            except Page.FetchError, e:
                print "FAILED", e
                result['error'] = {
                    'type': 'Page.FetchError',
                    'text': str(e),
                }
开发者ID:tfgg,项目名称:ppsay,代码行数:53,代码来源:sources.py

示例2: get_source

# 需要导入模块: from page import Page [as 别名]
# 或者: from page.Page import from_web_page [as 别名]
        print >>sys.stderr, datetime.now(), result

    return result


def get_source(source_url, source, state):
    """
        Get a source and save it, no matter what.
    """
    
    web_page = WebPage(source_url)

    try:
        web_page.fetch()
    except WebPage.FailedToFetch, e:
        print "FAILED", e
        return None

    page = Page.from_web_page(web_page, source)
    page.save()

    new, article = get_or_create_doc([page])

    article.process() 

    article.state = state
    article.save()

    return article

开发者ID:tfgg,项目名称:ppsay,代码行数:31,代码来源:sources.py


注:本文中的page.Page.from_web_page方法示例由纯净天空整理自Github/MSDocs等开源代码及文档管理平台,相关代码片段筛选自各路编程大神贡献的开源项目,源码版权归原作者所有,传播和使用请参考对应项目的License;未经允许,请勿转载。