当前位置: 首页>>代码示例>>Python>>正文


Python Scraper.match方法代码示例

本文整理汇总了Python中scraper.Scraper.match方法的典型用法代码示例。如果您正苦于以下问题:Python Scraper.match方法的具体用法?Python Scraper.match怎么用?Python Scraper.match使用的例子?那么恭喜您, 这里精选的方法代码示例或许可以为您提供帮助。您也可以进一步了解该方法所在scraper.Scraper的用法示例。


在下文中一共展示了Scraper.match方法的3个代码示例,这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞,您的评价将有助于系统推荐出更棒的Python代码示例。

示例1: testMatchAndExtract

# 需要导入模块: from scraper import Scraper [as 别名]
# 或者: from scraper.Scraper import match [as 别名]
    def testMatchAndExtract(self):
        pattern = "<a name='$name'></a>"
        _scraper = Scraper(pattern)        
        
        # same tag
        actual = BeautifulSoup("<a name='abc'></a>")
        ret = _scraper.match(actual)
        self.assertEqual(1, len(ret))

        ret = _scraper.extract(ret[0])
        
        self.assertEqual(1, len(ret))
        self.assertEqual('abc', ret['name'])
        
        
        pattern = "<a name='$name'>*</a>"
        _scraper = Scraper(pattern)        
        
        # same tag
        actual = BeautifulSoup("<a name='abc'><b></b></a>")
        ret = _scraper.match(actual)
        self.assertEqual(1, len(ret))

        ret = _scraper.extract(ret[0])
        
        self.assertEqual(1, len(ret))
        self.assertEqual('abc', ret['name'])
开发者ID:Zacchy,项目名称:nickcheng-python,代码行数:29,代码来源:scraper_test.py

示例2: scrapestruct

# 需要导入模块: from scraper import Scraper [as 别名]
# 或者: from scraper.Scraper import match [as 别名]
    def scrapestruct(self, context ):
	pc = context['pc']
	rowscrape = pc['dom_row_pattern']
	blockstr  = context['blockstr']
	soupdoc   = CustomizedSoup( blockstr )
	scraper   = Scraper( rowscrape )
	results   = scraper.match( soupdoc )
	if( len(results) == 0 ): #TBD scraper need to be imporved
	    raise Exception("0 ITEMS SCRAPED WARNING")
	count = min(len(results), 10 )
	items     = results[0:count]
	eitems    = map( lambda i:scraper.extract(i), items)
	context['items'] = eitems
开发者ID:AugustLONG,项目名称:bbsparse,代码行数:15,代码来源:bbsparser.py

示例3: testMatch

# 需要导入模块: from scraper import Scraper [as 别名]
# 或者: from scraper.Scraper import match [as 别名]
 def testMatch(self):
     pattern = "<a><b></b></a>"
     _scraper = Scraper(pattern)
     
     # one match
     actual = BeautifulSoup("<a><b></b></a>")
     self.assertEqual(1, len(_scraper.match(actual)))
     
     # one match
     actual = BeautifulSoup("<div><a><b></b></a></div>")
     self.assertEqual(1, len(_scraper.match(actual)))
     
     # one match
     actual = BeautifulSoup("<a><a><b></b></a></a>")
     self.assertEqual(1, len(_scraper.match(actual)))        
     
     # two match
     actual = BeautifulSoup("<a><b></b></a><a><b></b></a>")
     self.assertEqual(2, len(_scraper.match(actual)))
     
     # two match
     actual = BeautifulSoup("<a><b></b></a><c><a><b></b></a></c>")
     self.assertEqual(2, len(_scraper.match(actual)))
开发者ID:Zacchy,项目名称:nickcheng-python,代码行数:25,代码来源:scraper_test.py


注:本文中的scraper.Scraper.match方法示例由纯净天空整理自Github/MSDocs等开源代码及文档管理平台,相关代码片段筛选自各路编程大神贡献的开源项目,源码版权归原作者所有,传播和使用请参考对应项目的License;未经允许,请勿转载。