本文整理汇总了Python中Crawler.Crawler._normalize_url方法的典型用法代码示例。如果您正苦于以下问题:Python Crawler._normalize_url方法的具体用法?Python Crawler._normalize_url怎么用?Python Crawler._normalize_url使用的例子?那么恭喜您, 这里精选的方法代码示例或许可以为您提供帮助。您也可以进一步了解该方法所在类Crawler.Crawler
的用法示例。
在下文中一共展示了Crawler._normalize_url方法的1个代码示例,这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞,您的评价将有助于系统推荐出更棒的Python代码示例。
示例1: test__nromalize_url
# 需要导入模块: from Crawler import Crawler [as 别名]
# 或者: from Crawler.Crawler import _normalize_url [as 别名]
def test__nromalize_url(self):
test_list = {
"http://www.a.com#abc": "http://www.a.com/",
"http://www.a.com/a/b/c": "http://www.a.com/a/b/c",
# if no scheme is provided, urlsplit treats the domain name as the path
# so we don't expect a trailing "/" after www.a.com
"www.a.com?abc=123#abc": "://www.a.com?abc=123"
}
for test in test_list:
usplit = urlparse.urlsplit(test)
c = Crawler("http://mydomain.com")
self.assertEqual(c._normalize_url(usplit), test_list[test])