本文整理汇总了Python中calibre.ebooks.conversion.utils.HeuristicProcessor.cleanup_markup方法的典型用法代码示例。如果您正苦于以下问题:Python HeuristicProcessor.cleanup_markup方法的具体用法?Python HeuristicProcessor.cleanup_markup怎么用?Python HeuristicProcessor.cleanup_markup使用的例子?那么, 这里精选的方法代码示例或许可以为您提供帮助。您也可以进一步了解该方法所在类calibre.ebooks.conversion.utils.HeuristicProcessor
的用法示例。
在下文中一共展示了HeuristicProcessor.cleanup_markup方法的1个代码示例,这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞,您的评价将有助于系统推荐出更棒的Python代码示例。
示例1: clean_markup
# 需要导入模块: from calibre.ebooks.conversion.utils import HeuristicProcessor [as 别名]
# 或者: from calibre.ebooks.conversion.utils.HeuristicProcessor import cleanup_markup [as 别名]
def clean_markup(self):
preprocessor = HeuristicProcessor(log = self.log)
for name in self.get_html_names():
html = self.get_raw(name)
html = html.encode("UTF-8")
html = string.replace(html, u"\u2014", ' -- ')
html = string.replace(html, u"\u2013", ' --- ')
html = string.replace(html, u"\x97", ' --- ')
html = preprocessor.cleanup_markup(html)
# Remove Unicode replacement characters
html = string.replace(html, u"\uFFFD", "")
self.set(name, html)