本文整理汇总了Python中extractor.Extractor.getContext方法的典型用法代码示例。如果您正苦于以下问题:Python Extractor.getContext方法的具体用法?Python Extractor.getContext怎么用?Python Extractor.getContext使用的例子?那么恭喜您, 这里精选的方法代码示例或许可以为您提供帮助。您也可以进一步了解该方法所在类extractor.Extractor
的用法示例。
在下文中一共展示了Extractor.getContext方法的1个代码示例,这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞,您的评价将有助于系统推荐出更棒的Python代码示例。
示例1: tokenize2
# 需要导入模块: from extractor import Extractor [as 别名]
# 或者: from extractor.Extractor import getContext [as 别名]
def tokenize2(text):
for k in Tokenize(text):
if len(k) > 1:
yield k
def key_rank(text, topk=18):
sents = list(cut_sentence(text))
docs = [list(tokenize2(sent)) for sent in sents]
keyword_rank = textrank.KeywordTextRank(docs)
keyword_rank.solve()
keys = [w for w in keyword_rank.top_index(topk)]
return keys
def sum_rank(text):
sents = list(cut_sentence(text))
docs = [list(tokenize2(sent)) for sent in sents]
sim_res = bm25_weights(docs)
rank = textrank.TextRank(sim_res)
rank.solve()
top_n_summary = []
for index in sorted(rank.top_index(3)):
top_n_summary.append(sents[index])
return u'。 '.join(top_n_summary).replace('\r','').replace('\n','')+u'。'
if __name__ == '__main__':
ext = Extractor(url="http://news.cctv.com/2018/03/14/ARTIae5nIxMetJzk20Gk8Vw7180314.shtml",blockSize=5, image=False)
content = ext.getContext()
print(repr(key_rank(content)).decode('unicode-escape'))
print(sum_rank(content))