当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python Wikipedia用法及代码示例


互联网是最大的信息来源,因此了解如何从各种来源获取数据非常重要。维基百科是互联网上最大、最受欢迎的信息来源之一。

维基百科是一个多语言在线百科全书,作为一个开放协作项目,由志愿者编辑社区使用基于 wiki 的编辑系统创建和维护。
在本文中,我们将了解如何使用 Python 的 Wikipedia 模块从 Wikipedia 网站获取各种信息。

安装

为了从维基百科中提取数据,我们必须首先安装 Python 维基百科库,它包装了官方维基百科 API。这可以通过在命令提示符或终端中输入以下命令来完成:

pip install wikipedia

入门

获取任何标题的摘要

任何标题的摘要都可以使用摘要方法获得。

用法: wikipedia.summary(title, sentences)
Argument : 
Title of the topic 
Optional argument: setting number of lines in result.
Return :Returns the summary in string format. 
 

代码:

Python3


# importing the module
import wikipedia 
# finding result for the search
# sentences = 2 refers to numbers of line
result = wikipedia.summary("India", sentences = 2) 
# printing the result
print(result) 

输出:

India (Hindi: Bh?rat), officially the Republic of India (Hindi: Bh?rat Ga?ar?jya), is a country in South Asia. It is the seventh-largest country by area, the second-most populous country, and the most populous democracy in the world. 

搜索标题和建议

标题和建议可以通过search()方法获取。

用法: wikipedia.search(title, results)
Argument : 
Title of the topic 
Optional argument : setting number of result.
Return :Returns the list of titles. 
 

代码:

Python3


# importing the module
import wikipedia
# getting suggestions
result = wikipedia.search("Geek", results = 5)
# printing the result
print(result)

输出:

['Geek', 'Geek!', 'Freaks and Geeks', 'The Geek', 'Geek show']

获取完整的维基百科页面数据

page()方法用于获取维基百科页面的内容、类别、坐标、图像、链接和其他元数据。

用法: wikipedia.page(title)
Argument : Title of the topic.
Return :Return a WikipediaPage object. 
 

代码:

Python3


# importing the module
import wikipedia
# wikipedia page object is created
page_object = wikipedia.page("india")
# printing html of page_object
print(page_object.html)
# printing title
print(page_object.original_title)
# printing links on that page object
print(page_object.links[0:10])

输出:

“bound method WikipediaPage.html of “WikipediaPage ‘India'”> 
India 
[‘.in’, ’10th BRICS summit’, ’11th BRICS summit’, ’12th BRICS summit’, ’17th SAARC summit’, ’18th SAARC summit’, ‘1951 Asian Games’, ‘1957 Indian general election’, ‘1962 Indian general election’, ‘1982 Asian Games’] 

更改维基百科页面的语言

如果该页面以您的母语存在,则可以将语言更改为您的母语。 Set_lang()方法也是如此。

用法: wikipedia.set_lang(language)
Argument : prefix of the language like for arabic prefix is ar and so on.
Action performed : It converted the data into that language default language is english. 
 

代码:

Python3


# importing the module
import wikipedia
# setting language to hindi
wikipedia.set_lang("hi")
# printing the summary
print(wikipedia.summary("India"))

输出:

python-wikipedia



相关用法


注:本文由纯净天空筛选整理自rakshitarora大神的英文原创作品 Wikipedia module in Python。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。