互聯網是最大的信息來源,因此了解如何從各種來源獲取數據非常重要。維基百科是互聯網上最大、最受歡迎的信息來源之一。
維基百科是一個多語言在線百科全書,作為一個開放協作項目,由誌願者編輯社區使用基於 wiki 的編輯係統創建和維護。
在本文中,我們將了解如何使用 Python 的 Wikipedia 模塊從 Wikipedia 網站獲取各種信息。
安裝
為了從維基百科中提取數據,我們必須首先安裝 Python 維基百科庫,它包裝了官方維基百科 API。這可以通過在命令提示符或終端中輸入以下命令來完成:
pip install wikipedia
入門
獲取任何標題的摘要
任何標題的摘要都可以使用摘要方法獲得。
用法: wikipedia.summary(title, sentences)
Argument :
Title of the topic
Optional argument: setting number of lines in result.
Return :Returns the summary in string format.
代碼:
Python3
# importing the module
import wikipedia
# finding result for the search
# sentences = 2 refers to numbers of line
result = wikipedia.summary("India", sentences = 2)
# printing the result
print(result)
輸出:
India (Hindi: Bh?rat), officially the Republic of India (Hindi: Bh?rat Ga?ar?jya), is a country in South Asia. It is the seventh-largest country by area, the second-most populous country, and the most populous democracy in the world.
搜索標題和建議
標題和建議可以通過search()方法獲取。
用法: wikipedia.search(title, results)
Argument :
Title of the topic
Optional argument : setting number of result.
Return :Returns the list of titles.
代碼:
Python3
# importing the module
import wikipedia
# getting suggestions
result = wikipedia.search("Geek", results = 5)
# printing the result
print(result)
輸出:
['Geek', 'Geek!', 'Freaks and Geeks', 'The Geek', 'Geek show']
獲取完整的維基百科頁麵數據
page()方法用於獲取維基百科頁麵的內容、類別、坐標、圖像、鏈接和其他元數據。
用法: wikipedia.page(title)
Argument : Title of the topic.
Return :Return a WikipediaPage object.
代碼:
Python3
# importing the module
import wikipedia
# wikipedia page object is created
page_object = wikipedia.page("india")
# printing html of page_object
print(page_object.html)
# printing title
print(page_object.original_title)
# printing links on that page object
print(page_object.links[0:10])
輸出:
“bound method WikipediaPage.html of “WikipediaPage ‘India'”>
India
[‘.in’, ’10th BRICS summit’, ’11th BRICS summit’, ’12th BRICS summit’, ’17th SAARC summit’, ’18th SAARC summit’, ‘1951 Asian Games’, ‘1957 Indian general election’, ‘1962 Indian general election’, ‘1982 Asian Games’]
更改維基百科頁麵的語言
如果該頁麵以您的母語存在,則可以將語言更改為您的母語。 Set_lang()方法也是如此。
用法: wikipedia.set_lang(language)
Argument : prefix of the language like for arabic prefix is ar and so on.
Action performed : It converted the data into that language default language is english.
代碼:
Python3
# importing the module
import wikipedia
# setting language to hindi
wikipedia.set_lang("hi")
# printing the summary
print(wikipedia.summary("India"))
輸出:
相關用法
- Python Wand resize()用法及代碼示例
- Python Wand path_horizontal_line()用法及代碼示例
- Python Wand path_start()用法及代碼示例
- Python Wand path_finish()用法及代碼示例
- Python Wand remap()用法及代碼示例
- Python Wand composite()用法及代碼示例
- Python Wand circle()用法及代碼示例
- Python Wand Drawing()用法及代碼示例
- Python Wand bezier()用法及代碼示例
- Python Wand vignette()用法及代碼示例
- Python Wand flip()用法及代碼示例
- Python Wand transpose()用法及代碼示例
- Python Wand swirl()用法及代碼示例
- Python Wand white_threshold()用法及代碼示例
- Python Wand wavelet_denoise()用法及代碼示例
- Python Wand magnify()用法及代碼示例
- Python Wand flop()用法及代碼示例
- Python Wand unique_colors()用法及代碼示例
- Python Wand transverse()用法及代碼示例
- Python Wand auto_level()用法及代碼示例
- Python Wand text()用法及代碼示例
- Python Wand rectangle()用法及代碼示例
- Python Wand polyline()用法及代碼示例
- Python Wand polygon()用法及代碼示例
- Python Wand color()用法及代碼示例
注:本文由純淨天空篩選整理自rakshitarora大神的英文原創作品 Wikipedia module in Python。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。