Unicode 是通用字符集和支持世界上所有語言的標準。它包含 150 多個腳本使用的 140,000 多個字符以及各種符號。另一方麵,ASCII 是 Unicode 的一個子集,也是最兼容的字符集,由 128 個由英文字母、數字和標點符號組成的字母組成,其餘為控製字符。本文處理使用 Python 庫 anyascii 將各種 Unicode 字符轉換為更簡單的 ASCII 表示。
文本從字符轉換為字符。每個腳本的映射都基於常規方案。符號字符根據其含義或外觀進行轉換。如果輸入中包含 ASCII 字符,它們不受影響,其餘的都嘗試轉換為 ASCII。未知字符被刪除。
安裝:
要安裝此模塊,請在終端中鍵入以下命令。
pip install anyascii
示例 1:使用多種語言
在此,各種不同的語言(如 Unicode)被設置為輸入,輸出以轉換後的 ASCII 字符形式給出。
Python3
from anyascii import anyascii
 Â
# checking for Hindi script
hindi_uni = anyascii('नऎसŕĽŕ¤¤ŕĽ ािऌŕĽŕ¤Żŕ¤žŕ¤°ŕĽŕ¤ĽŕĽ')
 Â
print("The translation from hindi Script:"
      + str(hindi_uni))
 Â
# checking for Punjabi script
pun_uni = anyascii('ਸਤਿ ਸŕŠŕ¨°ŕŠ ŕ¨
ŕ¨ŕ¨žŕ¨˛')
 Â
print("The translation from Punjabi Script:"
      + str(pun_uni))
輸出:
The translation from hindi Script:nmste vidyarthi The translation from Punjabi Script:sti sri akal
示例 2:使用 Unicode 表情符號和符號
該庫還處理表情符號和符號,它們通常是 Unicode 表示。
from anyascii import anyascii # working with emoji example emoji_uni = anyascii('đ đ đ') print("The ASCII from emojis:" + str(emoji_uni)) # checking for Symbols sym_uni = anyascii('â â âł') print("The ASCII from Symbols:" + str(sym_uni))
輸出:
The ASCII from emojis::sunglasses::crown::apple: The ASCII from Symbols::heavy_plus_sign:* M
相關用法
- Python binary轉ASCII用法及代碼示例
- Python ASCII轉Binary用法及代碼示例
- Python ascii()用法及代碼示例
- Python XML轉Dictionary用法及代碼示例
注:本文由純淨天空篩選整理自manjeet_04大神的英文原創作品 Convert Unicode to ASCII in Python。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。