當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python Unicode轉ASCII用法及代碼示例


Unicode 是通用字符集和支持世界上所有語言的標準。它包含 150 多個腳本使用的 140,000 多個字符以及各種符號。另一方麵,ASCII 是 Unicode 的一個子集,也是最兼容的字符集,由 128 個由英文字母、數字和標點符號組成的字母組成,其餘為控製字符。本文處理使用 Python 庫 anyascii 將各種 Unicode 字符轉換為更簡單的 ASCII 表示。

文本從字符轉換為字符。每個腳本的映射都基於常規方案。符號字符根據其含義或外觀進行轉換。如果輸入中包含 ASCII 字符,它們不受影響,其餘的都嘗試轉換為 ASCII。未知字符被刪除。

安裝:

要安裝此模塊,請在終端中鍵入以下命令。

pip install anyascii

示例 1:使用多種語言

在此,各種不同的語言(如 Unicode)被設置為輸入,輸出以轉換後的 ASCII 字符形式給出。



Python3


from anyascii import anyascii
  
# checking for Hindi script
hindi_uni = anyascii('नमस्ते विद्यार्थी')
  
print("The translation from hindi Script:"
      + str(hindi_uni))
  
# checking for Punjabi script
pun_uni = anyascii('ਸਤਿ ਸ੍ਰੀ ਅਕਾਲ')
  
print("The translation from Punjabi Script:"
      + str(pun_uni))

輸出:

The translation from hindi Script:nmste vidyarthi
The translation from Punjabi Script:sti sri akal

示例 2:使用 Unicode 表情符號和符號

該庫還處理表情符號和符號,它們通常是 Unicode 表示。

from anyascii import anyascii

# working with emoji example
emoji_uni = anyascii('😎 👑 🍎')

print("The ASCII from emojis:"
      + str(emoji_uni))

# checking for Symbols
sym_uni = anyascii('➕ ☆ ℳ')

print("The ASCII from Symbols:"
      + str(sym_uni))

輸出:

The ASCII from emojis::sunglasses::crown::apple:
The ASCII from Symbols::heavy_plus_sign:* M

相關用法


注:本文由純淨天空篩選整理自manjeet_04大神的英文原創作品 Convert Unicode to ASCII in Python。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。