Unicode 是通用字符集和支持世界上所有语言的标准。它包含 150 多个脚本使用的 140,000 多个字符以及各种符号。另一方面,ASCII 是 Unicode 的一个子集,也是最兼容的字符集,由 128 个由英文字母、数字和标点符号组成的字母组成,其余为控制字符。本文处理使用 Python 库 anyascii 将各种 Unicode 字符转换为更简单的 ASCII 表示。
文本从字符转换为字符。每个脚本的映射都基于常规方案。符号字符根据其含义或外观进行转换。如果输入中包含 ASCII 字符,它们不受影响,其余的都尝试转换为 ASCII。未知字符被删除。
安装:
要安装此模块,请在终端中键入以下命令。
pip install anyascii
示例 1:使用多种语言
在此,各种不同的语言(如 Unicode)被设置为输入,输出以转换后的 ASCII 字符形式给出。
Python3
from anyascii import anyascii
 Â
# checking for Hindi script
hindi_uni = anyascii('नऎसŕĽŕ¤¤ŕĽ ािऌŕĽŕ¤Żŕ¤žŕ¤°ŕĽŕ¤ĽŕĽ')
 Â
print("The translation from hindi Script:"
      + str(hindi_uni))
 Â
# checking for Punjabi script
pun_uni = anyascii('ਸਤਿ ਸŕŠŕ¨°ŕŠ ŕ¨
ŕ¨ŕ¨žŕ¨˛')
 Â
print("The translation from Punjabi Script:"
      + str(pun_uni))
输出:
The translation from hindi Script:nmste vidyarthi The translation from Punjabi Script:sti sri akal
示例 2:使用 Unicode 表情符号和符号
该库还处理表情符号和符号,它们通常是 Unicode 表示。
from anyascii import anyascii # working with emoji example emoji_uni = anyascii('đ đ đ') print("The ASCII from emojis:" + str(emoji_uni)) # checking for Symbols sym_uni = anyascii('â â âł') print("The ASCII from Symbols:" + str(sym_uni))
输出:
The ASCII from emojis::sunglasses::crown::apple: The ASCII from Symbols::heavy_plus_sign:* M
相关用法
- Python binary转ASCII用法及代码示例
- Python ASCII转Binary用法及代码示例
- Python ascii()用法及代码示例
- Python XML转Dictionary用法及代码示例
注:本文由纯净天空筛选整理自manjeet_04大神的英文原创作品 Convert Unicode to ASCII in Python。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。