当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python Unicode转ASCII用法及代码示例


Unicode 是通用字符集和支持世界上所有语言的标准。它包含 150 多个脚本使用的 140,000 多个字符以及各种符号。另一方面,ASCII 是 Unicode 的一个子集,也是最兼容的字符集,由 128 个由英文字母、数字和标点符号组成的字母组成,其余为控制字符。本文处理使用 Python 库 anyascii 将各种 Unicode 字符转换为更简单的 ASCII 表示。

文本从字符转换为字符。每个脚本的映射都基于常规方案。符号字符根据其含义或外观进行转换。如果输入中包含 ASCII 字符,它们不受影响,其余的都尝试转换为 ASCII。未知字符被删除。

安装:

要安装此模块,请在终端中键入以下命令。

pip install anyascii

示例 1:使用多种语言

在此,各种不同的语言(如 Unicode)被设置为输入,输出以转换后的 ASCII 字符形式给出。



Python3


from anyascii import anyascii
  
# checking for Hindi script
hindi_uni = anyascii('नमस्ते विद्यार्थी')
  
print("The translation from hindi Script:"
      + str(hindi_uni))
  
# checking for Punjabi script
pun_uni = anyascii('ਸਤਿ ਸ੍ਰੀ ਅਕਾਲ')
  
print("The translation from Punjabi Script:"
      + str(pun_uni))

输出:

The translation from hindi Script:nmste vidyarthi
The translation from Punjabi Script:sti sri akal

示例 2:使用 Unicode 表情符号和符号

该库还处理表情符号和符号,它们通常是 Unicode 表示。

from anyascii import anyascii

# working with emoji example
emoji_uni = anyascii('😎 👑 🍎')

print("The ASCII from emojis:"
      + str(emoji_uni))

# checking for Symbols
sym_uni = anyascii('➕ ☆ ℳ')

print("The ASCII from Symbols:"
      + str(sym_uni))

输出:

The ASCII from emojis::sunglasses::crown::apple:
The ASCII from Symbols::heavy_plus_sign:* M

相关用法


注:本文由纯净天空筛选整理自manjeet_04大神的英文原创作品 Convert Unicode to ASCII in Python。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。