当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python Unicode转Bytes用法及代码示例


Unicode,通常称为通用字符集,是文本编码的标准。 Unicode 的主要目标是创建一个通用字符集,可以表示任何语言或书写系统中的文本。来自不同书写系统的文本字符被它赋予了独特的表示形式。

在 Python 中将 Unicode 转换为字节

下面是将 Unicode 字符串转换为字节字符串的方法Python.

  • 使用Strings encode()使用 UTF-8
  • 使用encode()使用不同的编码
  • 使用bytes()构造函数
  • 使用str.encode()方法

使用以下命令将 Unicode 转换为字节encode()使用 UTF-8

在此示例中,Unicode 字符串“Hello, GeeksforGeeks”使用 UTF-8 编码和“encode()”方法编码为字节。生成的“bytes_representation”是表示原始字符串的 UTF-8 编码版本的字节序列。

Python3


unicode_string = "Hello, GeeksforGeeks"
bytes_representation = unicode_string.encode('utf-8') 
print(bytes_representation) 
输出
b'Hello, GeeksforGeeks'


Unicode 到字节使用encode()使用不同的编码

在此示例中,使用 UTF-16 编码和“encode()”方法将 Unicode 字符串编码为字节字符串。生成的“byte_string_utf16”包含原始字符串的 UTF-16 编码表示形式,然后将其打印到控制台。

Python3


unicode_string = "Hello, Noida"
byte_string_utf16 = unicode_string.encode('utf-16') 
# Displaying the byte string 
print(byte_string_utf16) 
输出
b'\xff\xfeH\x00e\x00l\x00l\x00o\x00,\x00 \x00N\x00o\x00i\x00d\x00a\x00'


使用以下命令将 Unicode 字符串转换为字节字符串bytes()构造函数

在此示例中,使用采用 UTF-8 编码的 bytes() 构造函数将 Unicode 字符串转换为字节字符串。生成的“byte_string_bytes”表示 mixed-language Unicode 字符串的 UTF-8 编码字节序列。

Python3


unicode_string = "Hello, 你好"
byte_string_bytes = bytes(unicode_string, 'utf-8') 
# Displaying the byte string 
print(byte_string_bytes) 
输出
b'Hello, \xe4\xbd\xa0\xe5\xa5\xbd'


Python Unicode 字符串到字节字符串使用str.encode()方法

在此示例中,使用以下命令将 Unicode 字符串转换为字节字符串:Strings encode()使用UTF-8编码的方法。生成的“byte_string_str_encode”表示 mixed-language Unicode 字符串的 UTF-8 编码字节序列。

Python3


unicode_string = "Hello, Shivang"
byte_string_str_encode = str.encode(unicode_string, 'utf-8') 
# Displaying the byte string 
print(byte_string_str_encode) 
输出
b'Hello, Shivang'




相关用法


注:本文由纯净天空筛选整理自saranyagudluri254大神的英文原创作品 Convert Unicode to Bytes in Python。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。