当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Rust char.len_utf8用法及代码示例


本文简要介绍rust语言中 char.len_utf8 的用法。

用法

pub const fn len_utf8(self) -> usize

返回此 char 以 UTF-8 编码时所需的字节数。

该字节数始终介于 1 和 4 之间,包括 1 和 4。

例子

基本用法:

let len = 'A'.len_utf8();
assert_eq!(len, 1);

let len = 'ß'.len_utf8();
assert_eq!(len, 2);

let len = 'ℝ'.len_utf8();
assert_eq!(len, 3);

let len = '💣'.len_utf8();
assert_eq!(len, 4);

&str 类型保证其内容是 UTF-8,因此我们可以比较每个代码点表示为 char&str 本身的长度:

// as chars
let eastern = '東';
let capital = '京';

// both can be represented as three bytes
assert_eq!(3, eastern.len_utf8());
assert_eq!(3, capital.len_utf8());

// as a &str, these two are encoded in UTF-8
let tokyo = "東京";

let len = eastern.len_utf8() + capital.len_utf8();

// we can see that they take six bytes total...
assert_eq!(6, tokyo.len());

// ... just like the &str
assert_eq!(len, tokyo.len());

相关用法


注:本文由纯净天空筛选整理自rust-lang.org大神的英文原创作品 char.len_utf8。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。