本文简要介绍rust语言中 char.len_utf8
的用法。
用法
pub const fn len_utf8(self) -> usize
返回此 char
以 UTF-8 编码时所需的字节数。
该字节数始终介于 1 和 4 之间,包括 1 和 4。
例子
基本用法:
let len = 'A'.len_utf8();
assert_eq!(len, 1);
let len = 'ß'.len_utf8();
assert_eq!(len, 2);
let len = 'ℝ'.len_utf8();
assert_eq!(len, 3);
let len = '💣'.len_utf8();
assert_eq!(len, 4);
&str
类型保证其内容是 UTF-8,因此我们可以比较每个代码点表示为 char
与 &str
本身的长度:
// as chars
let eastern = '東';
let capital = '京';
// both can be represented as three bytes
assert_eq!(3, eastern.len_utf8());
assert_eq!(3, capital.len_utf8());
// as a &str, these two are encoded in UTF-8
let tokyo = "東京";
let len = eastern.len_utf8() + capital.len_utf8();
// we can see that they take six bytes total...
assert_eq!(6, tokyo.len());
// ... just like the &str
assert_eq!(len, tokyo.len());
相关用法
- Rust char.len_utf16用法及代码示例
- Rust char.is_control用法及代码示例
- Rust char.is_alphanumeric用法及代码示例
- Rust char.is_digit用法及代码示例
- Rust char.is_ascii_graphic用法及代码示例
- Rust char.decode_utf16用法及代码示例
- Rust char.is_uppercase用法及代码示例
- Rust char.to_ascii_lowercase用法及代码示例
- Rust char.is_ascii_uppercase用法及代码示例
- Rust char.escape_unicode用法及代码示例
- Rust char.is_alphabetic用法及代码示例
- Rust char.is_ascii_control用法及代码示例
- Rust char.from_u32_unchecked用法及代码示例
- Rust char.is_ascii_alphabetic用法及代码示例
- Rust char.eq_ignore_ascii_case用法及代码示例
- Rust char.is_ascii用法及代码示例
- Rust char.make_ascii_lowercase用法及代码示例
- Rust char.is_whitespace用法及代码示例
- Rust char.to_lowercase用法及代码示例
- Rust char.is_ascii_punctuation用法及代码示例
- Rust char.to_digit用法及代码示例
- Rust char.from_digit用法及代码示例
- Rust char.is_lowercase用法及代码示例
- Rust char.encode_utf16用法及代码示例
- Rust char.escape_debug用法及代码示例
注:本文由纯净天空筛选整理自rust-lang.org大神的英文原创作品 char.len_utf8。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。