本文簡要介紹rust語言中 char.len_utf8
的用法。
用法
pub const fn len_utf8(self) -> usize
返回此 char
以 UTF-8 編碼時所需的字節數。
該字節數始終介於 1 和 4 之間,包括 1 和 4。
例子
基本用法:
let len = 'A'.len_utf8();
assert_eq!(len, 1);
let len = 'ß'.len_utf8();
assert_eq!(len, 2);
let len = 'ℝ'.len_utf8();
assert_eq!(len, 3);
let len = '💣'.len_utf8();
assert_eq!(len, 4);
&str
類型保證其內容是 UTF-8,因此我們可以比較每個代碼點表示為 char
與 &str
本身的長度:
// as chars
let eastern = '東';
let capital = '京';
// both can be represented as three bytes
assert_eq!(3, eastern.len_utf8());
assert_eq!(3, capital.len_utf8());
// as a &str, these two are encoded in UTF-8
let tokyo = "東京";
let len = eastern.len_utf8() + capital.len_utf8();
// we can see that they take six bytes total...
assert_eq!(6, tokyo.len());
// ... just like the &str
assert_eq!(len, tokyo.len());
相關用法
- Rust char.len_utf16用法及代碼示例
- Rust char.is_control用法及代碼示例
- Rust char.is_alphanumeric用法及代碼示例
- Rust char.is_digit用法及代碼示例
- Rust char.is_ascii_graphic用法及代碼示例
- Rust char.decode_utf16用法及代碼示例
- Rust char.is_uppercase用法及代碼示例
- Rust char.to_ascii_lowercase用法及代碼示例
- Rust char.is_ascii_uppercase用法及代碼示例
- Rust char.escape_unicode用法及代碼示例
- Rust char.is_alphabetic用法及代碼示例
- Rust char.is_ascii_control用法及代碼示例
- Rust char.from_u32_unchecked用法及代碼示例
- Rust char.is_ascii_alphabetic用法及代碼示例
- Rust char.eq_ignore_ascii_case用法及代碼示例
- Rust char.is_ascii用法及代碼示例
- Rust char.make_ascii_lowercase用法及代碼示例
- Rust char.is_whitespace用法及代碼示例
- Rust char.to_lowercase用法及代碼示例
- Rust char.is_ascii_punctuation用法及代碼示例
- Rust char.to_digit用法及代碼示例
- Rust char.from_digit用法及代碼示例
- Rust char.is_lowercase用法及代碼示例
- Rust char.encode_utf16用法及代碼示例
- Rust char.escape_debug用法及代碼示例
注:本文由純淨天空篩選整理自rust-lang.org大神的英文原創作品 char.len_utf8。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。