本文簡要介紹rust語言中 std::string::String.from_utf8_lossy
的用法。
用法
pub fn from_utf8_lossy(v: &[u8]) -> Cow<'_, str>
將字節切片轉換為字符串,包括無效字符。
字符串由字節組成( u8
),而字節切片( &[u8]
)由字節組成,因此此函數在兩者之間進行轉換。但是,並非所有字節切片都是有效的字符串:字符串必須是有效的 UTF-8。在此轉換過程中,from_utf8_lossy()
將用 U+FFFD REPLACEMENT CHARACTER
替換任何無效的 UTF-8 序列,如下所示:
如果您確定字節切片是有效的 UTF-8,並且您不想產生轉換開銷,則此函數有一個不安全版本 from_utf8_unchecked
,它具有相同的行為但跳過檢查.
此函數返回 Cow<'a, str>
。如果我們的字節切片是無效的 UTF-8,那麽我們需要插入替換字符,這將改變字符串的大小,因此需要 String
。但如果它已經是有效的 UTF-8,我們就不需要新的分配。這種返回類型允許我們處理這兩種情況。
例子
基本用法:
// some bytes, in a vector
let sparkle_heart = vec![240, 159, 146, 150];
let sparkle_heart = String::from_utf8_lossy(&sparkle_heart);
assert_eq!("💖", sparkle_heart);
不正確的字節:
// some invalid bytes
let input = b"Hello \xF0\x90\x80World";
let output = String::from_utf8_lossy(input);
assert_eq!("Hello �World", output);
相關用法
- Rust String.from_utf8_unchecked用法及代碼示例
- Rust String.from_utf8用法及代碼示例
- Rust String.from_utf16_lossy用法及代碼示例
- Rust String.from_utf16用法及代碼示例
- Rust String.from_raw_parts用法及代碼示例
- Rust String.try_reserve用法及代碼示例
- Rust String.insert_str用法及代碼示例
- Rust String.into_raw_parts用法及代碼示例
- Rust String.extend_from_within用法及代碼示例
- Rust String.clear用法及代碼示例
- Rust String.reserve用法及代碼示例
- Rust String.push用法及代碼示例
- Rust String.as_bytes用法及代碼示例
- Rust String.as_str用法及代碼示例
- Rust String.with_capacity用法及代碼示例
- Rust String.remove用法及代碼示例
- Rust String.into_bytes用法及代碼示例
- Rust String.replace_range用法及代碼示例
- Rust String.split_off用法及代碼示例
- Rust String.shrink_to_fit用法及代碼示例
- Rust String.into_boxed_str用法及代碼示例
- Rust String.new用法及代碼示例
- Rust String.insert用法及代碼示例
- Rust String.capacity用法及代碼示例
- Rust String.try_reserve_exact用法及代碼示例
注:本文由純淨天空篩選整理自rust-lang.org大神的英文原創作品 std::string::String.from_utf8_lossy。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。