當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Rust String.from_utf8_lossy用法及代碼示例


本文簡要介紹rust語言中 std::string::String.from_utf8_lossy 的用法。

用法

pub fn from_utf8_lossy(v: &[u8]) -> Cow<'_, str>

將字節切片轉換為字符串,包括無效字符。

字符串由字節組成( u8 ),而字節切片( &[u8] )由字節組成,因此此函數在兩者之間進行轉換。但是,並非所有字節切片都是有效的字符串:字符串必須是有效的 UTF-8。在此轉換過程中,from_utf8_lossy() 將用 U+FFFD REPLACEMENT CHARACTER 替換任何無效的 UTF-8 序列,如下所示:

如果您確定字節切片是有效的 UTF-8,並且您不想產生轉換開銷,則此函數有一個不安全版本 from_utf8_unchecked ,它具有相同的行為但跳過檢查.

此函數返回 Cow<'a, str> 。如果我們的字節切片是無效的 UTF-8,那麽我們需要插入替換字符,這將改變字符串的大小,因此需要 String 。但如果它已經是有效的 UTF-8,我們就不需要新的分配。這種返回類型允許我們處理這兩種情況。

例子

基本用法:

// some bytes, in a vector
let sparkle_heart = vec![240, 159, 146, 150];

let sparkle_heart = String::from_utf8_lossy(&sparkle_heart);

assert_eq!("💖", sparkle_heart);

不正確的字節:

// some invalid bytes
let input = b"Hello \xF0\x90\x80World";
let output = String::from_utf8_lossy(input);

assert_eq!("Hello �World", output);

相關用法


注:本文由純淨天空篩選整理自rust-lang.org大神的英文原創作品 std::string::String.from_utf8_lossy。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。