當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python tf.raw_ops.UnicodeEncode用法及代碼示例


將整數張量編碼為 un​​icode 字符串。

用法

tf.raw_ops.UnicodeEncode(
    input_values, input_splits, output_encoding, errors='replace',
    replacement_char=65533, name=None
)

參數

  • input_values Tensor 類型為 int32 。包含應編碼的 unicode 代碼點的一維張量。
  • input_splits 一個Tensor。必須是以下類型之一:int32 , int64。一維張量,指定如何將 unicode 代碼點拆分為字符串。特別是,output[i] 是通過對切片 input_values[input_splits[i]:input_splits[i+1]] 中的代碼點進行編碼來構造的。
  • output_encoding string 來自:"UTF-8", "UTF-16-BE", "UTF-32-BE"。輸出字符串的 Unicode 編碼。有效的編碼是:"UTF-8", "UTF-16-BE", and "UTF-32-BE"
  • errors 一個可選的 string 來自: "ignore", "replace", "strict" 。默認為 "replace" 。在輸入中發現無效格式時的錯誤處理策略。 'strict' 的值將導致操作對任何無效輸入格式產生 InvalidArgument 錯誤。 'replace' 的值(默認值)將導致操作將輸入中的任何無效格式替換為 replacement_char 代碼點。 'ignore' 的值將導致操作跳過輸入中的任何無效格式並且不產生相應的輸出字符。
  • replacement_char 可選的 int 。默認為 65533 。當 errors='replace' 時,用於代替輸入中任何無效格式的替換字符代碼點。可以使用任何有效的 unicode 代碼點。默認值是默認的 unicode 替換字符是 0xFFFD (U+65533)。
  • name 操作的名稱(可選)。

返回

  • Tensor 類型為 string

返回一個字符串向量,其中 output[i] 是通過使用 output_encodinginput_values[input_splits[i]:input_splits[i+1]] 中的 Unicode 代碼點進行編碼來構造的。


例子:

input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
input_splits = [0, 5, 10]
output_encoding = 'UTF-8'

output = ['Hello', 'World']

相關用法


注:本文由純淨天空篩選整理自tensorflow.org大神的英文原創作品 tf.raw_ops.UnicodeEncode。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。