Python PyTorch wav2vec2_model用法及代碼示例

本文簡要介紹python語言中 torchaudio.models.wav2vec2_model 的用法。

用法: torchaudio.models.wav2vec2_model(extractor_mode: str, extractor_conv_layer_config: Optional[List[Tuple[int, int, int]]], extractor_conv_bias: bool, encoder_embed_dim: int, encoder_projection_dropout: float, encoder_pos_conv_kernel: int, encoder_pos_conv_groups: int, encoder_num_layers: int, encoder_num_heads: int, encoder_attention_dropout: float, encoder_ff_interm_features: int, encoder_ff_interm_dropout: float, encoder_dropout: float, encoder_layer_norm_first: bool, encoder_layer_drop: float, aux_num_out: Optional[int]) → torchaudio.models.Wav2Vec2Model: 構建自定義 Wav2Vec2Model

注意

下麵的“feature extractor”對應於ConvFeatureExtractionModel在原來的fairseq執行。這在本文中稱為“(卷積)特征編碼器”wav2vec 2.0[5] 紙。

下麵的 “encoder” 對應於 TransformerEncoder ，在本文中稱為 “Transformer”。

相關用法

注：本文由純淨天空篩選整理自pytorch.org大神的英文原創作品 torchaudio.models.wav2vec2_model。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。