本文簡要介紹python語言中 torchvision.datasets.Kinetics400
的用法。
用法:
class torchvision.datasets.Kinetics400(root: str, frames_per_clip: int, num_classes: Optional[Any] = None, split: Optional[Any] = None, download: Optional[Any] = None, num_download_workers: Optional[Any] = None, **kwargs: Any)
具有以下條目的 3 元組:
視頻 (Tensor[T, H, W, C]):
T
視頻幀audio(Tensor[K, L]):音頻幀,其中
K
是通道數,L
是點數label (int): 視頻剪輯的類別
Kinetics-400 數據集。
Kinetics-400 是一個動作識別視頻數據集。該數據集將每個視頻視為固定大小的視頻剪輯的集合,由
frames_per_clip
指定,其中每個剪輯之間的幀步長由step_between_clips
給出。舉個例子,對於分別有 10 幀和 15 幀的 2 個視頻,如果
frames_per_clip=5
和step_between_clips=5
,數據集大小將為 (2 + 3) = 5,其中前兩個元素來自視頻 1,而視頻 2 中的下三個元素。請注意,我們會丟棄不完全包含frames_per_clip
元素的剪輯,因此視頻中可能並非所有幀都存在。在內部,它使用VideoClips對象來處理剪輯創建。
參數:
返回:
返回類型:
相關用法
- Python PyTorch Kitti用法及代碼示例
- Python PyTorch KeyedTensor用法及代碼示例
- Python PyTorch KeyedJaggedTensor用法及代碼示例
- Python PyTorch Kumaraswamy用法及代碼示例
- Python PyTorch KJTAllToAll用法及代碼示例
- Python PyTorch frexp用法及代碼示例
- Python PyTorch jvp用法及代碼示例
- Python PyTorch cholesky用法及代碼示例
- Python PyTorch vdot用法及代碼示例
- Python PyTorch ELU用法及代碼示例
- Python PyTorch ScaledDotProduct.__init__用法及代碼示例
- Python PyTorch gumbel_softmax用法及代碼示例
- Python PyTorch get_tokenizer用法及代碼示例
- Python PyTorch saved_tensors_hooks用法及代碼示例
- Python PyTorch positive用法及代碼示例
- Python PyTorch renorm用法及代碼示例
- Python PyTorch AvgPool2d用法及代碼示例
- Python PyTorch MaxUnpool3d用法及代碼示例
- Python PyTorch Bernoulli用法及代碼示例
- Python PyTorch Tensor.unflatten用法及代碼示例
- Python PyTorch Sigmoid用法及代碼示例
- Python PyTorch Tensor.register_hook用法及代碼示例
- Python PyTorch ShardedEmbeddingBagCollection.named_parameters用法及代碼示例
- Python PyTorch sqrt用法及代碼示例
- Python PyTorch PackageImporter.id用法及代碼示例
注:本文由純淨天空篩選整理自pytorch.org大神的英文原創作品 torchvision.datasets.Kinetics400。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。