本文简要介绍python语言中 torchvision.datasets.Kinetics400
的用法。
用法:
class torchvision.datasets.Kinetics400(root: str, frames_per_clip: int, num_classes: Optional[Any] = None, split: Optional[Any] = None, download: Optional[Any] = None, num_download_workers: Optional[Any] = None, **kwargs: Any)
具有以下条目的 3 元组:
视频 (Tensor[T, H, W, C]):
T
视频帧audio(Tensor[K, L]):音频帧,其中
K
是通道数,L
是点数label (int): 视频剪辑的类别
Kinetics-400 数据集。
Kinetics-400 是一个动作识别视频数据集。该数据集将每个视频视为固定大小的视频剪辑的集合,由
frames_per_clip
指定,其中每个剪辑之间的帧步长由step_between_clips
给出。举个例子,对于分别有 10 帧和 15 帧的 2 个视频,如果
frames_per_clip=5
和step_between_clips=5
,数据集大小将为 (2 + 3) = 5,其中前两个元素来自视频 1,而视频 2 中的下三个元素。请注意,我们会丢弃不完全包含frames_per_clip
元素的剪辑,因此视频中可能并非所有帧都存在。在内部,它使用VideoClips对象来处理剪辑创建。
参数:
返回:
返回类型:
相关用法
- Python PyTorch Kitti用法及代码示例
- Python PyTorch KeyedTensor用法及代码示例
- Python PyTorch KeyedJaggedTensor用法及代码示例
- Python PyTorch Kumaraswamy用法及代码示例
- Python PyTorch KJTAllToAll用法及代码示例
- Python PyTorch frexp用法及代码示例
- Python PyTorch jvp用法及代码示例
- Python PyTorch cholesky用法及代码示例
- Python PyTorch vdot用法及代码示例
- Python PyTorch ELU用法及代码示例
- Python PyTorch ScaledDotProduct.__init__用法及代码示例
- Python PyTorch gumbel_softmax用法及代码示例
- Python PyTorch get_tokenizer用法及代码示例
- Python PyTorch saved_tensors_hooks用法及代码示例
- Python PyTorch positive用法及代码示例
- Python PyTorch renorm用法及代码示例
- Python PyTorch AvgPool2d用法及代码示例
- Python PyTorch MaxUnpool3d用法及代码示例
- Python PyTorch Bernoulli用法及代码示例
- Python PyTorch Tensor.unflatten用法及代码示例
- Python PyTorch Sigmoid用法及代码示例
- Python PyTorch Tensor.register_hook用法及代码示例
- Python PyTorch ShardedEmbeddingBagCollection.named_parameters用法及代码示例
- Python PyTorch sqrt用法及代码示例
- Python PyTorch PackageImporter.id用法及代码示例
注:本文由纯净天空筛选整理自pytorch.org大神的英文原创作品 torchvision.datasets.Kinetics400。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。