當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python PyTorch CocoCaptions用法及代碼示例


本文簡要介紹python語言中 torchvision.datasets.CocoCaptions 的用法。

用法:

class torchvision.datasets.CocoCaptions(root: str, annFile: str, transform: Optional[Callable] = None, target_transform: Optional[Callable] = None, transforms: Optional[Callable] = None)

參數

  • root(string) -圖像下載到的根目錄。

  • annFile(string) -json 注釋文件的路徑。

  • transform(可調用的,可選的) -接受 PIL 圖像並返回轉換版本的函數/轉換。例如,transforms.ToTensor

  • target_transform(可調用的,可選的) -接收目標並對其進行轉換的函數/轉換。

  • transforms(可調用的,可選的) -將輸入樣本及其目標作為條目並返回轉換版本的函數/轉換。

MS Coco Captions 數據集。

示例

import torchvision.datasets as dset
import torchvision.transforms as transforms
cap = dset.CocoCaptions(root = 'dir where images are',
                        annFile = 'json annotation file',
                        transform=transforms.ToTensor())

print('Number of samples: ', len(cap))
img, target = cap[3] # load 4th sample

print("Image Size: ", img.size())
print(target)

輸出:

Number of samples: 82783
Image Size: (3L, 427L, 640L)
[u'A plane emitting smoke stream flying over a mountain.',
u'A plane darts across a bright blue sky behind a mountain covered in snow',
u'A plane leaves a contrail above the snowy mountain top.',
u'A mountain that has a plane flying overheard in the distance.',
u'A mountain view with a plume of smoke in the background']

相關用法


注:本文由純淨天空篩選整理自pytorch.org大神的英文原創作品 torchvision.datasets.CocoCaptions。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。