本文简要介绍python语言中 torch.utils.benchmark.Timer.blocked_autorange
的用法。
用法:
blocked_autorange(callback=None, min_run_time=0.2)
一个
Measurement
对象,包含测量的运行时间和重复计数,可用于计算统计信息。 (平均值、中位数等)测量许多复制,同时将计时器开销保持在最低限度。
在高层次上,blocked_autorange 执行以下 pseudo-code:
`setup` total_time = 0 while total_time < min_run_time start = timer() for _ in range(block_size): `stmt` total_time += (timer() - start)
注意内部循环中的变量
block_size
。块大小的选择对测量质量很重要,并且必须平衡两个相互竞争的目标:较小的块大小会导致更多的复制和通常更好的统计数据。
较大的块大小可以更好地摊销
timer
调用的成本,并导致测量偏差较小。这很重要,因为 CUDA 同步时间很重要(从单到低两位数微秒),否则会使测量产生偏差。
blocked_autorange 通过运行预热期设置block_size,增加块大小直到计时器开销小于整体计算的 0.1%。然后将该值用于主测量回路。
返回:
相关用法
- Python PyTorch Timer用法及代码示例
- Python PyTorch TimeMasking用法及代码示例
- Python PyTorch TimeStretch用法及代码示例
- Python PyTorch Tensor.unflatten用法及代码示例
- Python PyTorch Tensor.register_hook用法及代码示例
- Python PyTorch TransformerEncoder用法及代码示例
- Python PyTorch TarArchiveLoader用法及代码示例
- Python PyTorch Tensor.storage_offset用法及代码示例
- Python PyTorch Tensor.to用法及代码示例
- Python PyTorch Tensor.sparse_mask用法及代码示例
- Python PyTorch TripletMarginLoss用法及代码示例
- Python PyTorch Tacotron2TTSBundle.get_text_processor用法及代码示例
- Python PyTorch Tensor.is_leaf用法及代码示例
- Python PyTorch Tensor.imag用法及代码示例
- Python PyTorch Tensor.unfold用法及代码示例
- Python PyTorch TenCrop用法及代码示例
- Python PyTorch Tensor.real用法及代码示例
- Python PyTorch TwRwSparseFeaturesDist用法及代码示例
- Python PyTorch Tensor.refine_names用法及代码示例
- Python PyTorch Tanh用法及代码示例
- Python PyTorch Tensor.rename用法及代码示例
- Python PyTorch TransformedDistribution用法及代码示例
- Python PyTorch Tensor.view用法及代码示例
- Python PyTorch Tensor.new_empty用法及代码示例
- Python PyTorch Tensor.index_copy_用法及代码示例
注:本文由纯净天空筛选整理自pytorch.org大神的英文原创作品 torch.utils.benchmark.Timer.blocked_autorange。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。