用法
rejection_resample(
class_func, target_dist, initial_dist=None, seed=None, name=None
)
参数
-
class_func
将输入数据集的元素映射到标量tf.int32
张量的函数。值应该在[0, num_classes)
中。 -
target_dist
浮点型张量,形状为[num_classes]
。 -
initial_dist
(可选。)浮点型张量,形状为[num_classes]
。如果未提供,则以流媒体方式实时估计真实的类分布。 -
seed
(可选。)重采样器的 Python 整数种子。 -
name
(可选。) tf.data 操作的名称。
返回
-
Dataset
将数据集重新采样到目标分布的转换。
让我们考虑以下示例,其中初始数据分布为 init_dist
的数据集需要重新采样到具有 target_dist
分布的数据集。
import collections
initial_dist = [0.5, 0.5]
target_dist = [0.6, 0.4]
num_classes = len(initial_dist)
num_samples = 100000
data_np = np.random.choice(num_classes, num_samples, p=initial_dist)
dataset = tf.data.Dataset.from_tensor_slices(data_np)
x = collections.defaultdict(int)
for i in dataset:
x[i.numpy()] += 1
根据 initial_dist
分布,x
的值将接近 {0:50000, 1:50000}
。
dataset = dataset.rejection_resample(
class_func=lambda x:x % 2,
target_dist=target_dist,
initial_dist=initial_dist)
y = collections.defaultdict(int)
for i in dataset:
cls, _ = i
y[cls.numpy()] += 1
y
的值现在将接近 {0:75000, 1:50000}
从而满足 target_dist
分布。
相关用法
- Python tf.data.FixedLengthRecordDataset.repeat用法及代码示例
- Python tf.data.FixedLengthRecordDataset.reduce用法及代码示例
- Python tf.data.FixedLengthRecordDataset.random用法及代码示例
- Python tf.data.FixedLengthRecordDataset.range用法及代码示例
- Python tf.data.FixedLengthRecordDataset.cardinality用法及代码示例
- Python tf.data.FixedLengthRecordDataset.bucket_by_sequence_length用法及代码示例
- Python tf.data.FixedLengthRecordDataset.as_numpy_iterator用法及代码示例
- Python tf.data.FixedLengthRecordDataset.take_while用法及代码示例
- Python tf.data.FixedLengthRecordDataset.shard用法及代码示例
- Python tf.data.FixedLengthRecordDataset.group_by_window用法及代码示例
- Python tf.data.FixedLengthRecordDataset.unique用法及代码示例
- Python tf.data.FixedLengthRecordDataset.filter用法及代码示例
- Python tf.data.FixedLengthRecordDataset.choose_from_datasets用法及代码示例
- Python tf.data.FixedLengthRecordDataset.from_tensor_slices用法及代码示例
- Python tf.data.FixedLengthRecordDataset.apply用法及代码示例
- Python tf.data.FixedLengthRecordDataset.skip用法及代码示例
- Python tf.data.FixedLengthRecordDataset.from_generator用法及代码示例
- Python tf.data.FixedLengthRecordDataset.enumerate用法及代码示例
- Python tf.data.FixedLengthRecordDataset.scan用法及代码示例
- Python tf.data.FixedLengthRecordDataset.sample_from_datasets用法及代码示例
注:本文由纯净天空筛选整理自tensorflow.org大神的英文原创作品 tf.data.FixedLengthRecordDataset.rejection_resample。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。