pytorch-image-models/data/transforms.py

import torch
from torchvision import transforms
from PIL import Image
import math
import numpy as np
from data.random_erasing import RandomErasingNumpy

DEFAULT_CROP_PCT = 0.875

IMAGENET_DEFAULT_MEAN = (0.485, 0.456, 0.406)
IMAGENET_DEFAULT_STD = (0.229, 0.224, 0.225)
IMAGENET_INCEPTION_MEAN = (0.5, 0.5, 0.5)
IMAGENET_INCEPTION_STD = (0.5, 0.5, 0.5)
IMAGENET_DPN_MEAN = (124 / 255, 117 / 255, 104 / 255)
IMAGENET_DPN_STD = tuple([1 / (.0167 * 255)] * 3)


def get_mean_and_std(model, args, num_chan=3):
    if hasattr(model, 'default_cfg'):
        mean = model.default_cfg['mean']
        std = model.default_cfg['std']
    else:
        if args.mean is not None:
            mean = tuple(args.mean)
            if len(mean) == 1:
                mean = tuple(list(mean) * num_chan)
            else:
                assert len(mean) == num_chan
        else:
            mean = get_mean_by_model(args.model)
        if args.std is not None:
            std = tuple(args.std)
            if len(std) == 1:
                std = tuple(list(std) * num_chan)
            else:
                assert len(std) == num_chan
        else:
            std = get_std_by_model(args.model)
    return mean, std


def get_mean_by_name(name):
    if name == 'dpn':
        return IMAGENET_DPN_MEAN
    elif name == 'inception' or name == 'le':
        return IMAGENET_INCEPTION_MEAN
    else:
        return IMAGENET_DEFAULT_MEAN


def get_std_by_name(name):
    if name == 'dpn':
        return IMAGENET_DPN_STD
    elif name == 'inception' or name == 'le':
        return IMAGENET_INCEPTION_STD
    else:
        return IMAGENET_DEFAULT_STD


def get_mean_by_model(model_name):
    model_name = model_name.lower()
    if 'dpn' in model_name:
        return IMAGENET_DPN_STD
    elif 'ception' in model_name or 'nasnet' in model_name:
        return IMAGENET_INCEPTION_MEAN
    else:
        return IMAGENET_DEFAULT_MEAN


def get_std_by_model(model_name):
    model_name = model_name.lower()
    if 'dpn' in model_name:
        return IMAGENET_DEFAULT_STD
    elif 'ception' in model_name or 'nasnet' in model_name:
        return IMAGENET_INCEPTION_STD
    else:
        return IMAGENET_DEFAULT_STD


class ToNumpy:

    def __call__(self, pil_img):
        np_img = np.array(pil_img, dtype=np.uint8)
        if np_img.ndim < 3:
            np_img = np.expand_dims(np_img, axis=-1)
        np_img = np.rollaxis(np_img, 2)  # HWC to CHW
        return np_img


class ToTensor:

    def __init__(self, dtype=torch.float32):
        self.dtype = dtype

    def __call__(self, pil_img):
        np_img = np.array(pil_img, dtype=np.uint8)
        if np_img.ndim < 3:
            np_img = np.expand_dims(np_img, axis=-1)
        np_img = np.rollaxis(np_img, 2)  # HWC to CHW
        return torch.from_numpy(np_img).to(dtype=self.dtype)


def transforms_imagenet_train(
        img_size=224,
        scale=(0.1, 1.0),
        color_jitter=(0.4, 0.4, 0.4),
        random_erasing=0.4,
        use_prefetcher=False,
        mean=IMAGENET_DEFAULT_MEAN,
        std=IMAGENET_DEFAULT_STD
):

    tfl = [
        transforms.RandomResizedCrop(
            img_size, scale=scale, interpolation=Image.BICUBIC),
        transforms.RandomHorizontalFlip(),
        transforms.ColorJitter(*color_jitter),
    ]

    if use_prefetcher:
        # prefetcher and collate will handle tensor conversion and norm
        tfl += [ToNumpy()]
    else:
        tfl += [
            ToTensor(),
            transforms.Normalize(
                mean=torch.tensor(mean),
                std=torch.tensor(std))
        ]
        if random_erasing > 0.:
            tfl.append(RandomErasingNumpy(random_erasing, per_pixel=True))
    return transforms.Compose(tfl)


def transforms_imagenet_eval(
        img_size=224,
        crop_pct=None,
        use_prefetcher=False,
        mean=IMAGENET_DEFAULT_MEAN,
        std=IMAGENET_DEFAULT_STD):
    crop_pct = crop_pct or DEFAULT_CROP_PCT
    scale_size = int(math.floor(img_size / crop_pct))

    tfl = [
        transforms.Resize(scale_size, Image.BICUBIC),
        transforms.CenterCrop(img_size),
    ]
    if use_prefetcher:
        # prefetcher and collate will handle tensor conversion and norm
        tfl += [ToNumpy()]
    else:
        tfl += [
            transforms.ToTensor(),
            transforms.Normalize(
                     mean=torch.tensor(mean),
                     std=torch.tensor(std))
        ]

    return transforms.Compose(tfl)
Add some Nvidia performance enhancements (prefetch loader, fast collate), and refactor some of training and model fact/transforms 6 years ago			`import torch`
			`from torchvision import transforms`
			`from PIL import Image`
			`import math`
			`import numpy as np`
			`from data.random_erasing import RandomErasingNumpy`

			`DEFAULT_CROP_PCT = 0.875`

Uniform pretrained model handling. * All models have 'default_cfgs' dict * load/resume/pretrained helpers factored out * pretrained load operates on state_dict based on default_cfg * test all models in validate * schedule, optim factor factored out * test time pool wrapper applied based on default_cfg 6 years ago			`IMAGENET_DEFAULT_MEAN = (0.485, 0.456, 0.406)`
			`IMAGENET_DEFAULT_STD = (0.229, 0.224, 0.225)`
			`IMAGENET_INCEPTION_MEAN = (0.5, 0.5, 0.5)`
			`IMAGENET_INCEPTION_STD = (0.5, 0.5, 0.5)`
			`IMAGENET_DPN_MEAN = (124 / 255, 117 / 255, 104 / 255)`
			`IMAGENET_DPN_STD = tuple([1 / (.0167 * 255)] * 3)`


			`def get_mean_and_std(model, args, num_chan=3):`
			`if hasattr(model, 'default_cfg'):`
			`mean = model.default_cfg['mean']`
			`std = model.default_cfg['std']`
			`else:`
			`if args.mean is not None:`
			`mean = tuple(args.mean)`
			`if len(mean) == 1:`
			`mean = tuple(list(mean) * num_chan)`
			`else:`
			`assert len(mean) == num_chan`
			`else:`
			`mean = get_mean_by_model(args.model)`
			`if args.std is not None:`
			`std = tuple(args.std)`
			`if len(std) == 1:`
			`std = tuple(list(std) * num_chan)`
			`else:`
			`assert len(std) == num_chan`
			`else:`
			`std = get_std_by_model(args.model)`
			`return mean, std`


			`def get_mean_by_name(name):`
			`if name == 'dpn':`
			`return IMAGENET_DPN_MEAN`
			`elif name == 'inception' or name == 'le':`
			`return IMAGENET_INCEPTION_MEAN`
			`else:`
			`return IMAGENET_DEFAULT_MEAN`
Add some Nvidia performance enhancements (prefetch loader, fast collate), and refactor some of training and model fact/transforms 6 years ago

Uniform pretrained model handling. * All models have 'default_cfgs' dict * load/resume/pretrained helpers factored out * pretrained load operates on state_dict based on default_cfg * test all models in validate * schedule, optim factor factored out * test time pool wrapper applied based on default_cfg 6 years ago			`def get_std_by_name(name):`
			`if name == 'dpn':`
			`return IMAGENET_DPN_STD`
			`elif name == 'inception' or name == 'le':`
			`return IMAGENET_INCEPTION_STD`
Improve creation of data pipeline with prefetch enabled vs disabled, fixup inception_res_v2 and dpn models 6 years ago			`else:`
Uniform pretrained model handling. * All models have 'default_cfgs' dict * load/resume/pretrained helpers factored out * pretrained load operates on state_dict based on default_cfg * test all models in validate * schedule, optim factor factored out * test time pool wrapper applied based on default_cfg 6 years ago			`return IMAGENET_DEFAULT_STD`
Improve creation of data pipeline with prefetch enabled vs disabled, fixup inception_res_v2 and dpn models 6 years ago

Uniform pretrained model handling. * All models have 'default_cfgs' dict * load/resume/pretrained helpers factored out * pretrained load operates on state_dict based on default_cfg * test all models in validate * schedule, optim factor factored out * test time pool wrapper applied based on default_cfg 6 years ago			`def get_mean_by_model(model_name):`
Improve creation of data pipeline with prefetch enabled vs disabled, fixup inception_res_v2 and dpn models 6 years ago			`model_name = model_name.lower()`
			`if 'dpn' in model_name:`
			`return IMAGENET_DPN_STD`
Add common model interface to pnasnet and xception, update factory 6 years ago			`elif 'ception' in model_name or 'nasnet' in model_name:`
Improve creation of data pipeline with prefetch enabled vs disabled, fixup inception_res_v2 and dpn models 6 years ago			`return IMAGENET_INCEPTION_MEAN`
			`else:`
			`return IMAGENET_DEFAULT_MEAN`


Uniform pretrained model handling. * All models have 'default_cfgs' dict * load/resume/pretrained helpers factored out * pretrained load operates on state_dict based on default_cfg * test all models in validate * schedule, optim factor factored out * test time pool wrapper applied based on default_cfg 6 years ago			`def get_std_by_model(model_name):`
Improve creation of data pipeline with prefetch enabled vs disabled, fixup inception_res_v2 and dpn models 6 years ago			`model_name = model_name.lower()`
			`if 'dpn' in model_name:`
			`return IMAGENET_DEFAULT_STD`
Add common model interface to pnasnet and xception, update factory 6 years ago			`elif 'ception' in model_name or 'nasnet' in model_name:`
Improve creation of data pipeline with prefetch enabled vs disabled, fixup inception_res_v2 and dpn models 6 years ago			`return IMAGENET_INCEPTION_STD`
			`else:`
			`return IMAGENET_DEFAULT_STD`


			`class ToNumpy:`
Add some Nvidia performance enhancements (prefetch loader, fast collate), and refactor some of training and model fact/transforms 6 years ago
			`def __call__(self, pil_img):`
			`np_img = np.array(pil_img, dtype=np.uint8)`
			`if np_img.ndim < 3:`
			`np_img = np.expand_dims(np_img, axis=-1)`
			`np_img = np.rollaxis(np_img, 2) # HWC to CHW`
			`return np_img`


Improve creation of data pipeline with prefetch enabled vs disabled, fixup inception_res_v2 and dpn models 6 years ago			`class ToTensor:`

			`def __init__(self, dtype=torch.float32):`
			`self.dtype = dtype`

			`def __call__(self, pil_img):`
			`np_img = np.array(pil_img, dtype=np.uint8)`
			`if np_img.ndim < 3:`
			`np_img = np.expand_dims(np_img, axis=-1)`
			`np_img = np.rollaxis(np_img, 2) # HWC to CHW`
			`return torch.from_numpy(np_img).to(dtype=self.dtype)`


Add some Nvidia performance enhancements (prefetch loader, fast collate), and refactor some of training and model fact/transforms 6 years ago			`def transforms_imagenet_train(`
			`img_size=224,`
			`scale=(0.1, 1.0),`
			`color_jitter=(0.4, 0.4, 0.4),`
Improve creation of data pipeline with prefetch enabled vs disabled, fixup inception_res_v2 and dpn models 6 years ago			`random_erasing=0.4,`
			`use_prefetcher=False,`
			`mean=IMAGENET_DEFAULT_MEAN,`
			`std=IMAGENET_DEFAULT_STD`
			`):`
Add some Nvidia performance enhancements (prefetch loader, fast collate), and refactor some of training and model fact/transforms 6 years ago
			`tfl = [`
Improve creation of data pipeline with prefetch enabled vs disabled, fixup inception_res_v2 and dpn models 6 years ago			`transforms.RandomResizedCrop(`
			`img_size, scale=scale, interpolation=Image.BICUBIC),`
Add some Nvidia performance enhancements (prefetch loader, fast collate), and refactor some of training and model fact/transforms 6 years ago			`transforms.RandomHorizontalFlip(),`
			`transforms.ColorJitter(*color_jitter),`
			`]`
Improve creation of data pipeline with prefetch enabled vs disabled, fixup inception_res_v2 and dpn models 6 years ago
			`if use_prefetcher:`
			`# prefetcher and collate will handle tensor conversion and norm`
			`tfl += [ToNumpy()]`
			`else:`
			`tfl += [`
			`ToTensor(),`
			`transforms.Normalize(`
Uniform pretrained model handling. * All models have 'default_cfgs' dict * load/resume/pretrained helpers factored out * pretrained load operates on state_dict based on default_cfg * test all models in validate * schedule, optim factor factored out * test time pool wrapper applied based on default_cfg 6 years ago			`mean=torch.tensor(mean),`
			`std=torch.tensor(std))`
Improve creation of data pipeline with prefetch enabled vs disabled, fixup inception_res_v2 and dpn models 6 years ago			`]`
			`if random_erasing > 0.:`
			`tfl.append(RandomErasingNumpy(random_erasing, per_pixel=True))`
Add some Nvidia performance enhancements (prefetch loader, fast collate), and refactor some of training and model fact/transforms 6 years ago			`return transforms.Compose(tfl)`


Improve creation of data pipeline with prefetch enabled vs disabled, fixup inception_res_v2 and dpn models 6 years ago			`def transforms_imagenet_eval(`
			`img_size=224,`
			`crop_pct=None,`
			`use_prefetcher=False,`
			`mean=IMAGENET_DEFAULT_MEAN,`
			`std=IMAGENET_DEFAULT_STD):`
Add some Nvidia performance enhancements (prefetch loader, fast collate), and refactor some of training and model fact/transforms 6 years ago			`crop_pct = crop_pct or DEFAULT_CROP_PCT`
			`scale_size = int(math.floor(img_size / crop_pct))`

Improve creation of data pipeline with prefetch enabled vs disabled, fixup inception_res_v2 and dpn models 6 years ago			`tfl = [`
Add some Nvidia performance enhancements (prefetch loader, fast collate), and refactor some of training and model fact/transforms 6 years ago			`transforms.Resize(scale_size, Image.BICUBIC),`
			`transforms.CenterCrop(img_size),`
Improve creation of data pipeline with prefetch enabled vs disabled, fixup inception_res_v2 and dpn models 6 years ago			`]`
			`if use_prefetcher:`
			`# prefetcher and collate will handle tensor conversion and norm`
			`tfl += [ToNumpy()]`
			`else:`
			`tfl += [`
			`transforms.ToTensor(),`
			`transforms.Normalize(`
			`mean=torch.tensor(mean),`
			`std=torch.tensor(std))`
			`]`

			`return transforms.Compose(tfl)`