pytorch-image-models/inference.py

#!/usr/bin/env python3
"""PyTorch Inference Script

An example inference script that outputs top-k class ids for images in a folder into a csv.

Hacked together by / Copyright 2020 Ross Wightman (https://github.com/rwightman)
"""
import os
import time
import argparse
import logging
import numpy as np
import torch

from timm.models import create_model, apply_test_time_pool
from timm.data import ImageDataset, create_loader_v2, resolve_data_config
from timm.utils import AverageMeter, setup_default_logging

torch.backends.cudnn.benchmark = True
_logger = logging.getLogger('inference')


parser = argparse.ArgumentParser(description='PyTorch ImageNet Inference')
parser.add_argument('data', metavar='DIR',
                    help='path to dataset')
parser.add_argument('--output_dir', metavar='DIR', default='./',
                    help='path to output files')
parser.add_argument('--model', '-m', metavar='MODEL', default='dpn92',
                    help='model architecture (default: dpn92)')
parser.add_argument('-j', '--workers', default=2, type=int, metavar='N',
                    help='number of data loading workers (default: 2)')
parser.add_argument('-b', '--batch-size', default=256, type=int,
                    metavar='N', help='mini-batch size (default: 256)')
parser.add_argument('--img-size', default=None, type=int,
                    metavar='N', help='Input image dimension')
parser.add_argument('--input-size', default=None, nargs=3, type=int,
                    metavar='N N N', help='Input all image dimensions (d h w, e.g. --input-size 3 224 224), uses model default if empty')
parser.add_argument('--mean', type=float, nargs='+', default=None, metavar='MEAN',
                    help='Override mean pixel value of dataset')
parser.add_argument('--std', type=float, nargs='+', default=None, metavar='STD',
                    help='Override std deviation of of dataset')
parser.add_argument('--interpolation', default='', type=str, metavar='NAME',
                    help='Image resize interpolation type (overrides model)')
parser.add_argument('--num-classes', type=int, default=1000,
                    help='Number classes in dataset')
parser.add_argument('--log-freq', default=10, type=int,
                    metavar='N', help='batch logging frequency (default: 10)')
parser.add_argument('--checkpoint', default='', type=str, metavar='PATH',
                    help='path to latest checkpoint (default: none)')
parser.add_argument('--pretrained', dest='pretrained', action='store_true',
                    help='use pre-trained model')
parser.add_argument('--num-gpu', type=int, default=1,
                    help='Number of GPUS to use')
parser.add_argument('--no-test-pool', dest='no_test_pool', action='store_true',
                    help='disable test time pool')
parser.add_argument('--topk', default=5, type=int,
                    metavar='N', help='Top-k to output to CSV')


def main():
    setup_default_logging()
    args = parser.parse_args()
    # might as well try to do something useful...
    args.pretrained = args.pretrained or not args.checkpoint

    # create model
    model = create_model(
        args.model,
        num_classes=args.num_classes,
        in_chans=3,
        pretrained=args.pretrained,
        checkpoint_path=args.checkpoint)

    _logger.info('Model %s created, param count: %d' %
                 (args.model, sum([m.numel() for m in model.parameters()])))

    config = resolve_data_config(vars(args), model=model)
    model, test_time_pool = (model, False) if args.no_test_pool else apply_test_time_pool(model, config)

    if args.num_gpu > 1:
        model = torch.nn.DataParallel(model, device_ids=list(range(args.num_gpu))).cuda()
    else:
        model = model.cuda()

    loader = create_loader_v2(
        ImageDataset(args.data),
        input_size=config['input_size'],
        batch_size=args.batch_size,
        use_prefetcher=True,
        interpolation=config['interpolation'],
        mean=config['mean'],
        std=config['std'],
        num_workers=args.workers,
        crop_pct=1.0 if test_time_pool else config['crop_pct'])

    model.eval()

    k = min(args.topk, args.num_classes)
    batch_time = AverageMeter()
    end = time.time()
    topk_ids = []
    with torch.no_grad():
        for batch_idx, (input, _) in enumerate(loader):
            input = input.cuda()
            labels = model(input)
            topk = labels.topk(k)[1]
            topk_ids.append(topk.cpu().numpy())

            # measure elapsed time
            batch_time.update(time.time() - end)
            end = time.time()

            if batch_idx % args.log_freq == 0:
                _logger.info('Predict: [{0}/{1}] Time {batch_time.val:.3f} ({batch_time.avg:.3f})'.format(
                    batch_idx, len(loader), batch_time=batch_time))

    topk_ids = np.concatenate(topk_ids, axis=0)

    with open(os.path.join(args.output_dir, './topk_ids.csv'), 'w') as out_file:
        filenames = loader.dataset.filenames(basename=True)
        for filename, label in zip(filenames, topk_ids):
            out_file.write('{0},{1}\n'.format(
                filename, ','.join([ str(v) for v in label])))


if __name__ == '__main__':
    main()
Change the Python interpreter to Python 3.x in the scripts 4 years ago			`#!/usr/bin/env python3`
Add checkpoint averaging script. Add headers, shebangs, exec perms to all scripts 5 years ago			`"""PyTorch Inference Script`
Initial commit, puting some ol pieces together 6 years ago
Add checkpoint averaging script. Add headers, shebangs, exec perms to all scripts 5 years ago			`An example inference script that outputs top-k class ids for images in a folder into a csv.`
Initial commit, puting some ol pieces together 6 years ago
Fix some attributions, add copyrights to some file docstrings 4 years ago			`Hacked together by / Copyright 2020 Ross Wightman (https://github.com/rwightman)`
Add checkpoint averaging script. Add headers, shebangs, exec perms to all scripts 5 years ago			`"""`
Initial commit, puting some ol pieces together 6 years ago			`import os`
			`import time`
			`import argparse`
Remove all prints, change most to logging calls, tweak alignment of batch logs, improve setup.py 5 years ago			`import logging`
Initial commit, puting some ol pieces together 6 years ago			`import numpy as np`
			`import torch`

Big re-org, working towards making pip/module as 'timm' 5 years ago			`from timm.models import create_model, apply_test_time_pool`
Transforms, augmentation work for bits, add RandomErasing support for XLA (pushing into transforms), revamp of transform/preproc config, etc ongoing... 3 years ago			`from timm.data import ImageDataset, create_loader_v2, resolve_data_config`
Remove all prints, change most to logging calls, tweak alignment of batch logs, improve setup.py 5 years ago			`from timm.utils import AverageMeter, setup_default_logging`
Initial commit, puting some ol pieces together 6 years ago
Uniform pretrained model handling. * All models have 'default_cfgs' dict * load/resume/pretrained helpers factored out * pretrained load operates on state_dict based on default_cfg * test all models in validate * schedule, optim factor factored out * test time pool wrapper applied based on default_cfg 6 years ago			`torch.backends.cudnn.benchmark = True`
Merge branch 'logger' into features. Change 'logger' to '_logger'. 4 years ago			`_logger = logging.getLogger('inference')`
Leverage python hierachical logger with this update one can tune the kind of logs generated by timm but training and inference traces are unchanged 4 years ago
Initial commit, puting some ol pieces together 6 years ago
			`parser = argparse.ArgumentParser(description='PyTorch ImageNet Inference')`
			`parser.add_argument('data', metavar='DIR',`
			`help='path to dataset')`
			`parser.add_argument('--output_dir', metavar='DIR', default='./',`
			`help='path to output files')`
			`parser.add_argument('--model', '-m', metavar='MODEL', default='dpn92',`
			`help='model architecture (default: dpn92)')`
			`parser.add_argument('-j', '--workers', default=2, type=int, metavar='N',`
			`help='number of data loading workers (default: 2)')`
			`parser.add_argument('-b', '--batch-size', default=256, type=int,`
			`metavar='N', help='mini-batch size (default: 256)')`
No default img size for inference script. Fixes #109 5 years ago			`parser.add_argument('--img-size', default=None, type=int,`
Initial commit, puting some ol pieces together 6 years ago			`metavar='N', help='Input image dimension')`
Add --input-size option to scripts to specify full input dimensions from command-line 4 years ago			`parser.add_argument('--input-size', default=None, nargs=3, type=int,`
			`metavar='N N N', help='Input all image dimensions (d h w, e.g. --input-size 3 224 224), uses model default if empty')`
Add per model crop pct, interpolation defaults, tie it all together * create one resolve fn to pull together model defaults + cmd line args * update attribution comments in some models * test update train/validation/inference scripts 6 years ago			`parser.add_argument('--mean', type=float, nargs='+', default=None, metavar='MEAN',`
			`help='Override mean pixel value of dataset')`
			`parser.add_argument('--std', type=float, nargs='+', default=None, metavar='STD',`
			`help='Override std deviation of of dataset')`
			`parser.add_argument('--interpolation', default='', type=str, metavar='NAME',`
			`help='Image resize interpolation type (overrides model)')`
Uniform pretrained model handling. * All models have 'default_cfgs' dict * load/resume/pretrained helpers factored out * pretrained load operates on state_dict based on default_cfg * test all models in validate * schedule, optim factor factored out * test time pool wrapper applied based on default_cfg 6 years ago			`parser.add_argument('--num-classes', type=int, default=1000,`
			`help='Number classes in dataset')`
Remove all prints, change most to logging calls, tweak alignment of batch logs, improve setup.py 5 years ago			`parser.add_argument('--log-freq', default=10, type=int,`
			`metavar='N', help='batch logging frequency (default: 10)')`
Fixup validate/inference script args, fix senet init for better test accuracy 6 years ago			`parser.add_argument('--checkpoint', default='', type=str, metavar='PATH',`
Initial commit, puting some ol pieces together 6 years ago			`help='path to latest checkpoint (default: none)')`
			`parser.add_argument('--pretrained', dest='pretrained', action='store_true',`
			`help='use pre-trained model')`
Fixup validate/inference script args, fix senet init for better test accuracy 6 years ago			`parser.add_argument('--num-gpu', type=int, default=1,`
			`help='Number of GPUS to use')`
Add per model crop pct, interpolation defaults, tie it all together * create one resolve fn to pull together model defaults + cmd line args * update attribution comments in some models * test update train/validation/inference scripts 6 years ago			`parser.add_argument('--no-test-pool', dest='no_test_pool', action='store_true',`
			`help='disable test time pool')`
dataset not passed through PrefetchLoader for inference script. Fix #10 * also, make top5 configurable for lower class count cases 6 years ago			`parser.add_argument('--topk', default=5, type=int,`
			`metavar='N', help='Top-k to output to CSV')`
Initial commit, puting some ol pieces together 6 years ago

			`def main():`
Remove all prints, change most to logging calls, tweak alignment of batch logs, improve setup.py 5 years ago			`setup_default_logging()`
Initial commit, puting some ol pieces together 6 years ago			`args = parser.parse_args()`
Big re-org, working towards making pip/module as 'timm' 5 years ago			`# might as well try to do something useful...`
			`args.pretrained = args.pretrained or not args.checkpoint`

Initial commit, puting some ol pieces together 6 years ago			`# create model`
Fixup validate/inference script args, fix senet init for better test accuracy 6 years ago			`model = create_model(`
Initial commit, puting some ol pieces together 6 years ago			`args.model,`
Uniform pretrained model handling. * All models have 'default_cfgs' dict * load/resume/pretrained helpers factored out * pretrained load operates on state_dict based on default_cfg * test all models in validate * schedule, optim factor factored out * test time pool wrapper applied based on default_cfg 6 years ago			`num_classes=args.num_classes,`
			`in_chans=3,`
			`pretrained=args.pretrained,`
			`checkpoint_path=args.checkpoint)`
Initial commit, puting some ol pieces together 6 years ago
Merge branch 'logger' into features. Change 'logger' to '_logger'. 4 years ago			`_logger.info('Model %s created, param count: %d' %`
Remove all prints, change most to logging calls, tweak alignment of batch logs, improve setup.py 5 years ago			`(args.model, sum([m.numel() for m in model.parameters()])))`
Lots of refactoring and cleanup. * Move 'test time pool' to Module that can be used by any model, remove from DPN * Remove ResNext model file and combine with ResNet * Remove fbresnet200 as it was an old conversion and pretrained performance not worth param count * Cleanup adaptive avgmax pooling and add back conctat variant * Factor out checkpoint load fn 6 years ago
A number of tweaks to arguments, epoch handling, config * reorganize train args * allow resolve_data_config to be used with dict args, not just arparse * stop incrementing epoch before save, more consistent naming vs csv, etc * update resume and start epoch handling to match above * stop auto-incrementing epoch in scheduler 5 years ago			`config = resolve_data_config(vars(args), model=model)`
don't forget this file 4 years ago			`model, test_time_pool = (model, False) if args.no_test_pool else apply_test_time_pool(model, config)`
Initial commit, puting some ol pieces together 6 years ago
Fixup validate/inference script args, fix senet init for better test accuracy 6 years ago			`if args.num_gpu > 1:`
			`model = torch.nn.DataParallel(model, device_ids=list(range(args.num_gpu))).cuda()`
Initial commit, puting some ol pieces together 6 years ago			`else:`
			`model = model.cuda()`

Transforms, augmentation work for bits, add RandomErasing support for XLA (pushing into transforms), revamp of transform/preproc config, etc ongoing... 3 years ago			`loader = create_loader_v2(`
Initial commit for dataset / parser reorg to support additional datasets / types 4 years ago			`ImageDataset(args.data),`
Add per model crop pct, interpolation defaults, tie it all together * create one resolve fn to pull together model defaults + cmd line args * update attribution comments in some models * test update train/validation/inference scripts 6 years ago			`input_size=config['input_size'],`
Update inference script for new loader style 6 years ago			`batch_size=args.batch_size,`
			`use_prefetcher=True,`
Add per model crop pct, interpolation defaults, tie it all together * create one resolve fn to pull together model defaults + cmd line args * update attribution comments in some models * test update train/validation/inference scripts 6 years ago			`interpolation=config['interpolation'],`
			`mean=config['mean'],`
			`std=config['std'],`
			`num_workers=args.workers,`
			`crop_pct=1.0 if test_time_pool else config['crop_pct'])`
Initial commit, puting some ol pieces together 6 years ago
			`model.eval()`

dataset not passed through PrefetchLoader for inference script. Fix #10 * also, make top5 configurable for lower class count cases 6 years ago			`k = min(args.topk, args.num_classes)`
Initial commit, puting some ol pieces together 6 years ago			`batch_time = AverageMeter()`
			`end = time.time()`
dataset not passed through PrefetchLoader for inference script. Fix #10 * also, make top5 configurable for lower class count cases 6 years ago			`topk_ids = []`
Initial commit, puting some ol pieces together 6 years ago			`with torch.no_grad():`
			`for batch_idx, (input, _) in enumerate(loader):`
			`input = input.cuda()`
			`labels = model(input)`
dataset not passed through PrefetchLoader for inference script. Fix #10 * also, make top5 configurable for lower class count cases 6 years ago			`topk = labels.topk(k)[1]`
			`topk_ids.append(topk.cpu().numpy())`
Initial commit, puting some ol pieces together 6 years ago
			`# measure elapsed time`
			`batch_time.update(time.time() - end)`
			`end = time.time()`

Remove all prints, change most to logging calls, tweak alignment of batch logs, improve setup.py 5 years ago			`if batch_idx % args.log_freq == 0:`
Merge branch 'logger' into features. Change 'logger' to '_logger'. 4 years ago			`_logger.info('Predict: [{0}/{1}] Time {batch_time.val:.3f} ({batch_time.avg:.3f})'.format(`
Initial commit, puting some ol pieces together 6 years ago			`batch_idx, len(loader), batch_time=batch_time))`

fix: the exeption when topk is 1 4 years ago			`topk_ids = np.concatenate(topk_ids, axis=0)`
Initial commit, puting some ol pieces together 6 years ago
dataset not passed through PrefetchLoader for inference script. Fix #10 * also, make top5 configurable for lower class count cases 6 years ago			`with open(os.path.join(args.output_dir, './topk_ids.csv'), 'w') as out_file:`
More models in sotabench, more control over sotabench run, dataset filename extraction consistency 4 years ago			`filenames = loader.dataset.filenames(basename=True)`
dataset not passed through PrefetchLoader for inference script. Fix #10 * also, make top5 configurable for lower class count cases 6 years ago			`for filename, label in zip(filenames, topk_ids):`
fix: the exception not using default topk argument 4 years ago			`out_file.write('{0},{1}\n'.format(`
			`filename, ','.join([ str(v) for v in label])))`
Initial commit, puting some ol pieces together 6 years ago

			`if __name__ == '__main__':`
			`main()`