From d8131d5d47c46e38c1b1d4d073166291a3ffb8bf Mon Sep 17 00:00:00 2001
From: szingaro <stefanopio.zingaro@unibo.it>
Date: Thu, 25 Feb 2021 12:58:01 +0100
Subject: [PATCH] fixing master bug on hardcoded osnet architecture

---
 timm/models/vision_transformer.py | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/timm/models/vision_transformer.py b/timm/models/vision_transformer.py
index fbf03e9f..6ae8c72e 100644
--- a/timm/models/vision_transformer.py
+++ b/timm/models/vision_transformer.py
@@ -241,7 +241,7 @@ class HybridEmbed(nn.Module):
                 training = backbone.training
                 if training:
                     backbone.eval()
-                o = self.backbone(torch.zeros(1, in_chans, img_size[0], img_size[1]), return_featuremaps=True) # it works with osnet
+                o = self.backbone(torch.zeros(1, in_chans, img_size[0], img_size[1]))
                 if isinstance(o, (list, tuple)):
                     o = o[-1]  # last feature if backbone outputs list/tuple of features
                 feature_size = o.shape[-2:]
@@ -257,7 +257,7 @@ class HybridEmbed(nn.Module):
         self.proj = nn.Conv2d(feature_dim, embed_dim, 1)
 
     def forward(self, x):
-        x = self.backbone(x, return_featuremaps=True) # it works with osnet
+        x = self.backbone(x)
         if isinstance(x, (list, tuple)):
             x = x[-1]  # last feature if backbone outputs list/tuple of features
         x = self.proj(x).flatten(2).transpose(1, 2)
@@ -784,4 +784,4 @@ def vit_deit_base_distilled_patch16_384(pretrained=False, **kwargs):
     model_kwargs = dict(patch_size=16, embed_dim=768, depth=12, num_heads=12, **kwargs)
     model = _create_vision_transformer(
         'vit_deit_base_distilled_patch16_384', pretrained=pretrained, distilled=True, **model_kwargs)
-    return model
\ No newline at end of file
+    return model