Merge pull request #86 from ayasyrev/typing

ayasyrev · web-flow · commit 57f9fc29f857 · 2022-12-23T08:59:20.000+03:00
Typing
diff --git a/src/model_constructor/model_constructor.py b/src/model_constructor/model_constructor.py
@@ -1,6 +1,6 @@
 from collections import OrderedDict
 from functools import partial
-from typing import Any, Callable, List, Optional, Type, TypeVar, Union
+from typing import Any, Callable, Optional, TypeVar, Union
 
 import torch.nn as nn
 from pydantic import BaseModel, root_validator
@@ -19,7 +19,7 @@
 TModelCfg = TypeVar("TModelCfg", bound="ModelCfg")
 
 
-def init_cnn(module: nn.Module):
+def init_cnn(module: nn.Module) -> None:
     "Init module - kaiming_normal for Conv2d and 0 for biases."
     if getattr(module, "bias", None) is not None:
         nn.init.constant_(module.bias, 0)  # type: ignore
@@ -39,7 +39,7 @@ def __init__(
         mid_channels: int,
         stride: int = 1,
         conv_layer=ConvBnAct,
-        act_fn: Type[nn.Module] = nn.ReLU,
+        act_fn: type[nn.Module] = nn.ReLU,
         zero_bn: bool = True,
         bn_1st: bool = True,
         groups: int = 1,
@@ -144,16 +144,17 @@ def __init__(
             self.id_conv = nn.Sequential(OrderedDict(id_layers))
         else:
             self.id_conv = None
-        self.act_fn = get_act(act_fn)  # type: ignore
+        self.act_fn = get_act(act_fn)
 
     def forward(self, x):
         identity = self.id_conv(x) if self.id_conv is not None else x
         return self.act_fn(self.convs(x) + identity)
 
 
 def make_stem(cfg: TModelCfg) -> nn.Sequential:  # type: ignore
+    """Create xResnet stem -> 3 conv 3*3 instead 1 conv 7*7"""
     len_stem = len(cfg.stem_sizes)
-    stem: List[tuple[str, nn.Module]] = [
+    stem: list[tuple[str, nn.Module]] = [
         (
             f"conv_{i}",
             cfg.conv_layer(
@@ -175,7 +176,7 @@ def make_stem(cfg: TModelCfg) -> nn.Sequential:  # type: ignore
 
 
 def make_layer(cfg: TModelCfg, layer_num: int) -> nn.Sequential:  # type: ignore
-    #  expansion, in_channels, out_channels, blocks, stride, sa):
+    """Create layer (stage)"""
     # if no pool on stem - stride = 2 for first layer block in body
     stride = 1 if cfg.stem_pool and layer_num == 0 else 2
     num_blocks = cfg.layers[layer_num]
@@ -213,6 +214,7 @@ def make_layer(cfg: TModelCfg, layer_num: int) -> nn.Sequential:  # type: ignore
 
 
 def make_body(cfg: TModelCfg) -> nn.Sequential:  # type: ignore
+    """Create model body."""
     return nn.Sequential(
         OrderedDict(
             [
@@ -224,6 +226,7 @@ def make_body(cfg: TModelCfg) -> nn.Sequential:  # type: ignore
 
 
 def make_head(cfg: TModelCfg) -> nn.Sequential:  # type: ignore
+    """Create head."""
     head = [
         ("pool", nn.AdaptiveAvgPool2d(1)),
         ("flat", nn.Flatten()),
@@ -238,27 +241,27 @@ class ModelCfg(BaseModel):
     name: Optional[str] = None
     in_chans: int = 3
     num_classes: int = 1000
-    block: Type[nn.Module] = ResBlock
-    conv_layer: Type[nn.Module] = ConvBnAct
-    block_sizes: List[int] = [64, 128, 256, 512]
-    layers: List[int] = [2, 2, 2, 2]
-    norm: Type[nn.Module] = nn.BatchNorm2d
-    act_fn: Type[nn.Module] = nn.ReLU
+    block: type[nn.Module] = ResBlock
+    conv_layer: type[nn.Module] = ConvBnAct
+    block_sizes: list[int] = [64, 128, 256, 512]
+    layers: list[int] = [2, 2, 2, 2]
+    norm: type[nn.Module] = nn.BatchNorm2d
+    act_fn: type[nn.Module] = nn.ReLU
     pool: Callable[[Any], nn.Module] = partial(
         nn.AvgPool2d, kernel_size=2, ceil_mode=True
     )
     expansion: int = 1
     groups: int = 1
     dw: bool = False
     div_groups: Union[int, None] = None
-    sa: Union[bool, int, Type[nn.Module]] = False
-    se: Union[bool, int, Type[nn.Module]] = False
+    sa: Union[bool, int, type[nn.Module]] = False
+    se: Union[bool, int, type[nn.Module]] = False
     se_module: Union[bool, None] = None
     se_reduction: Union[int, None] = None
     bn_1st: bool = True
     zero_bn: bool = True
     stem_stride_on: int = 0
-    stem_sizes: List[int] = [32, 32, 64]
+    stem_sizes: list[int] = [32, 32, 64]
     stem_pool: Union[Callable[[], nn.Module], None] = partial(
         nn.MaxPool2d, kernel_size=3, stride=2, padding=1
     )
@@ -286,7 +289,7 @@ def _get_str_value(self, field: str) -> str:
     def __repr__(self) -> str:
         return f"{self.__repr_name__()}(\n  {self.__repr_str__(chr(10) + '  ')})"
 
-    def __repr_args__(self):
+    def __repr_args__(self) -> list[tuple[str, str]]:
         return [
             (field, str_value)
             for field in self.__fields__
@@ -325,7 +328,8 @@ def body(self):
     def from_cfg(cls, cfg: ModelCfg):
         return cls(**cfg.dict())
 
-    def __call__(self):
+    def __call__(self) -> nn.Sequential:
+        """Create model."""
         model_name = self.name or self.__class__.__name__
         named_sequential = type(model_name, (nn.Sequential,), {})
         model = named_sequential(
@@ -338,13 +342,14 @@ def __call__(self):
         return model
 
     def _get_extra_repr(self) -> str:
+        """Repr for changed fields"""
         return " ".join(
             f"{field}: {self._get_str_value(field)},"
             for field in self.__fields_set__
             if field != "name"
-        )[:-1]
+        )[:-1]  # strip last comma.
 
-    def __repr__(self):
+    def __repr__(self) -> str:
         se_repr = self.se.__name__ if self.se else "False"  # type: ignore
         model_name = self.name or self.__class__.__name__
         return (
diff --git a/src/model_constructor/yaresnet.py b/src/model_constructor/yaresnet.py
@@ -2,7 +2,7 @@
 # Yet another ResNet.
 
 from collections import OrderedDict
-from typing import Callable, List, Type, Union
+from typing import Callable, Union
 
 import torch.nn as nn
 from torch.nn import Mish
@@ -27,15 +27,15 @@ def __init__(
         mid_channels: int,
         stride: int = 1,
         conv_layer=ConvBnAct,
-        act_fn: Type[nn.Module] = nn.ReLU,
+        act_fn: type[nn.Module] = nn.ReLU,
         zero_bn: bool = True,
         bn_1st: bool = True,
         groups: int = 1,
         dw: bool = False,
         div_groups: Union[None, int] = None,
         pool: Union[Callable[[], nn.Module], None] = None,
-        se: Union[Type[nn.Module], None] = None,
-        sa: Union[Type[nn.Module], None] = None,
+        se: Union[type[nn.Module], None] = None,
+        sa: Union[type[nn.Module], None] = None,
     ):
         super().__init__()
         # pool defined at ModelConstructor.
@@ -115,9 +115,9 @@ def __init__(
                 ),  # noqa E501
             ]
         if se:
-            layers.append(("se", se(out_channels)))
+            layers.append(("se", se(out_channels)))  # type: ignore
         if sa:
-            layers.append(("sa", sa(out_channels)))
+            layers.append(("sa", sa(out_channels)))  # type: ignore
         self.convs = nn.Sequential(OrderedDict(layers))
         if in_channels != out_channels:
             self.id_conv = conv_layer(
@@ -143,7 +143,7 @@ class YaResNet34(ModelConstructor):
     expansion: int = 1
     layers: list[int] = [3, 4, 6, 3]
     stem_sizes: list[int] = [3, 32, 64, 64]
-    act_fn: Type[nn.Module] = Mish
+    act_fn: type[nn.Module] = Mish
 
 
 class YaResNet50(YaResNet34):