[PyTorch] Fix ONNX export bug with operation-based API (#1320)

Debug ONNX export with te.Sequential ONNX export assumes that all state dict objects are tensor, even extra state. Signed-off-by: Tim Moon <[email protected]>
NVIDIA · Nov 13, 2024 · c0a539c · c0a539c
1 parent 943f1e0
commit c0a539c
Showing 1 changed file with 3 additions and 3 deletions.
diff --git a/transformer_engine/pytorch/ops/op.py b/transformer_engine/pytorch/ops/op.py
@@ -505,7 +505,7 @@ def forward(
             basic_op_kwargs=[kwargs],
         )
 
-    def get_extra_state(self) -> Optional[torch.Tensor]:
+    def get_extra_state(self) -> torch.Tensor:
         """Serialize extra state
 
         Contains metadata for FP8 casting.
@@ -534,7 +534,7 @@ def get_extra_state(self) -> Optional[torch.Tensor]:
             self.num_fp8_scales(mode) > 0 for mode in ("input", "param", "grad_output")
         )
         if not has_fp8_state:
-            return None
+            return torch.Tensor()
 
         def to_cpu(src: torch.Tensor) -> torch.Tensor:
             """Helper function to make CPU copy of tensor
@@ -588,7 +588,7 @@ def to_cpu(src: torch.Tensor) -> torch.Tensor:
 
     def set_extra_state(self, state: Optional[torch.Tensor]) -> None:
         """Load extra state"""
-        if state is None:
+        if state is None or state.numel() == 0:
             return
 
         # Deserialize state from byte tensor