fix device mesh overrides (#254)

tushar00jain · web-flow · commit 7234bab5a6cb · 2025-08-06T13:15:26.000-07:00
diff --git a/torchft/device_mesh.py b/torchft/device_mesh.py
@@ -3,6 +3,7 @@
 from typing import TYPE_CHECKING, Any, Dict, Optional, Union
 
 import torch
+from torch._C._distributed_c10d import Backend as C10dBackend
 from torch.distributed import (
     DeviceMesh,
     ProcessGroup as BaseProcessGroup,
@@ -145,7 +146,13 @@ def get_group(self, mesh_dim: Optional[Union[int, str]] = None) -> BaseProcessGr
             assert self.mesh is not None
             return self.mesh.get_group(self._real_mesh_dim(dim))
 
-    def _flatten(self, mesh_dim_name: Optional[str]) -> "DeviceMesh":
+    def _flatten(
+        self,
+        mesh_dim_name: Optional[str] = None,
+        backend_override: Union[
+            None, str, C10dBackend.Options, tuple[str, C10dBackend.Options]
+        ] = None,
+    ) -> "DeviceMesh":
         flatten_mesh = _FlattenDeviceMesh(self)
         if mesh_dim_name is None:
             raise ValueError("ManagedDeviceMesh._flatten requires `mesh_dim_name`")
@@ -261,7 +268,13 @@ def __getitem__(self, mesh_dim_names: Union[str, tuple[str, ...]]) -> DeviceMesh
     def get_group(self, mesh_dim: Optional[Union[int, str]] = None) -> BaseProcessGroup:
         raise NotImplementedError
 
-    def _flatten(self, mesh_dim_name: Optional[str]) -> "DeviceMesh":
+    def _flatten(
+        self,
+        mesh_dim_name: Optional[str] = None,
+        backend_override: Union[
+            None, str, C10dBackend.Options, tuple[str, C10dBackend.Options]
+        ] = None,
+    ) -> "DeviceMesh":
         raise NotImplementedError
 
     def size(self, mesh_dim: Optional[int] = None) -> int: