More meta wrappers (forced by Mixtral 8bx7)

ndif-team · Dec 21, 2023 · f6c078a · f6c078a
1 parent e33b2e6
commit f6c078a
Showing 1 changed file with 33 additions and 5 deletions.
diff --git a/src/nnsight/__init__.py b/src/nnsight/__init__.py
@@ -60,19 +60,48 @@ def repeat_interleave(
 )
 
 
-def cpu_wrapper(fn):
+def noop_wrapper(fn):
     @wraps(fn)
-    def cpu(input: torch.Tensor, *args, **kwargs):
+    def noop(input: torch.Tensor, *args, **kwargs):
         if input.device.type == "meta":
             return input
 
         else:
             return fn(input, *args, **kwargs)
 
-    return cpu
+    return noop
 
 
-DEFAULT_PATCHER.add(Patch(torch.Tensor, cpu_wrapper(torch.Tensor.cpu), "cpu"))
+DEFAULT_PATCHER.add(Patch(torch.Tensor, noop_wrapper(torch.Tensor.cpu), "cpu"))
+
+def onehot_wrapper(fn):
+    @wraps(fn)
+    def onehot(input: torch.Tensor, num_classes=-1):
+        if input.device.type == "meta":
+            return torch.zeros((*input.shape, num_classes), device='meta')
+
+        else:
+            return fn(input, num_classes=num_classes)
+
+    return onehot
+
+
+DEFAULT_PATCHER.add(Patch(torch.nn.functional, onehot_wrapper(torch.nn.functional.one_hot), "one_hot"))
+
+def where_wrapper(fn):
+    @wraps(fn)
+    def where(input: torch.Tensor, *args, **kwargs):
+        if input.device.type == "meta":
+            return input.to(torch.int)
+
+        else:
+            return fn(input, *args, **kwargs)
+
+    return where
+
+DEFAULT_PATCHER.add(Patch(torch, where_wrapper(torch.where), "where"))
+
+DEFAULT_PATCHER.add(Patch(torch.Tensor, noop_wrapper(torch.Tensor.tolist), "tolist"))
 
 DEFAULT_PATCHER.__enter__()
 
@@ -95,5 +124,4 @@ def activate_recent_meta():
 def local_scalar_dense_meta(A):
     return 0
 
-
 activate_recent_meta()