black lint

jnolis · jnolis · commit e94a60f8847b · 2021-03-17T14:48:28.000-07:00
diff --git a/examples/pytorch/01-start-with-pytorch.ipynb b/examples/pytorch/01-start-with-pytorch.ipynb
@@ -28,16 +28,16 @@
    "metadata": {},
    "outputs": [],
    "source": [
-    "import uuid # noqa\n",
+    "import uuid  # noqa\n",
     "import datetime\n",
-    "import pickle # noqa\n",
+    "import pickle  # noqa\n",
     "import json\n",
-    "import torch # noqa\n",
+    "import torch  # noqa\n",
     "import torch.nn as nn\n",
     "import torch.optim as optim\n",
     "import numpy as np\n",
     "import urllib.request\n",
-    "import pandas as pd # noqa\n",
+    "import pandas as pd  # noqa\n",
     "from torch.utils.data import Dataset, DataLoader"
    ]
   },
@@ -68,13 +68,16 @@
     "    def get_substrings(in_str):\n",
     "        # add the stop character to the end of the name, then generate all the partial names\n",
     "        in_str = in_str + \"+\"\n",
-    "        res = [in_str[0: j] for j in range(1, len(in_str) + 1)]\n",
+    "        res = [in_str[0:j] for j in range(1, len(in_str) + 1)]\n",
     "        return res\n",
+    "\n",
     "    pet_names_expanded = [get_substrings(name) for name in pet_names]\n",
     "    pet_names_expanded = [item for sublist in pet_names_expanded for item in sublist]\n",
     "    pet_names_characters = [list(name) for name in pet_names_expanded]\n",
-    "    pet_names_padded = [name[-(str_len + 1):] for name in pet_names_characters]\n",
-    "    pet_names_padded = [list((str_len + 1 - len(characters)) * \"*\") + characters for characters in pet_names_padded]\n",
+    "    pet_names_padded = [name[-(str_len + 1) :] for name in pet_names_characters]\n",
+    "    pet_names_padded = [\n",
+    "        list((str_len + 1 - len(characters)) * \"*\") + characters for characters in pet_names_padded\n",
+    "    ]\n",
     "    pet_names_numeric = [[characters.index(char) for char in name] for name in pet_names_padded]\n",
     "\n",
     "    # the final x and y data to use for training the model. Note that the x data needs to be one-hot encoded\n",
@@ -158,7 +161,9 @@
     "            loss = criterion(batch_y_pred.transpose(1, 2), batch_y)\n",
     "            loss.backward()\n",
     "            optimizer.step()\n",
-    "        print(f\"{datetime.datetime.now().isoformat()} - epoch {epoch} complete - loss {loss.item()}\")\n",
+    "        print(\n",
+    "            f\"{datetime.datetime.now().isoformat()} - epoch {epoch} complete - loss {loss.item()}\"\n",
+    "        )\n",
     "    return model"
    ]
   },
@@ -203,27 +208,37 @@
     "    device = torch.device(0)\n",
     "    in_progress_name = []\n",
     "    next_letter = \"\"\n",
-    "    while(not next_letter == \"+\" and len(in_progress_name) < 30):\n",
+    "    while not next_letter == \"+\" and len(in_progress_name) < 30:\n",
     "        # prep the data to run in the model again\n",
     "        in_progress_name_padded = in_progress_name[-str_len:]\n",
-    "        in_progress_name_padded = list((str_len - len(in_progress_name_padded)) * \"*\") + in_progress_name_padded\n",
+    "        in_progress_name_padded = (\n",
+    "            list((str_len - len(in_progress_name_padded)) * \"*\") + in_progress_name_padded\n",
+    "        )\n",
     "        in_progress_name_numeric = [characters.index(char) for char in in_progress_name_padded]\n",
     "        in_progress_name_tensor = torch.tensor(in_progress_name_numeric, device=device)\n",
-    "        in_progress_name_tensor = torch.nn.functional.one_hot(in_progress_name_tensor, num_classes=len(characters)).float()\n",
+    "        in_progress_name_tensor = torch.nn.functional.one_hot(\n",
+    "            in_progress_name_tensor, num_classes=len(characters)\n",
+    "        ).float()\n",
     "        in_progress_name_tensor = torch.unsqueeze(in_progress_name_tensor, 0)\n",
     "\n",
     "        # get the probabilities of each possible next character by running the model\n",
     "        with torch.no_grad():\n",
     "            next_letter_probabilities = model(in_progress_name_tensor)\n",
     "\n",
     "        next_letter_probabilities = next_letter_probabilities[0, -1, :]\n",
-    "        next_letter_probabilities = torch.nn.functional.softmax(next_letter_probabilities, dim=0).detach().cpu().numpy()\n",
+    "        next_letter_probabilities = (\n",
+    "            torch.nn.functional.softmax(next_letter_probabilities, dim=0).detach().cpu().numpy()\n",
+    "        )\n",
     "        next_letter_probabilities = next_letter_probabilities[1:]\n",
-    "        next_letter_probabilities = [p / sum(next_letter_probabilities) for p in next_letter_probabilities]\n",
+    "        next_letter_probabilities = [\n",
+    "            p / sum(next_letter_probabilities) for p in next_letter_probabilities\n",
+    "        ]\n",
     "\n",
     "        # determine what the actual letter is\n",
-    "        next_letter = characters[np.random.choice(len(characters) - 1, p=next_letter_probabilities) + 1]\n",
-    "        if(next_letter != \"+\"):\n",
+    "        next_letter = characters[\n",
+    "            np.random.choice(len(characters) - 1, p=next_letter_probabilities) + 1\n",
+    "        ]\n",
+    "        if next_letter != \"+\":\n",
     "            # if the next character isn't stop add the latest generated character to the name and continue\n",
     "            in_progress_name.append(next_letter)\n",
     "    # turn the list of characters into a single string\n",
@@ -290,4 +305,4 @@
  },
  "nbformat": 4,
  "nbformat_minor": 4
-}
+}
diff --git a/examples/pytorch/02-start-with-dask.ipynb b/examples/pytorch/02-start-with-dask.ipynb
@@ -48,7 +48,7 @@
     "@dask.delayed\n",
     "def lazy_exponent(args):\n",
     "    x, y = args\n",
-    "    '''Define a lazily evaluating function'''\n",
+    "    \"\"\"Define a lazily evaluating function\"\"\"\n",
     "    return x ** y"
    ]
   },
@@ -117,4 +117,4 @@
  },
  "nbformat": 4,
  "nbformat_minor": 4
-}
+}
diff --git a/examples/pytorch/03-start-with-pytorch-dask-multiple-models.ipynb b/examples/pytorch/03-start-with-pytorch-dask-multiple-models.ipynb
@@ -22,16 +22,26 @@
    "metadata": {},
    "outputs": [],
    "source": [
-    "import uuid # noqa\r\n",
-    "import datetime\r\n",
-    "import pickle # noqa\r\n",
-    "import json\r\n",
-    "import torch\r\n",
-    "import torch.nn as nn\r\n",
-    "import torch.optim as optim\r\n",
-    "import numpy as np # noqa\r\n",
-    "import urllib.request\r\n",
-    "import pandas as pd\r\n",
+    "import uuid  # noqa\n",
+    "\n",
+    "import datetime\n",
+    "\n",
+    "import pickle  # noqa\n",
+    "\n",
+    "import json\n",
+    "\n",
+    "import torch\n",
+    "\n",
+    "import torch.nn as nn\n",
+    "\n",
+    "import torch.optim as optim\n",
+    "\n",
+    "import numpy as np  # noqa\n",
+    "\n",
+    "import urllib.request\n",
+    "\n",
+    "import pandas as pd\n",
+    "\n",
     "from torch.utils.data import Dataset, DataLoader"
    ]
   },
@@ -55,13 +65,16 @@
     "    def get_substrings(in_str):\n",
     "        # add the stop character to the end of the name, then generate all the partial names\n",
     "        in_str = in_str + \"+\"\n",
-    "        res = [in_str[0: j] for j in range(1, len(in_str) + 1)]\n",
+    "        res = [in_str[0:j] for j in range(1, len(in_str) + 1)]\n",
     "        return res\n",
+    "\n",
     "    pet_names_expanded = [get_substrings(name) for name in pet_names]\n",
     "    pet_names_expanded = [item for sublist in pet_names_expanded for item in sublist]\n",
     "    pet_names_characters = [list(name) for name in pet_names_expanded]\n",
-    "    pet_names_padded = [name[-(str_len + 1):] for name in pet_names_characters]\n",
-    "    pet_names_padded = [list((str_len + 1 - len(characters)) * \"*\") + characters for characters in pet_names_padded]\n",
+    "    pet_names_padded = [name[-(str_len + 1) :] for name in pet_names_characters]\n",
+    "    pet_names_padded = [\n",
+    "        list((str_len + 1 - len(characters)) * \"*\") + characters for characters in pet_names_padded\n",
+    "    ]\n",
     "    pet_names_numeric = [[characters.index(char) for char in name] for name in pet_names_padded]\n",
     "\n",
     "    # the final x and y data to use for training the model. Note that the x data needs to be one-hot encoded\n",
@@ -184,13 +197,15 @@
     "            loss = criterion(batch_y_pred.transpose(1, 2), batch_y)\n",
     "            loss.backward()\n",
     "            optimizer.step()\n",
-    "            logger.info(f\"{datetime.datetime.now().isoformat()} - batch {i} - batch_size {batch_size} - lr {lr} - epoch {epoch} complete - loss {loss.item()}\")\n",
+    "            logger.info(\n",
+    "                f\"{datetime.datetime.now().isoformat()} - batch {i} - batch_size {batch_size} - lr {lr} - epoch {epoch} complete - loss {loss.item()}\"\n",
+    "            )\n",
     "        new_results = {\n",
     "            \"batch_size\": batch_size,\n",
     "            \"lr\": lr,\n",
     "            \"epoch\": epoch,\n",
     "            \"loss\": loss.item(),\n",
-    "            \"elapsed_time_sec\": (datetime.datetime.now() - training_start_time).total_seconds()\n",
+    "            \"elapsed_time_sec\": (datetime.datetime.now() - training_start_time).total_seconds(),\n",
     "        }\n",
     "        results.append(new_results)\n",
     "    return results"
@@ -236,19 +251,15 @@
    "source": [
     "results_concatenated = [item for sublist in results for item in sublist]\n",
     "results_df = pd.DataFrame.from_dict(results_concatenated)\n",
-    "results_df['experiment'] = \"bs=\" + results_df['batch_size'].astype(str) + \" lr=\" + results_df['lr'].astype(str)\n",
+    "results_df[\"experiment\"] = (\n",
+    "    \"bs=\" + results_df[\"batch_size\"].astype(str) + \" lr=\" + results_df[\"lr\"].astype(str)\n",
+    ")\n",
     "\n",
     "sns.set_theme()\n",
     "\n",
-    "sns.relplot(\n",
-    "    data=results_df,\n",
-    "    x=\"epoch\", y=\"loss\", col=\"experiment\", kind=\"line\"\n",
-    ")\n",
+    "sns.relplot(data=results_df, x=\"epoch\", y=\"loss\", col=\"experiment\", kind=\"line\")\n",
     "\n",
-    "sns.relplot(\n",
-    "    data=results_df,\n",
-    "    x=\"elapsed_time_sec\", y=\"loss\", col=\"experiment\", kind=\"line\"\n",
-    ")"
+    "sns.relplot(data=results_df, x=\"elapsed_time_sec\", y=\"loss\", col=\"experiment\", kind=\"line\")"
    ]
   }
  ],
@@ -273,4 +284,4 @@
  },
  "nbformat": 4,
  "nbformat_minor": 5
-}
+}
diff --git a/examples/pytorch/04-start-with-pytorch-dask-single-model.ipynb b/examples/pytorch/04-start-with-pytorch-dask-single-model.ipynb
@@ -37,7 +37,7 @@
     "import torch.optim as optim\n",
     "import numpy as np\n",
     "import urllib.request\n",
-    "import pandas as pd # noqa\n",
+    "import pandas as pd  # noqa\n",
     "from torch.utils.data import Dataset, DataLoader"
    ]
   },
@@ -61,13 +61,16 @@
     "    def get_substrings(in_str):\n",
     "        # add the stop character to the end of the name, then generate all the partial names\n",
     "        in_str = in_str + \"+\"\n",
-    "        res = [in_str[0: j] for j in range(1, len(in_str) + 1)]\n",
+    "        res = [in_str[0:j] for j in range(1, len(in_str) + 1)]\n",
     "        return res\n",
+    "\n",
     "    pet_names_expanded = [get_substrings(name) for name in pet_names]\n",
     "    pet_names_expanded = [item for sublist in pet_names_expanded for item in sublist]\n",
     "    pet_names_characters = [list(name) for name in pet_names_expanded]\n",
-    "    pet_names_padded = [name[-(str_len + 1):] for name in pet_names_characters]\n",
-    "    pet_names_padded = [list((str_len + 1 - len(characters)) * \"*\") + characters for characters in pet_names_padded]\n",
+    "    pet_names_padded = [name[-(str_len + 1) :] for name in pet_names_characters]\n",
+    "    pet_names_padded = [\n",
+    "        list((str_len + 1 - len(characters)) * \"*\") + characters for characters in pet_names_padded\n",
+    "    ]\n",
     "    pet_names_numeric = [[characters.index(char) for char in name] for name in pet_names_padded]\n",
     "\n",
     "    # the final x and y data to use for training the model. Note that the x data needs to be one-hot encoded\n",
@@ -180,7 +183,9 @@
     "\n",
     "    for epoch in range(num_epochs):\n",
     "        # the logger here logs to the dask log of each work, for easy debugging\n",
-    "        logger.info(f\"Worker {worker_rank} - {datetime.datetime.now().isoformat()} - Beginning epoch {epoch}\")\n",
+    "        logger.info(\n",
+    "            f\"Worker {worker_rank} - {datetime.datetime.now().isoformat()} - Beginning epoch {epoch}\"\n",
+    "        )\n",
     "\n",
     "        # this ensures the data is reshuffled each epoch\n",
     "        sampler.set_epoch(epoch)\n",
@@ -195,15 +200,21 @@
     "            loss.backward()\n",
     "            optimizer.step()\n",
     "\n",
-    "            logger.info(f\"Worker {worker_rank} - {datetime.datetime.now().isoformat()} - epoch {epoch} - batch {i} - batch complete - loss {loss.item()}\")\n",
+    "            logger.info(\n",
+    "                f\"Worker {worker_rank} - {datetime.datetime.now().isoformat()} - epoch {epoch} - batch {i} - batch complete - loss {loss.item()}\"\n",
+    "            )\n",
     "\n",
     "        # the first rh call saves a json file with the loss from the worker at the end of the epoch\n",
     "        rh.submit_result(\n",
     "            f\"logs/data_{worker_rank}_{epoch}.json\",\n",
-    "            json.dumps({'loss': loss.item(),\n",
-    "                        'time': datetime.datetime.now().isoformat(),\n",
-    "                        'epoch': epoch,\n",
-    "                        'worker': worker_rank})\n",
+    "            json.dumps(\n",
+    "                {\n",
+    "                    \"loss\": loss.item(),\n",
+    "                    \"time\": datetime.datetime.now().isoformat(),\n",
+    "                    \"epoch\": epoch,\n",
+    "                    \"worker\": worker_rank,\n",
+    "                }\n",
+    "            ),\n",
     "        )\n",
     "        # this saves the model. We only need to do it for one worker (so we picked worker 0)\n",
     "        if worker_rank == 0:\n",
@@ -283,27 +294,37 @@
     "def generate_name(model, characters, str_len):\n",
     "    in_progress_name = []\n",
     "    next_letter = \"\"\n",
-    "    while(not next_letter == \"+\" and len(in_progress_name) < 30):\n",
+    "    while not next_letter == \"+\" and len(in_progress_name) < 30:\n",
     "        # prep the data to run in the model again\n",
     "        in_progress_name_padded = in_progress_name[-str_len:]\n",
-    "        in_progress_name_padded = list((str_len - len(in_progress_name_padded)) * \"*\") + in_progress_name_padded\n",
+    "        in_progress_name_padded = (\n",
+    "            list((str_len - len(in_progress_name_padded)) * \"*\") + in_progress_name_padded\n",
+    "        )\n",
     "        in_progress_name_numeric = [characters.index(char) for char in in_progress_name_padded]\n",
     "        in_progress_name_tensor = torch.tensor(in_progress_name_numeric)\n",
-    "        in_progress_name_tensor = torch.nn.functional.one_hot(in_progress_name_tensor, num_classes=len(characters)).float()\n",
+    "        in_progress_name_tensor = torch.nn.functional.one_hot(\n",
+    "            in_progress_name_tensor, num_classes=len(characters)\n",
+    "        ).float()\n",
     "        in_progress_name_tensor = torch.unsqueeze(in_progress_name_tensor, 0)\n",
     "\n",
     "        # get the probabilities of each possible next character by running the model\n",
     "        with torch.no_grad():\n",
     "            next_letter_probabilities = model(in_progress_name_tensor)\n",
     "\n",
     "        next_letter_probabilities = next_letter_probabilities[0, -1, :]\n",
-    "        next_letter_probabilities = torch.nn.functional.softmax(next_letter_probabilities, dim=0).detach().cpu().numpy()\n",
+    "        next_letter_probabilities = (\n",
+    "            torch.nn.functional.softmax(next_letter_probabilities, dim=0).detach().cpu().numpy()\n",
+    "        )\n",
     "        next_letter_probabilities = next_letter_probabilities[1:]\n",
-    "        next_letter_probabilities = [p / sum(next_letter_probabilities) for p in next_letter_probabilities]\n",
+    "        next_letter_probabilities = [\n",
+    "            p / sum(next_letter_probabilities) for p in next_letter_probabilities\n",
+    "        ]\n",
     "\n",
     "        # determine what the actual letter is\n",
-    "        next_letter = characters[np.random.choice(len(characters) - 1, p=next_letter_probabilities) + 1]\n",
-    "        if(next_letter != \"+\"):\n",
+    "        next_letter = characters[\n",
+    "            np.random.choice(len(characters) - 1, p=next_letter_probabilities) + 1\n",
+    "        ]\n",
+    "        if next_letter != \"+\":\n",
     "            # if the next character isn't stop add the latest generated character to the name and continue\n",
     "            in_progress_name.append(next_letter)\n",
     "    # turn the list of characters into a single string\n",
@@ -390,4 +411,4 @@
  },
  "nbformat": 4,
  "nbformat_minor": 4
-}
+}