Merge branch 'fall19' of github.com:yandexdataschool/practical_dl into fall19

justheuristic · justheuristic · commit 10c4a558a5ea · 2019-11-22T18:02:22.000+03:00
diff --git a/week08_autoencoders/autoencoders_torch.ipynb b/week08_autoencoders/autoencoders_torch.ipynb
@@ -222,9 +222,9 @@
     "        self.enc = nn.Sequential(View(-1, np.prod(img_shape)), nn.Linear(np.prod(img_shape), code_size))\n",
     "        self.dec = nn.Sequential(nn.Linear(code_size, np.prod(img_shape)), View(-1, img_shape[0], img_shape[1], img_shape[2])) \n",
     "    \n",
-    "    def batch_loss(self, batch):\n",
+    "    def batch_loss(self, batch, reference):\n",
     "        reconstruction = #<Your code: define reconstruction object>\n",
-    "        return torch.mean((batch - reconstruction)**2)\n",
+    "        return torch.mean((reference - reconstruction)**2)\n",
     "    "
    ]
   },
@@ -245,21 +245,43 @@
    "metadata": {},
    "outputs": [],
    "source": [
-    "def train(model, dataset, num_epoch=32):\n",
+    "from tqdm import tqdm\n",
+    "def train(model, dataset, dataset_test, num_epoch=32, gd=None, noise_function=None, noise_function_params=None):\n",
     "    model.double()\n",
     "    model.to(device)\n",
-    "    gd = optim.Adamax(model.parameters(), lr=0.002)\n",
+    "    if gd is None:\n",
+    "        gd = optim.Adamax(model.parameters(), lr=0.002)\n",
+    "    if noise_function_params is None:\n",
+    "        noise_function_params = {}\n",
+    "    \n",
     "    dataloader = DataLoader(dataset, batch_size=BATCH_SIZE, shuffle=True)\n",
     "    losses = []\n",
+    "    dataloader_test = DataLoader(dataset_test, batch_size=BATCH_SIZE, shuffle=True)\n",
+    "    scores = []\n",
+    "\n",
     "    for epoch in range(num_epoch):\n",
-    "        for i, (batch) in enumerate(dataloader):\n",
+    "        model.train(True)\n",
+    "        for i, (batch) in tqdm(enumerate(dataloader)):\n",
     "            gd.zero_grad()\n",
-    "            loss = model.batch_loss(batch.to(device=device))\n",
+    "            if noise_function is not None:\n",
+    "                batch_noised = noise_function(batch, **noise_function_params).to(device=device)\n",
+    "                loss = model.batch_loss(batch_noised, batch.to(device=device))\n",
+    "            else:\n",
+    "                batch = batch.to(device=device)\n",
+    "                loss = model.batch_loss(batch, batch)\n",
     "            (loss).backward()\n",
     "            losses.append(loss.data.cpu().numpy())\n",
     "            gd.step()\n",
     "            gd.zero_grad()\n",
-    "        print(\"#%i, Train loss: %.7f\"%(epoch+1,np.mean(losses)),flush=True)"
+    "        train_mse = np.mean(losses[-(i+1):])\n",
+    "        \n",
+    "        model.train(False)\n",
+    "        for i, (batch) in enumerate(dataloader_test):\n",
+    "            batch = batch.to(device=device)\n",
+    "            scores.append(model.batch_loss(batch, batch).data.cpu().numpy())\n",
+    "        test_mse  = np.mean(scores[-(i+1):])\n",
+    "\n",
+    "        print(f\"{epoch+1}, Train loss: {train_mse}, Test loss: {test_mse}\")"
    ]
   },
   {
@@ -270,7 +292,9 @@
    "source": [
     "def visualize(img, model):\n",
     "    \"\"\"Draws original, encoded and decoded images\"\"\"\n",
+    "    model.train(False)\n",
     "    code = model.enc(img[None].cuda(device = device))\n",
+    "\n",
     "    reco = model.dec(code)\n",
     "\n",
     "    plt.subplot(1,3,1)\n",
@@ -341,7 +365,7 @@
    ],
    "source": [
     "aenc = pca_autoencoder()\n",
-    "train(aenc, X_train_tensor, 40)"
+    "train(aenc, X_train_tensor, X_test_tensor, 40)"
    ]
   },
   {
@@ -361,7 +385,8 @@
     "dataloader_test = DataLoader(X_test_tensor, batch_size=BATCH_SIZE, shuffle=True)\n",
     "scores = []\n",
     "for i, (batch) in enumerate(dataloader_test):\n",
-    "    scores.append(aenc.batch_loss(batch.cuda(device = device)).data.cpu().numpy())\n",
+    "    batch = batch.to(device=device)\n",
+    "    scores.append(aenc.batch_loss(batch, batch).data.cpu().numpy())\n",
     "print (np.mean(scores))"
    ]
   },
@@ -468,10 +493,56 @@
     "        self.enc = #<Your code: define encoder as per instructions above>\n",
     "        self.dec = #<Your code: define decoder as per instructions above>\n",
     "    \n",
-    "    def batch_loss(self, batch):\n",
+    "    def batch_loss(self, batch, reference):\n",
     "        a = self.enc(batch)\n",
     "        reconstruction = self.dec(a)\n",
-    "        return torch.mean((batch - reconstruction)**2)"
+    "        return torch.mean((reference - reconstruction)**2)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 53,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Testing code size 1\n",
+      "Testing code size 8\n",
+      "Testing code size 32\n",
+      "Testing code size 128\n",
+      "Testing code size 512\n",
+      "Testing code size 1024\n",
+      "All tests passed!\n"
+     ]
+    }
+   ],
+   "source": [
+    "#Check autoencoder shapes along different code_sizes\n",
+    "get_dim = lambda layer: np.prod(layer.output_shape[1:])\n",
+    "for code_size in [1,8,32,128,512,1024]:\n",
+    "    help_tensor = next(iter(DataLoader(X_train_tensor, batch_size=BATCH_SIZE)))\n",
+    "    model = pca_autoencoder_deep(code_size).double().to(device)\n",
+    "    encoder_out = model.enc(help_tensor.cuda(device))\n",
+    "    decoder_out = model.dec(encoder_out)\n",
+    "    print(\"Testing code size %i\" % code_size)\n",
+    "\n",
+    "    assert encoder_out.shape[1:]==torch.Size([code_size]),\"encoder must output a code of required size\"\n",
+    "    assert decoder_out.shape[1:]==img_shape,   \"decoder must output an image of valid shape\"\n",
+    "\n",
+    "    assert (len(list(model.dec.children())) >= 6),  \"decoder must contain at least 3 dense layers\"\n",
+    "\n",
+    "print(\"All tests passed!\")"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "__Hint:__ if you're getting \"Encoder layer is smaller than bottleneck\" error, use code_size when defining intermediate layers. \n",
+    "\n",
+    "For example, such layer may have code_size*2 units."
    ]
   },
   {
@@ -538,7 +609,7 @@
    ],
    "source": [
     "aenc_deep = pca_autoencoder_deep()\n",
-    "train(aenc_deep, X_train_tensor, 50)"
+    "train(aenc_deep, X_train_tensor, X_test_tensor, 50)"
    ]
   },
   {
@@ -548,52 +619,6 @@
     "Training may take long, it's okay."
    ]
   },
-  {
-   "cell_type": "code",
-   "execution_count": 53,
-   "metadata": {},
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Testing code size 1\n",
-      "Testing code size 8\n",
-      "Testing code size 32\n",
-      "Testing code size 128\n",
-      "Testing code size 512\n",
-      "Testing code size 1024\n",
-      "All tests passed!\n"
-     ]
-    }
-   ],
-   "source": [
-    "#Check autoencoder shapes along different code_sizes\n",
-    "get_dim = lambda layer: np.prod(layer.output_shape[1:])\n",
-    "for code_size in [1,8,32,128,512,1024]:\n",
-    "    help_tensor = next(iter(DataLoader(X_train_tensor, batch_size=BATCH_SIZE)))\n",
-    "    model = pca_autoencoder_deep(code_size).to(device)\n",
-    "    encoder_out = model.enc(help_tensor.cuda(device))\n",
-    "    decoder_out = model.dec(encoder_out)\n",
-    "    print(\"Testing code size %i\" % code_size)\n",
-    "\n",
-    "    assert encoder_out.shape[1:]==torch.Size([code_size]),\"encoder must output a code of required size\"\n",
-    "    assert decoder_out.shape[1:]==img_shape,   \"decoder must output an image of valid shape\"\n",
-    "\n",
-    "    assert (len(list(model.dec.children())) >= 6),  \"decoder must contain at least 3 dense layers\"\n",
-    "\n",
-    "print(\"All tests passed!\")"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "__Hint:__ if you're getting \"Encoder layer is smaller than bottleneck\" error, use code_size when defining intermediate layers. \n",
-    "\n",
-    "For example, such layer may have code_size*2 units."
-   ]
-  },
   {
    "cell_type": "code",
    "execution_count": 55,
@@ -668,11 +693,13 @@
     }
    ],
    "source": [
+    "aenc_deep.train(False)\n",
     "dataloader_test = DataLoader(X_test_tensor, batch_size=BATCH_SIZE, shuffle=True)\n",
     "scores = []\n",
     "for i, (batch) in enumerate(dataloader_test):\n",
-    "    scores.append(aenc_deep.batch_loss(batch.cuda(device = device)).data.cpu().numpy())\n",
-    "    encoder_out = aenc_deep.enc(batch.cuda(device = device))\n",
+    "    batch = batch.to(device=device)\n",
+    "    scores.append(aenc_deep.batch_loss(batch, batch).data.cpu().numpy())\n",
+    "    encoder_out = aenc_deep.enc(batch)\n",
     "reconstruction_mse  = np.mean(scores)\n",
     "\n",
     "assert reconstruction_mse <= 0.0055, \"Compression is too lossy. See tips below.\"\n",
@@ -774,54 +801,11 @@
     "plt.subplot(1,4,1)\n",
     "plt.imshow(X[0].transpose([1,2,0]))\n",
     "plt.subplot(1,4,2)\n",
-    "plt.imshow(apply_gaussian_noise(X[:1],sigma=0.01)[0].transpose([1,2,0]).clip(0, 1))\n",
+    "plt.imshow(apply_gaussian_noise(X[:1],sigma=0.01).data.numpy()[0].transpose([1,2,0]).clip(0, 1))\n",
     "plt.subplot(1,4,3)\n",
-    "plt.imshow(apply_gaussian_noise(X[:1],sigma=0.1)[0].transpose([1,2,0]).clip(0, 1))\n",
+    "plt.imshow(apply_gaussian_noise(X[:1],sigma=0.1).data.numpy()[0].transpose([1,2,0]).clip(0, 1))\n",
     "plt.subplot(1,4,4)\n",
-    "plt.imshow(apply_gaussian_noise(X[:1],sigma=0.5)[0].transpose([1,2,0]).clip(0, 1))"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 166,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "def train_noise(model, dataset, num_epoch=50):\n",
-    "    model.double()\n",
-    "    model.to(device)\n",
-    "    gd = optim.Adamax(model.parameters(), lr=0.002)\n",
-    "    dataloader = DataLoader(dataset, batch_size=BATCH_SIZE, shuffle=True)\n",
-    "    losses = []\n",
-    "    for epoch in range(num_epoch):\n",
-    "        for i, (batch) in enumerate(dataloader):\n",
-    "            gd.zero_grad()\n",
-    "            loss = model.batch_loss(batch.cuda(device=device))\n",
-    "            (loss).backward()\n",
-    "            losses.append(loss.data.cpu().numpy())\n",
-    "            gd.step()\n",
-    "            gd.zero_grad()\n",
-    "        print(\"#%i, Train loss: %.7f\"%(epoch + 1, np.mean(losses)), flush=True)"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 167,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "X_train_noise = apply_gaussian_noise(X_train)\n",
-    "X_test_noise = apply_gaussian_noise(X_test)"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 161,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "X_train_tensor_n = torch.from_numpy(X_train_noise).type(torch.DoubleTensor)\n",
-    "X_test_tensor_n = torch.Tensor(X_test_noise).type(torch.DoubleTensor)"
+    "plt.imshow(apply_gaussian_noise(X[:1],sigma=0.5).data.numpy()[0].transpose([1,2,0]).clip(0, 1))"
    ]
   },
   {
@@ -888,7 +872,7 @@
    ],
    "source": [
     "aenc = pca_autoencoder()\n",
-    "train(aenc, X_train_tensor_n, 50)"
+    "train(aenc, X_train_tensor, X_test_tensor, 50, noise_function=apply_gaussian_noise)"
    ]
   },
   {
@@ -974,16 +958,17 @@
     }
    ],
    "source": [
-    "dataloader_test = DataLoader(X_test_tensor_n, batch_size=BATCH_SIZE, shuffle=True)\n",
+    "dataloader_test = DataLoader(X_test_tensor, batch_size=BATCH_SIZE, shuffle=True)\n",
     "scores = []\n",
     "for i, (batch) in enumerate(dataloader_test):\n",
-    "    scores.append(aenc.batch_loss(batch.cuda(device = device)).data.cpu().numpy())\n",
-    "    encoder_out = aenc.enc(batch.cuda(device = device))\n",
+    "    batch_noised = apply_gaussian_noise(batch).to(device=device)\n",
+    "    scores.append(aenc.batch_loss(batch_noised, batch.cuda(device = device)).data.cpu().numpy())\n",
+    "    encoder_out = aenc.enc(batch_noised)\n",
     "reconstruction_mse  = np.mean(scores)\n",
     "\n",
     "print(\"Final MSE:\", reconstruction_mse)\n",
     "for i in range(5):\n",
-    "    img = X_test_tensor_n[i]\n",
+    "    img = apply_gaussian_noise(X_test_tensor[i])\n",
     "    visualize(img,aenc)"
    ]
   },
@@ -1365,7 +1350,7 @@
    "name": "python",
    "nbconvert_exporter": "python",
    "pygments_lexer": "ipython3",
-   "version": "3.6.8"
+   "version": "3.7.3"
   }
  },
  "nbformat": 4,