Dev (#13)

jakubczakon · web-flow · commit f3784b304f71 · 2018-09-04T16:49:26.000+02:00
* Result exploration (#11) * fixed oof saving and plotting * fixed exploration notebook * Augmentations (#12) * dropped redundant loaders, updated augmentations, fixed edge option, updated notebook * exp * updated augs, updated prediction saving
diff --git a/augmentations.ipynb b/augmentations.ipynb
@@ -8,16 +8,13 @@
    "source": [
     "%matplotlib inline\n",
     "\n",
-    "import sys\n",
-    "sys.path.append('../')\n",
-    "\n",
     "import numpy as np\n",
     "import glob\n",
     "from PIL import Image\n",
     "import matplotlib.pyplot as plt\n",
     "\n",
-    "from src.augmentation import iaa\n",
-    "from src.utils import plot_list"
+    "from common_blocks.augmentation import iaa, PadFixed, RandomCropFixedSize\n",
+    "from common_blocks.utils import plot_list"
    ]
   },
   {
@@ -27,9 +24,11 @@
    "outputs": [],
    "source": [
     "IMG_DIR = 'YOUR/DIR'\n",
-    "IMG_IDX = 18\n",
+    "IMG_DIR = '/mnt/ml-team/minerva/open-solutions/salt/data/train/images'\n",
+    "\n",
+    "IMG_IDX = 592\n",
     "img_filepath = sorted(glob.glob('{}/*'.format(IMG_DIR)))[IMG_IDX]\n",
-    "img = np.array(Image.open(img_filepath))\n",
+    "img = np.array(Image.open(img_filepath)).astype(np.uint8)\n",
     "plt.imshow(img)"
    ]
   },
@@ -50,13 +49,14 @@
     "#     General\n",
     "    iaa.SomeOf((1, 2),\n",
     "               [iaa.Fliplr(0.5),\n",
-    "                iaa.Affine(rotate=(-10, 10),\n",
-    "                           translate_percent={\"x\": (-0.25, 0.25)}, mode='symmetric'),\n",
+    "                iaa.Affine(rotate=(-10, 10), \n",
+    "                           translate_percent={\"x\": (-0.05, 0.05)},\n",
+    "                           mode='edge'),                \n",
     "                ]),\n",
     "#     Deformations\n",
     "    iaa.Sometimes(0.3, iaa.PiecewiseAffine(scale=(0.04, 0.08))),\n",
     "    iaa.Sometimes(0.3, iaa.PerspectiveTransform(scale=(0.05, 0.1))),\n",
-    "], random_order=True)\n"
+    "], random_order=True)"
    ]
   },
   {
@@ -122,6 +122,45 @@
     "plot_list(images=aug_imgs)"
    ]
   },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "# Resize+Pad+Augmentations\n",
+    "proposed by Heng CherKeng"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "def resize_pad_seq(resize_target_size, pad_method, pad_size):\n",
+    "    seq = iaa.Sequential([\n",
+    "        affine_seq,\n",
+    "        iaa.Scale({'height': resize_target_size, 'width': resize_target_size}),\n",
+    "        PadFixed(pad=(pad_size, pad_size), pad_method=pad_method),\n",
+    "    ], random_order=False)\n",
+    "    return seq\n",
+    "\n",
+    "heng_seq = resize_pad_seq(101,'edge',13)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "AUG_NR = 6\n",
+    "aug_imgs = []\n",
+    "for _ in range(AUG_NR):\n",
+    "    aug_img = heng_seq.augment_image(img)\n",
+    "    aug_imgs.append(aug_img)\n",
+    "plot_list(images=aug_imgs)"
+   ]
+  },
   {
    "cell_type": "code",
    "execution_count": null,
diff --git a/common_blocks/augmentation.py b/common_blocks/augmentation.py
@@ -3,7 +3,7 @@
 import imgaug as ia
 from imgaug import augmenters as iaa
 
-from .utils import get_crop_pad_sequence, reseed
+from common_blocks.utils import get_crop_pad_sequence, reseed
 
 
 def _perspective_transform_augment_images(self, images, random_state, parents, hooks):
@@ -36,7 +36,9 @@ def _perspective_transform_augment_images(self, images, random_state, parents, h
     iaa.SomeOf((1, 2),
                [iaa.Fliplr(0.5),
                 iaa.Affine(rotate=(-10, 10),
-                           translate_percent={"x": (-0.25, 0.25)}, mode='symmetric'),
+                           translate_percent={"x": (-0.05, 0.05)},
+                           mode='edge'),
+                # iaa.CropAndPad(percent=((0.0, 0.0), (0.05, 0.0), (0.0, 0.0), (0.05, 0.0)))
                 ]),
     # Deformations
     iaa.Sometimes(0.3, iaa.PiecewiseAffine(scale=(0.04, 0.08))),
@@ -69,22 +71,36 @@ def _perspective_transform_augment_images(self, images, random_state, parents, h
 ], random_order=False)
 
 
+def resize_seq(resize_target_size):
+    seq = iaa.Sequential([
+        affine_seq,
+        iaa.Scale({'height': resize_target_size, 'width': resize_target_size}),
+    ], random_order=False)
+    return seq
+
+
 def resize_pad_seq(resize_target_size, pad_method, pad_size):
     seq = iaa.Sequential([
+        affine_seq,
         iaa.Scale({'height': resize_target_size, 'width': resize_target_size}),
         PadFixed(pad=(pad_size, pad_size), pad_method=pad_method),
-        affine_seq,
     ], random_order=False)
     return seq
 
 
+def resize_to_fit_net(resize_target_size):
+    seq = iaa.Sequential(iaa.Scale({'height': resize_target_size, 'width': resize_target_size}))
+    return seq
+
+
 def pad_to_fit_net(divisor, pad_mode, rest_of_augs=iaa.Noop()):
-    return iaa.Sequential(InferencePad(divisor, pad_mode), rest_of_augs)
+    seq = iaa.Sequential(InferencePad(divisor, pad_mode), rest_of_augs)
+    return seq
 
 
 class PadFixed(iaa.Augmenter):
     PAD_FUNCTION = {'reflect': cv2.BORDER_REFLECT_101,
-                    'replicate': cv2.BORDER_REPLICATE,
+                    'edge': cv2.BORDER_REPLICATE,
                     }
 
     def __init__(self, pad=None, pad_method=None, name=None, deterministic=False, random_state=None):
diff --git a/common_blocks/loaders.py b/common_blocks/loaders.py
@@ -329,7 +329,7 @@ def get_datagen(self, X, tta_params, loader_params):
         return datagen, steps
 
 
-class ImageSegmentationLoaderResizePad(ImageSegmentationLoaderBasic):
+class ImageSegmentationLoader(ImageSegmentationLoaderBasic):
     def __init__(self, train_mode, loader_params, dataset_params, augmentation_params):
         super().__init__(train_mode, loader_params, dataset_params, augmentation_params)
 
@@ -345,7 +345,8 @@ def __init__(self, train_mode, loader_params, dataset_params, augmentation_param
         self.image_augment_train = ImgAug(self.augmentation_params['image_augment_train'])
         self.image_augment_with_target_train = ImgAug(self.augmentation_params['image_augment_with_target_train'])
         self.image_augment_inference = ImgAug(self.augmentation_params['image_augment_inference'])
-        self.image_augment_with_target_inference = ImgAug(self.augmentation_params['image_augment_with_target_inference'])
+        self.image_augment_with_target_inference = ImgAug(
+            self.augmentation_params['image_augment_with_target_inference'])
 
         if self.dataset_params.target_format == 'png':
             self.dataset = ImageSegmentationPngDataset
@@ -355,7 +356,7 @@ def __init__(self, train_mode, loader_params, dataset_params, augmentation_param
             raise Exception('files must be png or json')
 
 
-class ImageSegmentationLoaderPadTTA(ImageSegmentationLoaderBasicTTA):
+class ImageSegmentationLoaderTTA(ImageSegmentationLoaderBasicTTA):
     def __init__(self, loader_params, dataset_params, augmentation_params):
         super().__init__(loader_params, dataset_params, augmentation_params)
 
@@ -369,53 +370,8 @@ def __init__(self, loader_params, dataset_params, augmentation_params):
                                                   ])
 
         self.image_augment_inference = ImgAug(self.augmentation_params['image_augment_inference'])
-        self.image_augment_with_target_inference = ImgAug(self.augmentation_params['image_augment_with_target_inference'])
-        self.dataset = ImageSegmentationTTADataset
-
-
-class ImageSegmentationLoaderResize(ImageSegmentationLoaderBasic):
-    def __init__(self, train_mode, loader_params, dataset_params, augmentation_params):
-        super().__init__(train_mode, loader_params, dataset_params, augmentation_params)
-
-        self.image_transform = transforms.Compose([transforms.Resize((self.dataset_params.h, self.dataset_params.w)),
-                                                   transforms.Grayscale(num_output_channels=3),
-                                                   transforms.ToTensor(),
-                                                   transforms.Normalize(mean=self.dataset_params.MEAN,
-                                                                        std=self.dataset_params.STD),
-                                                   ])
-        self.mask_transform = transforms.Compose([transforms.Resize((self.dataset_params.h, self.dataset_params.w),
-                                                                    interpolation=0),
-                                                  transforms.Lambda(to_array),
-                                                  transforms.Lambda(to_tensor),
-                                                  ])
-
-        self.image_augment_train = ImgAug(self.augmentation_params['image_augment_train'])
-        self.image_augment_with_target_train = ImgAug(self.augmentation_params['image_augment_with_target_train'])
-
-        if self.dataset_params.target_format == 'png':
-            self.dataset = ImageSegmentationPngDataset
-        elif self.dataset_params.target_format == 'json':
-            self.dataset = ImageSegmentationJsonDataset
-        else:
-            raise Exception('files must be png or json')
-
-
-class ImageSegmentationLoaderResizeTTA(ImageSegmentationLoaderBasicTTA):
-    def __init__(self, loader_params, dataset_params, augmentation_params):
-        super().__init__(loader_params, dataset_params, augmentation_params)
-
-        self.image_transform = transforms.Compose([transforms.Resize((self.dataset_params.h, self.dataset_params.w)),
-                                                   transforms.Grayscale(num_output_channels=3),
-                                                   transforms.ToTensor(),
-                                                   transforms.Normalize(mean=self.dataset_params.MEAN,
-                                                                        std=self.dataset_params.STD),
-                                                   ])
-        self.mask_transform = transforms.Compose([transforms.Resize((self.dataset_params.h, self.dataset_params.w),
-                                                                    interpolation=0),
-                                                  transforms.Lambda(to_array),
-                                                  transforms.Lambda(to_tensor),
-                                                  ])
-
+        self.image_augment_with_target_inference = ImgAug(
+            self.augmentation_params['image_augment_with_target_inference'])
         self.dataset = ImageSegmentationTTADataset
 
 
diff --git a/common_blocks/models.py b/common_blocks/models.py
@@ -25,8 +25,8 @@
                                      'init_weights': False},
                        'ResNet152': {'model': UNetResNet,
                                      'model_config': {'encoder_depth': 152,
-                                                      'num_filters': 32, 'dropout_2d': 0.2,
-                                                      'pretrained': True, 'is_deconv': False,
+                                                      'num_filters': 32, 'dropout_2d': 0.0,
+                                                      'pretrained': True, 'is_deconv': True,
                                                       },
                                      'init_weights': False},
                        'SaltLinkNet': {'model': SaltLinkNet,
diff --git a/common_blocks/pipelines.py b/common_blocks/pipelines.py
@@ -4,16 +4,14 @@
 from steppy.adapter import Adapter, E
 
 from . import loaders
-from .utils import make_apply_transformer, FineTuneStep
-from .postprocessing import crop_image, resize_image, binarize
+from .utils import make_apply_transformer
+from .postprocessing import binarize
 
 
 def preprocessing_train(config, model_name='unet', suffix=''):
     if config.general.loader_mode == 'resize_and_pad':
-        Loader = loaders.ImageSegmentationLoaderResizePad
         loader_config = config.loaders.resize_and_pad
     elif config.general.loader_mode == 'resize':
-        Loader = loaders.ImageSegmentationLoaderResize
         loader_config = config.loaders.resize
     else:
         raise NotImplementedError
@@ -47,7 +45,7 @@ def preprocessing_train(config, model_name='unet', suffix=''):
         raise NotImplementedError
 
     loader = Step(name='loader{}'.format(suffix),
-                  transformer=Loader(train_mode=True, **loader_config),
+                  transformer=loaders.ImageSegmentationLoader(train_mode=True, **loader_config),
                   input_steps=[reader_train, reader_inference],
                   adapter=Adapter({'X': E(reader_train.name, 'X'),
                                    'y': E(reader_train.name, 'y'),
@@ -60,10 +58,8 @@ def preprocessing_train(config, model_name='unet', suffix=''):
 
 def preprocessing_inference(config, model_name='unet', suffix=''):
     if config.general.loader_mode == 'resize_and_pad':
-        Loader = loaders.ImageSegmentationLoaderResizePad
         loader_config = config.loaders.resize_and_pad
     elif config.general.loader_mode == 'resize':
-        Loader = loaders.ImageSegmentationLoaderResize
         loader_config = config.loaders.resize
     else:
         raise NotImplementedError
@@ -86,7 +82,7 @@ def preprocessing_inference(config, model_name='unet', suffix=''):
         raise NotImplementedError
 
     loader = Step(name='loader{}'.format(suffix),
-                  transformer=Loader(train_mode=False, **loader_config),
+                  transformer=loaders.ImageSegmentationLoader(train_mode=False, **loader_config),
                   input_steps=[reader_inference],
                   adapter=Adapter({'X': E(reader_inference.name, 'X'),
                                    'y': E(reader_inference.name, 'y'),
@@ -98,10 +94,8 @@ def preprocessing_inference(config, model_name='unet', suffix=''):
 
 def preprocessing_inference_tta(config, model_name='unet', suffix=''):
     if config.general.loader_mode == 'resize_and_pad':
-        Loader = loaders.ImageSegmentationLoaderPadTTA
         loader_config = config.loaders.pad_tta
     elif config.general.loader_mode == 'resize':
-        Loader = loaders.ImageSegmentationLoaderResizeTTA
         loader_config = config.loaders.resize_tta
     else:
         raise NotImplementedError
@@ -135,7 +129,7 @@ def preprocessing_inference_tta(config, model_name='unet', suffix=''):
         raise NotImplementedError
 
     loader = Step(name='loader{}'.format(suffix),
-                  transformer=Loader(**loader_config),
+                  transformer=loaders.ImageSegmentationLoaderTTA(**loader_config),
                   input_steps=[tta_generator],
                   adapter=Adapter({'X': E(tta_generator.name, 'X_tta'),
                                    'tta_params': E(tta_generator.name, 'tta_params'),
@@ -158,28 +152,12 @@ def aggregator(name, model, tta_generator, experiment_directory, config):
 
 
 def mask_postprocessing(config, suffix=''):
-    if config.general.loader_mode == 'resize_and_pad':
-        size_adjustment_function = partial(crop_image, target_size=config.general.original_size)
-    elif config.general.loader_mode == 'resize':
-        size_adjustment_function = partial(resize_image, target_size=config.general.original_size)
-    else:
-        raise NotImplementedError
-
-    mask_resize = Step(name='mask_resize{}'.format(suffix),
-                       transformer=make_apply_transformer(size_adjustment_function,
-                                                          output_name='resized_images',
-                                                          apply_on=['images']),
-                       input_data=['input_masks'],
-                       adapter=Adapter({'images': E('input_masks', 'mask_prediction'),
-                                        }),
-                       experiment_directory=config.execution.experiment_dir)
-
     binarizer = Step(name='binarizer{}'.format(suffix),
                      transformer=make_apply_transformer(partial(binarize, threshold=config.thresholder.threshold_masks),
                                                         output_name='binarized_images',
                                                         apply_on=['images']),
-                     input_steps=[mask_resize],
-                     adapter=Adapter({'images': E(mask_resize.name, 'resized_images'),
+                     input_data=['input_masks'],
+                     adapter=Adapter({'images': E('input_masks', 'resized_images'),
                                       }),
                      experiment_directory=config.execution.experiment_dir)
     return binarizer
diff --git a/main.py b/main.py
diff --git a/result_exploration.ipynb b/result_exploration.ipynb