Initial Commit

caiyishu · Aug 10, 2017 · 78b7a03 · 78b7a03
commit 78b7a03
Show file tree

Hide file tree

Showing 6 changed files with 281 additions and 0 deletions.
diff --git a/Annotations.tar.gz b/Annotations.tar.gz
diff --git a/Images.tar.gz b/Images.tar.gz
diff --git a/README.md b/README.md
@@ -0,0 +1,2 @@
+### Predicting First Impressions with Deep Learning
+<https://arxiv.org/abs/1610.08119>
diff --git a/Spaces.tar.gz b/Spaces.tar.gz
diff --git a/augmentation.py b/augmentation.py
@@ -0,0 +1,75 @@
+def addConstantOcclusion(originalImage, space):
+    from numpy import uint8
+    from random import randint
+    h,w = originalImage.shape[:2]
+    x2,y2,x1,y1,pct_area = 0,0,0,0,0
+    max_area = space['occl_min_area'] + space['occl_area_distance']
+    while x2 == x1 or y2 == y1 or pct_area < space['occl_min_area'] or pct_area > max_area:
+        x1,y1 = (float(randint(0,w)), float(randint(0,h)))
+        x2,y2 = (float(randint(0,w)), float(randint(0,h)))
+        if x1 > x2: x1, x2 = x2, x1
+        if y1 > y2: y1, y2 = y2, y1
+        pct_area = ((x2-x1)*(y2-y1))/(w*h)
+
+    originalImage[int(y1):int(y2), int(x1):int(x2)] = uint8(0)
+    return originalImage
+
+
+def randomNoise(originalImage, space):
+    import numpy as np
+    from random import uniform
+    h,w = originalImage.shape[:2]
+    noise_freq = uniform(space['noise_min_freq_pct'], space['noise_max_freq_pct']) / 100.
+    prob_mask = np.random.uniform(0, 1, (h,w))
+    originalImage[np.where(prob_mask < noise_freq)] = 0
+    return originalImage
+
+
+def changeBrightness(originalImage, space):
+    from random import randint
+    from numpy import uint8, where, zeros_like, float64
+    brighten_min = int(space['brighten_extent_min'])
+    brighten_max = int(space['brighten_extent_max'])
+    amountToBrighten = randint(brighten_min, brighten_max)
+    newImage = float64(originalImage)
+    if amountToBrighten > 0:
+        newImage[where(newImage + amountToBrighten < 255)] += float64(amountToBrighten)
+        newImage[newImage + amountToBrighten >= 255] = 255.
+    else:
+        newImage[where(originalImage + amountToBrighten > 0)] += float64(amountToBrighten)
+        newImage[where(originalImage + amountToBrighten <= 0)] = 0.
+    return uint8(newImage)
+
+
+def histogramEqualization(originalImage, space):
+    from cv2 import equalizeHist
+    equalized = equalizeHist(originalImage)
+    return equalized
+
+
+def gaussianBlur(originalImage, space):
+    from cv2 import GaussianBlur
+    from random import randint
+    min_blur = int(space['blur_extent_min'])
+    max_blur = min_blur + int(space['blur_extent_distance'])
+    amountToBlur = randint(min_blur, max_blur)
+    if amountToBlur % 2 == 0: amountToBlur += 1
+    return GaussianBlur(originalImage, (int(amountToBlur), int(amountToBlur)),0)
+
+
+def horizontalFlip(originalImage, space):
+    from cv2 import flip
+    return flip(originalImage, flipCode=1)
+
+
+def applyRandomAugmentation(originalImage, space):
+    from random import uniform
+
+    should_run = lambda pctprob: (uniform(0, 99)) <= pctprob
+
+    augmentations = [gaussianBlur, histogramEqualization, addConstantOcclusion, changeBrightness, randomNoise, horizontalFlip]
+    for fn in augmentations:
+        if should_run(space[fn.__name__ + '_pctprob']):
+            originalImage = fn(originalImage, space)
+
+    return originalImage
diff --git a/train.py b/train.py
@@ -0,0 +1,204 @@
+import matplotlib
+matplotlib.use('Agg')
+import pandas as pd
+from scipy.stats.mstats import linregress
+import imageio
+import os
+from clint.textui import progress
+from random import uniform
+import augmentation
+from keras.models import Sequential
+from keras.layers import Convolution2D, Dense, Flatten, MaxPooling2D, Dropout
+
+
+def parse_csv(CSV):
+    df = pd.read_csv(CSV, delim_whitespace=False, header=0, index_col=0)
+    return df
+
+
+def load_data_into_memory(DIR, ANNO, ATTRIBUTE, normalize=True, rollaxis=True):
+    if DIR[:-1] != '/': DIR += '/'
+    df = parse_csv(ANNO)
+    files = filter(lambda x: x in df.index.values, os.listdir(DIR))
+    X, y = [], []
+    for image_path in progress.bar(files):
+        img = imageio.imread(DIR + image_path)
+        if normalize: img = img.astype('float32') / 255.
+        if rollaxis: img.shape = (1,150,130)
+        else: img.shape = (150,130,1)
+        X.append(img)
+        mu = df[ATTRIBUTE][image_path]
+        y.append(mu)
+    y = np.array(y)
+    y = y - min(y)
+    y = np.float32(y / max(y))
+
+    x, y = np.array(X), np.array(y)
+    print 'Loaded {} images into memory'.format(len(y))
+    return x, y
+
+
+def data_generator(x, y, batch_size, space, sampling_factor=3, sampling_intercept=2, weighted_sampling=False, augment=False):
+    if weighted_sampling:
+
+        def get_bin_index(bin_edges, value):
+            for index in range(len(bin_edges)):
+                if value <= bin_edges[index + 1]:
+                    return index
+            return index
+
+        hist, bin_edges = np.histogram(y, bins=200)
+        most = max(hist)
+        hist_norm = hist / float(most)
+        hist_norm_inv = (1. - hist_norm)
+        hist_norm_inv = hist_norm_inv ** sampling_factor + 10 ** -sampling_intercept
+        probs = []
+        for y_ in y:
+            index = get_bin_index(bin_edges, y_)
+            probs.append(hist_norm_inv[index])
+
+        should_sample = lambda pctprob: uniform(0,1) <= pctprob
+
+    i = 0
+    while True:
+        Xbatch, ybatch, in_batch = [], [], 0
+        while in_batch < batch_size:
+            if weighted_sampling:
+                while not should_sample(probs[i]):
+                    i = i + 1 if i + 1 < len(y) else 0
+            if augment: x_ = augmentation.applyRandomAugmentation(x[i], space)
+            else: x_ = x[i]
+            x_ = x_.astype('float32') / 255.
+            x_.shape = (1, 150, 130)
+            Xbatch.append(x_)
+            ybatch.append(y[i])
+            in_batch += 1
+            i = i + 1 if i + 1 < len(y) else 0
+
+        yield np.array(Xbatch), np.array(ybatch)
+
+
+def vgg_variant(space):
+    model = Sequential()
+
+    for outputs in space['conv0filters']:
+        model.add(Convolution2D(outputs, 3, 3, border_mode='same', input_shape=(1, 150, 130), init='glorot_uniform',
+                                bias=True, activation='relu'))
+        model.add(Convolution2D(outputs, 3, 3, border_mode='same', bias=True, activation='relu'))
+        model.add(MaxPooling2D(pool_size=(2, 2), strides=(2, 2)))
+
+    for outputs in space['conv1filters']:
+        model.add(Convolution2D(outputs, 3, 3, border_mode='same', init='glorot_uniform', bias=True, activation='relu'))
+        model.add(Convolution2D(outputs, 3, 3, border_mode='same', init='glorot_uniform', bias=True, activation='relu'))
+        model.add(MaxPooling2D(pool_size=(2, 2), strides=(2, 2)))
+
+    for outputs in space['conv2filters']:
+        model.add(Convolution2D(outputs, 3, 3, border_mode='same', init='glorot_uniform', bias=True, activation='relu'))
+        model.add(Convolution2D(outputs, 3, 3, border_mode='same', init='glorot_uniform', bias=True, activation='relu'))
+        model.add(Convolution2D(outputs, 3, 3, border_mode='same', init='glorot_uniform', bias=True, activation='relu'))
+        model.add(MaxPooling2D(pool_size=(2, 2), strides=(2, 2)))
+
+    model.add(Flatten())
+
+    for _ in range(int(space['num_fc'])):
+        model.add(Dense(int(space['fcoutput']), init='glorot_uniform', bias=True, activation='relu'))
+        model.add(Dropout(space['dropout']))
+
+    model.add(Dense(1, init='glorot_uniform', bias=True))
+
+    return model
+
+
+def get_Rsquared(y, predicted):
+    m, b, r, p, e = linregress(y=y, x=predicted)
+    r2 = r**2
+    return r2
+
+
+def get_metrics(model, x, y):
+    predicted = model.predict(x)
+    r2 = get_Rsquared(y, predicted)
+    return r2
+
+
+def train(Xtrain, ytrain, Xtrain_norm, ytrain_norm, Xvalidate, yvalidate, space):
+    import sys
+    from keras.optimizers import RMSprop
+    from keras.callbacks import Callback
+
+    class CorrelationEarlyStopping(Callback):
+        def __init__(self, monitor='validate', patience=0, delta=.001):
+            """
+            :param monitor: 'validate' or 'train'
+            :param patience: how many epochs to wait
+            :param delta: by how much the monitored value has to be greater than the last maximum
+            """
+            self.rvalues = {'train': [], 'validate': []}
+            self.monitor = monitor  # validate, train
+            self.patience = patience
+            self.delta = delta
+            self.wait = 0
+            self.best = 0
+            self.num_epochs = 0
+            self.best_model = None
+
+        def on_epoch_end(self, epoch, logs={}):
+            r2 = get_metrics(self.model, x=Xtrain_norm, y=ytrain_norm)
+            self.rvalues['train'].append(r2)
+            r2 = get_metrics(self.model, x=Xvalidate, y=yvalidate)
+            self.rvalues['validate'].append(r2)
+            print ('\n\tTrain r2: {}\n\tValidate r2: {}\n'.format(self.rvalues['train'][-1], self.rvalues['validate'][-1]))
+            sys.stdout.flush()
+
+            if self.rvalues[self.monitor][-1] - self.delta >= self.best:
+                self.best = self.rvalues[self.monitor][-1]
+                self.wait = 0
+                self.num_epochs = epoch
+                self.best_model = self.model
+            else:
+                if self.wait >= self.patience:
+                    self.num_epochs = epoch - self.patience
+                    self.model.stop_training = True
+                else:
+                    self.num_epochs = epoch
+                    self.wait += 1
+
+    model = vgg_variant(space)
+    lr = 10**(-space['learning_rate'])
+    rmsprop = RMSprop(lr=lr, rho=0.9, epsilon=1e-08)
+    model.compile(loss='mean_squared_error', optimizer=rmsprop)
+    monitor = CorrelationEarlyStopping(monitor='validate', patience=6, delta=0.01)
+    gen = data_generator(Xtrain, ytrain, batch_size=space['batch_size'], space=space,
+                         weighted_sampling=space['weighted_sampling'], augment=space['augment'],
+                         sampling_factor=space['sampling_factor'], sampling_intercept=space['sampling_intercept'])
+    model.fit_generator(gen, space['samples_per_epoch'], 50, 1, [monitor], (Xvalidate, yvalidate))
+    return monitor.best_model, monitor.rvalues
+
+
+if __name__ == '__main__':
+
+    import numpy as np
+    import sys
+    import json
+
+    ATTRIBUTE = 'IQ'
+
+    ANNO = 'Annotations/' + ATTRIBUTE + '/annotations.csv'
+    TRAIN_DIR = 'Images/' + ATTRIBUTE + '/Train/'
+    VAL_DIR = 'Images/' + ATTRIBUTE + '/Validate/'
+    TEST_DIR = 'Images/' + ATTRIBUTE + '/Test/'
+
+    SPACE_FILE = 'Spaces/' + ATTRIBUTE + '/' + ATTRIBUTE + '_space.json'
+    MODEL_PATH = 'Models/' + ATTRIBUTE + '.h5'
+
+    print('Loading Train Data')
+    Xtrain, ytrain = load_data_into_memory(DIR=TRAIN_DIR, ANNO=ANNO, ATTRIBUTE=ATTRIBUTE, normalize=False, rollaxis=False)
+    print('Loading Train Data Again')
+    Xtrain_norm, ytrain_norm = load_data_into_memory(DIR=TRAIN_DIR, ANNO=ANNO, ATTRIBUTE=ATTRIBUTE, normalize=True, rollaxis=True)
+    print('Loading Validation Data')
+    Xvalidate, yvalidate = load_data_into_memory(DIR=VAL_DIR, ANNO=ANNO, ATTRIBUTE=ATTRIBUTE, normalize=True, rollaxis=True)
+
+    with open(SPACE_FILE, 'r') as f:
+        opt_params = json.load(f)
+        model, results = train(Xtrain, ytrain, Xtrain_norm, ytrain_norm, Xvalidate, yvalidate, opt_params)
+        model.save(MODEL_PATH)
Original file line number	Diff line number	Diff line change
		@@ -0,0 +1,2 @@
		### Predicting First Impressions with Deep Learning
		<https://arxiv.org/abs/1610.08119>