Kerasで学習したモデルを使って入力画像を予測するには?
私はkerasや機械学習全般を始めたばかりです。
画像を2つのクラスに分類するモデルを学習し、model.save()
を使って保存しました。私が使用したコードは以下の通りです。
from keras.preprocessing.image import ImageDataGenerator
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D
from keras.layers import Activation, Dropout, Flatten, Dense
from keras import backend as K
# dimensions of our images.
img_width, img_height = 320, 240
train_data_dir = 'data/train'
validation_data_dir = 'data/validation'
nb_train_samples = 200 #total
nb_validation_samples = 10 # total
epochs = 6
batch_size = 10
if K.image_data_format() == 'channels_first':
input_shape = (3, img_width, img_height)
else:
input_shape = (img_width, img_height, 3)
model = Sequential()
model.add(Conv2D(32, (3, 3), input_shape=input_shape))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Conv2D(32, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Conv2D(64, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Flatten())
model.add(Dense(64))
model.add(Activation('relu'))
model.add(Dropout(0.5))
model.add(Dense(1))
model.add(Activation('sigmoid'))
model.compile(loss='binary_crossentropy',
optimizer='rmsprop',
metrics=['accuracy'])
# this is the augmentation configuration we will use for training
train_datagen = ImageDataGenerator(
rescale=1. / 255,
shear_range=0.2,
zoom_range=0.2,
horizontal_flip=True)
# this is the augmentation configuration we will use for testing:
# only rescaling
test_datagen = ImageDataGenerator(rescale=1. / 255)
train_generator = train_datagen.flow_from_directory(
train_data_dir,
target_size=(img_width, img_height),
batch_size=batch_size,
class_mode='binary')
validation_generator = test_datagen.flow_from_directory(
validation_data_dir,
target_size=(img_width, img_height),
batch_size=batch_size,
class_mode='binary')
model.fit_generator(
train_generator,
steps_per_epoch=nb_train_samples // batch_size,
epochs=epochs,
validation_data=validation_generator,
validation_steps=5)
model.save('model.h5')
0.98の精度で学習に成功しましたが、これはかなり良い結果です。このモデルを新しい画像にロードしてテストするには、以下のコードを使用しました。
from keras.models import load_model
import cv2
import numpy as np
model = load_model('model.h5')
model.compile(loss='binary_crossentropy',
optimizer='rmsprop',
metrics=['accuracy'])
img = cv2.imread('test.jpg')
img = cv2.resize(img,(320,240))
img = np.reshape(img,[1,320,240,3])
classes = model.predict_classes(img)
print classes
出力されます。
と表示されますが、[[0]]と表示されます。
なぜ、クラスの実際の名前を出さないのか、なぜ[[0]]
なのか?
宜しくお願いします。
35
3
もし、まだ画像での予測に悩んでいる人がいたら、保存したモデルを読み込んで予測するための最適化されたコードを紹介します。
keras predict_classes (docs) outputs クラス予測のnumpy配列です。このモデルの場合、最後の(ソフトマックス)レイヤーで最も活性化されたニューロンのインデックスです。0]]
は、テストデータがクラス0であるとモデルが予測したことを意味します(通常、複数の画像を渡すので、結果は
[[0], 1, 1, [0]]`のようになります)。実際のラベル(例:'cancer', 'not cancer')をバイナリ分類のためにバイナリエンコーディング('cancer' なら
0
, 'not cancer' なら1
)に変換する必要があります。そうすると、シーケンスの出力である[[0]]
はクラスラベル'cancer'
を持つと解釈されます。model.predict()`を使って,次のように1枚の画像のクラスを予測することができます[doc].
この例では,画像を
(1, height, width, channels)
という形状のnumpy
配列として読み込みます.そして,その画像をモデルに読み込み,クラスを予測します.このクラスは,[0, 1]の範囲の実数値として返されます(この例ではバイナリ分類).