Kerasにおける"Flatten"の役割は何ですか？

Question

さらに

ソース非AMP版編集

Kerasにおける"Flatten"の役割は何ですか？

KerasのFlatten関数の役割を理解しようとしています。下記は私のコードで、単純な2層ネットワークです。形状 (3, 2) の2次元データを取り込み、形状 (1, 4) の1次元データを出力する：

model = Sequential()
model.add(Dense(16, input_shape=(3, 2)))
model.add(Activation('relu'))
model.add(Flatten())
model.add(Dense(4))
model.compile(loss='mean_squared_error', optimizer='SGD')

x = np.array([[[1, 2], [3, 4], [5, 6]]])

y = model.predict(x)

print y.shape

これはyの形状が(1, 4)であることを出力する。しかし、Flatten行を削除すると、yの形状は(1, 3, 4)と出力される。

これは理解できない。私のニューラルネットワークの理解では、model.add(Dense(16, input_shape=(3, 2)))関数は16個のノードを持つ隠れ全結合層を作成している。これらのノードはそれぞれ3x2の入力要素に接続されています。したがって、この第1層の出力の16個のノードは、すでに"flat"である。したがって、第1層の出力形状は(1, 16)となる。そして第2層はこれを入力とし、(1, 4)のデータを出力する。

では、第1層の出力がすでに(1, 16)の形状でquot;flat"なのであれば、なぜさらに平坦化する必要があるのでしょうか？

nbro

編集された質問 15日 10月 2019 в 4:54

プログラミング

machine-learning neural-network tensorflow deep-learning keras

5日 4月 2017 в 4:48

まだビューはありません

prosti

ソース非AMP版編集

short read:

prosti

編集した答え 26日 6月 2019 в 8:40

19

0

解説 (1)

Mahesh Kembhavi

ソース非AMP版編集

[ここに画像の説明を入力]1.

これが、Matrixを1つの配列に変換するFlattenの動作です。

14

0

解説 (2)

Marcin Możejko · Accepted Answer · 2017-04-05T17:20:43+00:00

ここのDenseのドキュメントを読めばわかるだろう：

Dense(16, input_shape=(5,3))

は3つの入力と16の出力を持つ Dense ネットワークになり、5つのステップのそれぞれに独立して適用されます。D(x)が3次元のベクトルを16次元のベクトルに変換する場合、そのレイヤーの出力は一連のベクトルになります：D(x[0,:], D(x[1,:],..., D(x[4,:]], shape (5, 16)。指定した振る舞いをするためには、まず入力を15次元のベクトルに Flatten してから Dense を適用します：

model = Sequential()
model.add(Flatten(input_shape=(3, 2)))
model.add(Dense(16))
model.add(Activation('relu'))
model.add(Dense(4))
model.compile(loss='mean_squared_error', optimizer='SGD')

EDIT: 理解するのに苦労している人もいるようなので、ここに説明画像がある：

[ここに画像の説明を入力してください]1。