1

TensorFlowの例のCifar10の例では、クロッピング、フリッピング、ブライトネス、コントラスト、ホワイトニングのランダムな組み合わせで画像が歪んでいます。このコンセプトは、切り抜きが私にとってちょっと奇妙なことを除いて意味があります。イメージは、ネットワークのために同じ寸法である必要がありますし、トリミングコードは次のようになります。高さと幅は、画像サイズが、これは実際には何をやっているに基づいているのでTensorFlow - Cifar10の例でrandom_cropとは何ですか?

height = IMAGE_SIZE 
    width = IMAGE_SIZE 

    # Image processing for training the network. Note the many random 
    # distortions applied to the image. 

    # Randomly crop a [height, width] section of the image. 
    distorted_image = tf.random_crop(reshaped_image, [height, width, 3]) 

答えて

1

この例では、IMAGE_SIZE24に設定されています。したがって、基本的にこのコードはランダムに選択されたオフセットを選択し、24 X 24パッチを抽出します。おそらく、オフセットがラップアラウンドやその他の奇妙な境界条件なしに抽出できるように、あるいはそれを埋め込んで(チェックしやすいように)パッチが選択されるようにします。

IMAGE_SIZEPATCH_SIZEなどの名前が付けられていると思います。オリジナルのCIFAR 10入力イメージが32 x 32

+0

であることに注意してください。 –

+0

@bradden_​​gross助けてくれるのはうれしい! –

関連する問題