2017-10-21 3 views
0
でspatialScaleに問題

私は次のコードがありますから取ら高速R-CNNとBrainScript

model (features, rois) = { 

     convOut = convLayers (features) 
     roiOut = ROIPooling (convOut, rois, (9:9),spatialScale=64.0/196.0) 
     z = fcLayers (roiOut) 


    }.z 

オリジナル:検出\ FastRCNN \ BrainScript \ cntk \例を\画像

ROIPoolingでspatialScaleは何ですかどのように計算するのですか?

これがcntk.exeの出力で見つかった場合は、

検証中 - > z.convOut.z.rn3.rr = RectifiedLinear(z.convOut.z.rn3.rr_):[49 x 49 x 64 x *] - > [49 x 49 x 64 x *]

検証 - >のROI = inputValueで(): - > 4×1000×*]

検証 - > z.roiOut = ROIPooling(z.convOut.z.rn3.rr、関心領域):[49×49×64×]、[4×1000×*] - > [9×9×64×1000×*]

答えて

1

空間的なスケールは、 ROIとネットワークへの入力画像の空間分解能を提供します。 1/16.0は、元々のFast and Faster R-CNNの実装で使用された値です。この値はネットワークに依存します。

ほとんどの空間スケールは、元の画像と比較してROIへの入力のスケールです。

おかげで、
エマド

+0

だから私の例では、私は、64×64のROIと196x196の入力画像が備わっていています。これにより、spatialScale = 64/196 = 0,32 –

+0

ROIノードの入力解像度はどのようになりますか?ROIサイズは決まります。 –

+0

あなたが正しく理解していれば、あなたはroiOutへの入力解像度を求めています。私は、質問に対する解決策であると思うものを加えました。 –