背景:私はフィールド1及び2の無線ソースのデータの4社のカタログ、そのうちの最初の(のは、CAT1を呼び出してみましょう()、赤経および赤緯にRAとDEC)の座標を与えるが与えられているPythonを使用して同様の座標をどのように一致させることができますか?
第2カタログ(CAT2)は、フィールド1のラジオソースおよび赤外線(IR)ソースのRAおよびDECを、第3カタログ(Cat3)はフィールド2のラジオおよびIRソースのRAおよびDecを、 Cat1)は、フィールド1と2の光源のRAとDecを示します。
Cat1には、フィールド2の約2000のソースがあります。 ;ソース1、ソース2、ソース3a、ソース3b、ソース3c、ソース4 ... Cat1はフィールド1に約3000のソースを持ちます。 Cat 1は.datファイルで、これはtexteditで開き、np.genfromtxtで使用する.txtに変換されます。
Cat2のフィールド1のソースは約1700です。 Cat3のフィールド2のソースは約1700です。 Cat2とCat3はNumbersで開いています.csvファイルです。
Cat4には、フィールド1のソースが約1200、フィールド2のソースが約700あります。Cat4はtexteditで開いている.datファイルで、np.genfromtxtで使用するために.txtに変換されます。
Cat1とCat4を.csvファイルに変換する方法もわかりました。
目的:
目標はCAT3からCat2の、CAT1とCAT4(フィールド1)、その後、RAおよび12月からRAおよび12月を与える1つのカタログにこれら四つのカタログを組み合わせることで、 Cat1とCat4のRAとDecがRAに最も近く、Cat1またはCat2のDecが同じソースとなる可能性が高いと言えるように、Cat1とCat4(フィールド2) 重複のレベルは変わりますが、プロットマーカーのサイズの精度内で、それぞれのCat2およびCat3ソースに対応するCat1およびCat4ソースがあることを示すデータの散布図を作成しました。 Cat1とCat4のソースには、Cat2とCat3よりも多くのソースが含まれています。
トリックは、座標が正確に一致しないため、まずRAを見て最適な一致する値を見つけて、それに対応するDecを見て、それが最良の対応値であることを確認する必要があります。
例えば、Cat2のソースの場合:RA = 53.13360595、12月= -28.0530758
CAT1:RA = 53.133496、12月= -27.553401 またはRA = 53.133873、ここでは12月= -28.054600
、 53.1336は53.1334と53.1338の間で等しくなりますが、明らかに-28.053は-27.553より-28.054に近く、Cat1の2番目の選択肢が勝者です。
進捗状況:
は、これまでのところ、私は(そして、最善の判断を使用して、できるだけ多くの小数点以下の桁にFコマンド+)目で純粋CAT1の値にCat2の最初の15の値と一致したが、明確にこれは、Cat2とCat3のすべての3400のソースに対して非常に非効率的です。私はちょうどマッチングにどのような正確さが期待されているのか自分自身で見たいと思っていました。残念なことに、小数点第2位または第3位に一致するものもあれば、第4または第5にマッチするものもあります。私の散布図を生成するには
が、私はコードを使用:次に
cat1 = np.genfromtext('filepath/cat1.txt', delimiter = ' ')
RA_cat1 = cat1[:,][:,0]
Dec_cat1 = cat1[:,][:,1]
を単にDec_cat1に対してRA_cat1をプロットし、すべての私のカタログのために繰り返しました。
私の問題は、座標を一致させるコードをどのように生成するかについての回答を検索する際に、配列をリストに変換することに関連する多くの答えを見てきましたが、
cat1list = np.array([RA_cat1, Dec_cat1])
cat1list.tolist()
私は最終的にフォームのリストを作成します。
[RA1、RA2、RA3、...、RA3000]、[DEC1、DEC2、DEC3、...、Dec3000]
代わりに、私はより参考になると仮定し何の。
[RA1、DEC1]、[RA2、DEC2]、...、[RA3000、Dec3000]。
また、同様の質問のために、リストの変換が成功した場合の最も有用な答えは、辞書を使用するように見えますが、辞書を使用して上記で説明した種類の比較を生成する方法は不明です。
さらに、私がこの作業に成功すると、かなり大きなデータセットの処理を繰り返すように求められていますが、どれほど大きいか分かりませんが、数千の座標セットの