私は8列のPythonで2D行列を持っています。 これらの8つの列は、それぞれが4つの列を持つ2つの異なるエンティティ、たとえばAとBのレコードを保持します。に基づいて、エンティティAの属性を合わせ、シンプルな言葉でnumpy行列データセットの変換
╔══════╦═════════╦══════╦═════════╗
║ A_ID ║ arrtibA ║ B_ID ║ attribB ║
╠══════╬═════════╬══════╬═════════╣
║ 1 ║ val ║ 1 ║ val ║
║ 1 ║ val ║ 1 ║ val ║
║ 2 ║ val ║ 2 ║ val ║
║ 2 ║ val ║ 2 ║ val ║
║ 3 ║ val ║ 3 ║ val ║
╚══════╩═════════╩══════╩═════════╝
、およびエンティティB:私の例のデータは、次のようになります。
╔══════╦═════════╦══════╦═════════╗
║ A_ID ║ arrtibA ║ B_ID ║ attribB ║
╠══════╬═════════╬══════╬═════════╣
║ 1 ║ val ║ 1 ║ val ║
║ 1 ║ val ║ 1 ║ val ║
║ 1 ║ val ║ 2 ║ val ║
║ 1 ║ val ║ 2 ║ val ║
║ 2 ║ val ║ 3 ║ val ║
║ 2 ║ val ║ 3 ║ val ║
║ 2 ║ val ║ 4 ║ val ║
║ 3 ║ val ║ 5 ║ val ║
║ 3 ║ val ║ 5 ║ val ║
╚══════╩═════════╩══════╩═════════╝
そして、私がこの形式に変換したいですそれぞれのID。一致するものが見つからない行は破棄できます。私は約28,000以上の行を持っています.A_IDの範囲は17〜230、B_IDの範囲は17〜305です。しかし、一度整列が行われると、両方のエンティティのIDが231未満の行は、エンティティBの231〜305は破棄されます。
。 'pandas'にはDataframesがあります。 Numpyには配列しかありません。私はMCVの例である – hpaulj