私は、数百の数字の最大長のリストから短い数字系列を特定する汎用アルゴリズムを探しています。これは、質量分析(ms1)データから一連の質量を同定するために使用されます。例えば数値シリーズを識別する一般的なアルゴリズムはありますか?
、次のリストを与え、私はこれらの数字の3は、一連N + 1、N +2に適合することを特定したいと思いますが、等
426.24 <= N
427.24 <= N + 1/x
371.10
428.24 <= N + 2/x
851.47
451.16
一連のフォーマットの全てです。 N、N + 1/x、N + 2/x、N + 3/x、N + 4/xなどであり、xは整数である(この例ではx = 1)。私はこの制約が問題を非常に扱いやすくすると思う。 Rでこれに取り組むためのすばやく/効率的な方法の提案はありますか?
私はこれがRの質問ではないと思います。あなたがアルゴリズムを持っていて、Rで効率的に実装する方法を知りたければ、それは理にかなっています。とにかくNを知っていますか?すべての値からNを引くことができます。また、要件が何であるかは明確ではありませんか? –
Nは系列の最初の数として経験的に決定することができる。すべての値からNを差し引いて重複した値を探すのは、実際にはかなり良い解決策です。 –
この例では、 'diff(sort(x))'を見れば、それは明らかです。しかし、他の値がシリーズ値と重なっているとうまくいきません。 – Gregor