2016-04-15 11 views
0

基本的に私は2つの大きなfasta配列ファイルを持っています。最初のものはプロテオームfasta配列(すべてのタンパク質配列)同じ生物の転写因子配列fastaファイルです、私はこれらの2つのファイルを使用してfastaファイルとして非転写配列を抽出することができる方法があるかどうか疑問に思っていますか?多くのありがとう同じ生物の別のfastaファイル(tf)を参照するファイルからfasta配列(プロテオーム)を得る

答えて

0

答えはありますが、本質的にアルゴリズムは以下の通りです。

  1. 転写因子配列を読み取り、ハッシュまたは dictとして保存する。
  2. プロテオームfasta配列をスキャンし、シーケンス/位置が でない場合は、配列/リストに追加します。
  3. スキャンした後、アレイ/リストを取り出し、目的のフォーマットで出力します。

私がハッシュ/ディクテーションを言う理由は、これをPythonや他の言語で行うかどうかによって決まります。

関連する問題