2012-03-06 30 views
0

C言語のテキストファイルからDNA配列を読み取り、それを配列に格納し、各ヌクレオチド位置から始まる所定の長さのすべての部分文字列を抽出する方法は?テキストファイルからDNA配列を読み取ってCの配列に格納する方法は?

例えば配列= 3サブストリングの長さがあれば、テキストファイル

cctgatagacgctatctggctatccaggtacttaggtcctctgtgcgaatctatgcgtttccaaccat

全ての出発位置

のすべてのサブストリングに次のようになります

cct、ctg、tga、gat、...、cat

+1

これでfasta/fastqファイルを解析します。http://lh3lh3.users.sourceforge.net/parsefastq.shtml非常に便利です。 – flies

答えて

0

C言語はあなたに義務付けられていますか?

私はこの機能を行うことになる、Pythonなど、より高いレベルの言語に移動する:

from itertools import count 

def iterate_fragments(sequence,size): 
    """Takes a string and yields pieces of given size.""" 
    for number in count(): 
     try: yield sequence[number:number+size] 
     except IndexError: break 

for fragment in iterate_fragments(dna_sequence,3): 
    print fragment 

この単純なコードは、各DNA断片(3つのヌクレオチドサイズ)を印刷します。

関連する問題