2016-08-23 3 views

答えて

0

ウェブ検索でこれを行うにはツールが存在しないことを明らかに読み込むための方法を見つけることができません。そのようなPLINKあなたが使用してVCFにPEDを変換することができ

http://genome.sph.umich.edu/wiki/EPACTS#VCF_file_for_Genotypes

plink --file prefix --recode vcf --out prefix 

あなたが追加をいじる必要があるかもしれませんEPACTSはこれを受け入れているようだとして、あなたは、VCF形式を使用して検討する必要がありますオプションはspecfically、それはhttps://www.cog-genomics.org/plink2/data#recodeを参照してください、あなたが望む出力を生成するために取得する:

The 'vcf', 'vcf-fid', and 'vcf-iid' modifiers result in production of a 
VCFv4.2 file. 'vcf-fid' and 'vcf-iid' cause family IDs and within-family IDs 
respectively to be used for the sample IDs in the last header row, while 
'vcf' merges both IDs and puts an underscore between them (in this case, a 
warning will be given if an ID already contains an underscore). 
    If the 'bgz' modifier is added, the VCF file is block-gzipped. (Gzipping 
of other --recode output files is not currently supported.) 
    The A2 allele is saved as the reference and normally flagged as not 
based on a real reference genome ('PR' INFO field value). When it is 
important for reference alleles to be correct, you'll usually also want to 
include --a2-allele and --real-ref-alleles in your command. 
0

EPACTSは、iとVCFとPEDファイルの両方を必要とします関連分析のためのnput。 PLINK documentationに記載されているPEDファイルとは異なり、EPACTSで使用されるPEDファイルには遺伝子型データが含まれていません。その目的は、表現型データと共変量を保持することであり、EPACTSによって認識されるには.ped拡張子が必要です。

RのデータフレームをPEDファイルとしてエクスポートするには、.ped拡張子が必要であることを指定するだけです。次のコマンドを使用できます。

write.table(df, filename.ped, sep="\t", row.names=F, col.names=T, quote=F) 

EPACTSでは、列名を含むヘッダー行をコメントアウトする必要もあります。私は通常、この手順を手動で行います。なぜなら、 '#'での追加は非常に速く、私はいつもファイルを開いてとにかくチェックするからです。代わりに、col.names = Fを設定し、EPACTSのドキュメントに示すように.datファイルを使用することもできます。https://genome.sph.umich.edu/wiki/EPACTS#PED_file_for_Phenotypes_and_Covariates

関連する問題