ncbi

    0

    1答えて

    GenBankでGI番号を段階的に削除していて、次の形式でヘッダーを編集した場所にいくつかのfastaファイルが保存されています。 >SomeText_ginumber 次のように私はNCBIおよび出力から各GIのためのヘッダーを持つファイルを、対応するアクセッション番号を取得することができることを、理想的にはPythonで、私もこれで始めるには考えてきませんが、方法があります: >SomeT

    1

    1答えて

    私はタンパク質IDの束を持っており、タンパク質IDを失うことなく対応するコード配列(CDS)を取得したいと思います。私は対応するCDSをダウンロードすることができましたが、残念ながら、CDS IDはNCBIのタンパク質IDと大きく異なります。 私は、次のRコードがあります。 library(rentrez) Prot_ids <- c("XP_.1","XP_004866438.1","XP_0

    1

    1答えて

    私は現在、職場でいくつかのコードを更新しようとしています。私は以前、NCBIのFTPウェブサイト(ftp://ftp.ncbi.nlm.nih.gov/)にユーザーのパス選択肢を記録するPythonの最新バージョンを含むスクリプトを作成しました。ログは私のファイルシステムを更新されたファイルで更新するのに使われました。私は基本的にホイールを作り直しました。上記のスクリプトは、NCBIのウェブサイト

    1

    1答えて

    NCBI SRAデータベースにアクセスし、IDリストを照会して出力を行列に保存しようとしています。 これを行うにはBioconductorのsradbパッケージを使用していますが、今はデータベースにアクセスしてクエリを実行できますが、実際には遅く、ループ出力を保存する方法を理解できませんでした。 GPL11154_GSMs.txtは、私が興味のIDを含むファイルそしてそれは次のようになります。 G

    0

    1答えて

    私はRの専門家ではありませんが、興味のある領域にある遺伝子を見つけるためにbiomaRtパッケージを使用することを学びたいと考えています。 私は次のコードでEnsemblのデータセットを使用して有効な出力を生成するために管理してきました :私は「EntrezGeneのは」NCBI遺伝子IDに対応していることを知っている > mart= useMart(biomart="ensembl",datas

    2

    1答えて

    は、私は、識別子の束を変換するために、これを使用したいが、私は分類学上のランクは、各分類コードに割り当てられているかを正確に知る必要があります。下に示すのはコンバージョンの例ですが、タクソノミの呼び出しのラベルを何にするかわかりません。基本的な分類学上のランクは以下のとおりです。(ドメイン、王国、門、クラス、順序、科、属、及び種)https://en.wikipedia.org/wiki/Taxo

    0

    1答えて

    私はループを経由して複数のGSMファイルをRにロードしようとしていますが、私は何か明白なものがないと思います。 #Use i to loop through NCBI files GSM9714940 through GSM971948 for (i in 971940:971948){ (GSMName <- paste("GSM", i, sep = "")) #Define t

    0

    1答えて

    私は、GSM .softファイルのメタデータから単一の値を抽出しようとしています。私はMeta(GSM971958)$characteristics_ch1[3]を使ってエラーなくこれを行うことができますが、同じタイプのコマンドをループ経由で変数で実行しようとするとエラーが発生します。私はなぜ前者がうまくいくのか分からないが後者はうまくいかない。 ここでエラーメッセージと私の完全なコードです: l

    0

    2答えて

    Bio.Entrezのefetch()がPMIDを入力としてPubMed記事のすべてのメタデータを取得するかどうかは疑問です。すべてのメタデータで、PubMedにはefetch()が取得する以上のメタデータがあるかどうかを意味します。 efetch(): "AbstractText": [ "Rotator cuff tendinopathy is a common source of

    1

    1答えて

    私は、Pythonスクリプトを使用して、テキストファイル内の複数のアクセッション番号のfastaシーケンスをダウンロードするのが難しいです。その後、私はエラーを取得 import sys from Bio import Entrez Entrez.email = "[email protected]" handle = Entrez.efetch(db="protein", id="EAS0