2016-04-22 12 views
0

私のラボでは多くのシーケンシングが行われていますが、シーケンスが記録されているため、データを取得したり、データを追跡することが困難です。 -Aデータのアップロード/取得/表示を可能にするグラフィカルユーザーインターフェイスで、BLASTへのリンクを迅速に組み込んだり、他のオンラインツールでシーケンスを分析したりすることができます。
は、実験室で何の記録を持っているGUI上の別のセクションを持っている - つまり、コマンドライン でそれにアクセスするための1を許可します、どのような私は、一般的なデータベースがあるかどうかを知りたいと思った生物学的データベースの作成:最初のステップ?

など注文する必要があります私の研究室のニーズに合わせて採用したり変更したりすることができるテンプレート?私はデータベース設計の経験はありませんが、mySQLについて読んでいます。

私はこのプロジェクトに着手するために最初に踏むべきステップは何ですか?

ありがとうございました!

答えて

1

これは興味深い質問と問題のドメインです(私は今、btwでexpierenceを持っています)。最初のステップは、一般的なアーキテクチャを決定し、そのためのテクノロジを選択することです。

Web /グラフィカルな面では、多くの棚のコンポーネントがあります(私はあなたがAntiSMASH、JBrowseなどのツールを認識していると思います)。しかし、あなたはこれらを評価する必要があります。しかし、db側の範囲外です。

データベース側では、ここではPostgreSQLが非常に優れています。私は、シークエンシングデータ、BLASTレポートなどを格納していた負荷の高い10 + TBのデータベースで作業しました。 PostBISのようなものを追加すると、かなり機能的なものが得られます。

しかし、業界のより重い部分は、利用可能なデータの量が非常に急速に増加しているため、その作業を行うために必要な専門知識の量も適切に高くなっているため、Hadoopを使用しています。

関連する問題