2017-02-14 9 views
-7

私はこのように見える.csv形式のデータ行はほとんどありません。来月の患者数を予測する

speciality,year,month,count 
"general",2016,1,100 
"general",2015,1,110 
"general",2014,1,105 
"cardiolody",2016,1,60 
"cardiology",2015,1,58 
..... 
..... 

ここで、第1列は、100人の患者が一般医学カテゴリの医師によって治療されたことを示している。同様の4列目は、2016年1月に60人の患者が心臓病専門医によって治療されたことを示しています.2017年1月の月のように、次の月に出現する専門分野別の患者数を予測したいと考えています。 R言語、PythonやSpark.Thanksを使用して私の問題に(回帰が好ましい)機械学習ソリューションを提案してください別のCSVファイルの形式と

speciality,month,prediction_of_patients 

でなければなりません。

+1

はSOへようこそ!あなたの質問は、a)広すぎるb)プログラミングのperseに関連していない。このため、私は質問を閉じることをお勧めします。プログラミングに関するより具体的な質問がある場合は、新しい質問を投稿してください。 –

+0

これは非常に意見に基づいて閉じられるべきです、スタックオーバーフローに関する質問は解決策への以前の研究を示すべきです – WhatsThePoint

+0

[スタック交換](http://stats.stackexchange.com)では、モデル、プログラミングについてより。 – LAP

答えて

0

予言者が少ないようです。したがって、私はブースティングのような柔軟なアプローチの使用をお勧めします。

しかし、私はあなたが欲しい何

0

時系列予測」または「時系列解析」を検索してください。 3または4だけでなく、過去の値がある場合には、時系列の予測が簡単です。 NARMAX、ARIMA、Volterraシリーズ、リカレントニューラルネットワークなどのいくつかのモデルがあります...良いリンクはhttp://machinelearningmastery.com/time-series-prediction-lstm-recurrent-neural-networks-python-keras/またはhttps://iamtrask.github.io/2015/11/15/anyone-can-code-lstm/ ですもの...

0

...あなたは予測変数の数与えられた正確な結果を持っていないだろうと信じては明らかではないが、あなたが統計をプロットしたい場合は、Matplolibを使用することができます。

http://matplotlib.org/

あなたはscikit-学ぶ使用することができ、分類および予測を行うために

http://scikit-learn.org/stable/

関連する問題