2016-04-06 16 views
0

私はこのデータを持っているが、私は探索的分析を実行したいとスタッフの強度は、受信したアプリケーションに応じて成長しているかどうかを比較したい規模の面で2つの全く異なる変数のグラフを作成する方法は?

data of Staff strength and total Applications received

df <- data.frame(year = seq(1970, 2015, by = 5), 
       staff = c(219, 231, 259, 352, 448, 427, 556, 555, 602, 622), 
       applications = c(5820, 7107, 6135, 16119, 19381, 36611, 54962, 45759, 40358, 458582)) 

を設定します。私は、Excelを使って折れ線グラフをプロットしました: enter image description here

これはあまり意味がありません。 私は両方の変数のログを取って、ほとんど望みの結果を得ましたが、ログを持つグラフが非数学者には説明できないのだろうかと思います。私は統計や数学をあまり知らない経営幹部にプレゼンテーションでこの種のグラフを使用したいのです。 私の質問は、意味のあるグラフを描くためにこの状況に取り組む方法です。 RはExcelよりも優れたソリューション(これが私がここで尋ねた理由)を持っているかもしれないと感じていますが、問題は「どのように」ですか?

ご協力いただければ幸いです。

+0

、あなたはfree_yでファセットを使用することができます。 – Gopala

+0

アプリケーションの最終番号が間違いや誤字ではありませんか?あなたのプロットでは、 "santioned"の代わりにy軸を置いて、圧縮しないようにすることができます。相関を計算することができます。 – fishtank

+0

@fishtank .. 2011年に採用されたオンラインアプリケーションシステムは、アプリケーションの数が劇的に増えたので間違いではありません。 –

答えて

3

メジャーをある種の比率メトリックに変更することをお勧めします。たとえば、staff per applicationsとなります。以下では、私がstaff per 1,000 applicationsを使用します。

library(ggplot2) 

df <- data.frame(year = seq(1970, 2015, by = 5), 
       staff = c(219, 231, 259, 352, 448, 427, 556, 555, 602, 622), 
       applications = c(5820, 7107, 6135, 16119, 19381, 36611, 54962, 45759, 40358, 458582)) 

ggplot(data = df, aes(x = year, y = staff/(applications/1000))) + 
    geom_point(size = 3) + 
    geom_line() + 
    ggtitle("Staff per 1,000 Applications") 

Plot 01

我々がggplot2せずに同じ結果を得ることができます。

また
with(df, 
     plot(x = year, y = staff/(applications/1000), type = "l", main = "Staff per 1,000 Applications") + 
     points(x = year, y = staff/(applications/1000), pch = 21, cex = 2, bg = "black") 
    ) 

Base R Plot


、あなたは可能性がありあなたのデータを作るもう少しきちんと設定(詳細はthisthis、および/またはthisを参照)、それらにfree_yスケールを持つ2つのファセットをプロット:

library(tidyr) 

df_tidy <- gather(df, measure, value, -year) 

ggplot(data = df_tidy, aes(x = year, y = value)) + 
    geom_point(size = 3) + 
    geom_line() + 
    facet_grid(measure ~ ., scales = "free_y") 

Plot 02

+0

問題を解決し、あなたの種類の返信をありがとう! –

1

enter image description here

we can use this process: 



        library(ggplot2) 
        library(reshape2) 
        ggplot(df, aes(year)) + 
        geom_line(aes(y = staff, colour = "staff")) + 
       geom_line(aes(y = applications, colour = "applications")) 




      df <- data.frame(year = seq(1970, 2015, by = 5), 
      staff = c(219, 231, 259, 352, 448, 427, 556, 555, 602, 622), 
      applications = c(5820, 7107, 6135, 16119, 19381, 36611, 54962, 45759, 40358, 458582) 
1

私は考えfacet_gridscales = "free_y"を使用することをお勧めします。 ggplot2` `で

ggplot(reshape2::melt(df, 1), aes(year, value)) + 
    geom_line() + geom_point() + 
    facet_grid(variable ~ ., scales = 'free_y') 

あなたが得る出力され、 Output

関連する問題