2016-12-08 6 views
0

私は、会社名に関してポジティブな、否定的な、または決まっていない感情を作成するために使用した様々なストック情報を持つデータフレームを持っています。このデータの先頭は、次のとおりです。ファクタ内のファクタの要約rでの統計分析

head(companyReturnsNameScore) 
#---------- 
    PERMNO  date EXCHCD SICCD TICKER  PRC VOL  RET SHROUT companyNameSentiment  companyName 
1 85814 19980831  3 5960 CTAC 6.1875 27989 -0.489691 6431  Not Determined 1 800 CONTACTS INC 
2 85814 20021231  3 5960 CTAC 27.5700 97498 1.177725 11388  Not Determined 1 800 CONTACTS INC 
3 85814 19990129  3 5960 CTAC 14.7500 5658 -0.180556 6275  Not Determined 1 800 CONTACTS INC 
4 85814 20021031  3 5960 CTAC 9.0300 20192 -0.097000 11382  Not Determined 1 800 CONTACTS INC 
5 85814 20021129  3 5960 CTAC 12.6600 15474 0.401993 12082  Not Determined 1 800 CONTACTS INC 
6 85814 20070731  3 5961 CTAC 23.2400 5574 -0.009378 13619  Not Determined 1 800 CONTACTS INC 
    marketCap marketCapDeclile 
1 39791.81    2 
2 313967.16    6 
3 92556.25    4 
4 102779.46    4 
5 152958.12    5 
6 316505.56    6 

私は、時価総額(marketCapDecile)の十分位のランキングで統計解析を実行しようとしていますが、それぞれの十分位のランクの中、私は、さらに、各感情要因のための分析により実行したいです。つまり、デシルランクごとに、「正、負、未定」という各因子レベルの統計的産出を見たいと考えています。私は

by(companyReturnsNameScore$RET, c(companyReturnsNameScore$marketCapDeclile, 
          companyReturnsNameScore$companyNameSentiment), summary) 

、要因のリストのための正しいコマンドと思われるもの入力すると、私は残念ながら次のエラーを取得:

Error in tapply(seq_len(1785812L), list(`c(companyReturnsNameScore$marketCapDeclile, companyReturnsNameScore$companyNameSentiment)` = c(2L, 
    : arguments must have same length 

を私は、時価総額の十分位のための10の因子レベルを持っている、と3感情要因分類のために、本質的に、私は30の分析を実行したい...問題は、私は要因分析の中でその要因を実行するのが難しいです。

私は間違って何をしていますか?因子分析の中で因子をどのように実行できますか?

答えて

0

あなたは第二引数倍の長最初の引数としてそれらを作る、二つのベクトルを連結します。

length(c(factor(1:5), factor(6:10))) 
[1] 10 

あなたは(少なくとも)2つの選択肢があります(?byのためのヘルプ機能が言うことを指摘listを使用しますかリストを使用、または最長の入力の長さの単一のベクトルを返すinteraction機能を使用する:。そのため42 @

# 1 
by(companyReturnsNameScore$RET, 
     list(companyReturnsNameScore$marketCapDeclile, 
         companyReturnsNameScore$companyNameSentiment), 
     summary) 
# 2 
by(companyReturnsNameScore$RET, 
     interaction(companyReturnsNameScore$marketCapDeclile, 
         companyReturnsNameScore$companyNameSentiment), 
     summary) 
+0

おかげで私は、「リスト」はうまくいくかもしれないと思ったが、私はそれをしようとしたとき、エラーが発生しました。現在は機能していますので、もともと私がそれを提出したときに間違って何かをタイプした。 – fibrou

+0

また、質問のフォーマットがより明確に見えるように、私の投稿の '編集'に感謝します。私は私の記事をよりきれいにしようとしていますが、まだどうしたらいいのか分かりません。あなたはどうやっていい形式で私の投稿を手に入れましたか? – fibrou

+0

私はちょうどキャリッジリターンと余分なスペースをたくさん使用しました。私が編集するとき、私は同様のレベルで同じレベルの関数パラメータの項目をインデントしようとします。私は自分のルールに違反しています。なぜなら私自身の2つの "会社"の値を並べるべきだったからです。私の目標は、横にスクロールすることなくコードを読みやすくすることです。 –

関連する問題