6

私はモバイルデバイス上にタグクラウドを実装しています。ここでは、データモデルの詳細などは特に重要ではありません。私の質問は、タグのスケーリングについてです:タグクラウドのスケーリングタグに関して

タグの頻度をフォントサイズにマップする「最良の」表現は何ですか?

私はインスピレーションのための多項式のアプローチのエイドリアンクーンスケッチから線形および対数スケールとthis answerを議論this postを見てきました。しかし、私は、この問題についてより多くの探査を行うことで、インターウェブ上のいくつかの場所を覚えているようだ。

ブログでも「best practices」と表示されていますが、ベストプラクティスの摂取は不明です。これらは周波数スケーリングに何のコメントもしません。

タグスケーリングにはどのような選択肢がありますか?どちらが推奨/標準方法ですか?

編集:this questionのディスカッションの通り、私はフォントサイズの違いを持つ "標準"タグクラウドに興味があります。

+0

Er、チェックアウトこのサイトの右側の列 - インスタンスの数を降順に並べ替え、右側に番号を付けます。私のために働く。 – Benjol

答えて

3
私は
β=(int型)(((maxθ - minθ)Xω)+minθ+ 0.5)の線に沿って何かを使用した小型のタグクラウドプロジェクトは昨年、に取​​り組ん

ω (あなたのケースのフォント周波数で)いくつかのメトリックに従って計算された重み付けであり、minθおよびmaxθは下限および上限であり、βは最終値である。これは任意の視覚特性(フォントサイズ、色、サポートされている場合は重量など)に適用できます。

線形および対数スケーリングはデータセット分布に依存する傾向があることがわかりました。顕著な異常値を持つデータセットでは、tanhが結果値を「平滑化」するのに役立つことがわかりました。 Xは、フォントサイズにマッピングしたい正規化した値である

font_size = (max_font_size - min_font_size) * (Math.sin(1.5*(X)) + minsize

を次のように

+0

これは私が最終的に行った線形スケーリングです。素晴らしいアイディア:tanh、私はさらにそれを見ていきます。 – jamesh

2

this pdfには、表示するタグのスケーリング、クラスタ化、および切り捨てについての議論があります。

0

私はうまく動作を発見した溶液である

X = (this_value-min_value)/(max_value-min_value)

これがために大きさ差を増加させます高い外れ値の影響を最小限に抑えるなど、範囲の下3四分位数

関連する問題