ぱらぱらめくる『The Elements of Graphing Data』

The Elements of Graphing Data

The Elements of Graphing Data

  • 昨日書いた(けれど、記事としては翌日の日付になっている記事でグラフィクスの構成要素を書いた
  • 今日は、別の本では、グラフィクスをどのように説明しているかを見てみることにする
  • 昨日の記事は、描きたいものをどのように描くかについてのイメージを持っているときに、それを実現するためのプロセスの話
  • 今日は、描きたいものを、どのように描くかについてどのようにイメージするのがよいか、という点に重きがある
  • 2.2 はっきりと見せる
    • Superfluity(過多)を排除、冗長なものは1つに
    • 目立たせるべきは何か
      • データ点と補助線とのうち、大事なのは(たいがい)データ点
    • 見たいものをひとまとめにする。1図に1メッセージ
    • メモリは「わかればよい」だけに
    • レファレンス線などの補助線は、あくまでも補助。データそのものを隠さないように
    • 点の分布が意味をもつときに、その分布の読み取りを邪魔するもの(テキスト)は「邪魔なだけでなく」「分布の読み取り」に影響する
  • 2.3 はっきりと理解させる
    • グラフィクスに描いたものはすべて説明する
    • データの大事な特徴に注意を向けさせる
    • グラフィクスに短いメッセージを持たせる
  • 2.4 傾きは45度で
    • 変化の程度の読み取りにあたっては、傾きの線の角度が45度になるように軸をとること
    • それはグラフィクスを読み取る側の知覚が有する特徴に配慮した対策
  • 2.5 スケール
    • 見せたいものが見えやすいようにする一つのルールが、「傾きは45度」
    • そのためには、適切なスケールを取る必要がある
    • 直線であることを読み取らせたいか、直線ではないことを読み取らせたいか、直線ではないなら、どのように直線でないことを示したいか、そのためにはどうするか
  • Chapter 3 は見せたいものを見せるための「仕組み」について
  • 3.1 対数
    • 対数は、「倍々」であることを「直線」で表す仕組み
  • 3.2 残差
    • 残差は「モデルからのずれ」
  • 3.3 分布
    • 疎密で見せる
    • 分布を見せる
      • ヒストグラム
      • クオンタイルを示す(ボックスプロット)
      • 累積で見せる
      • モデルとの比較で見せる(QQプロット)
  • 3.5 点の形、カーブのタイプ
  • 3.7 LOESS (locally weighted scatterplot smoothing)
    • Wiki記事
    • 点の集まりに読み取りのサジェスチョンをする

plot(cars, main = "lowess(cars)")
lines(lowess(cars), col = 2)
lines(lowess(cars, f=.2), col = 3)
legend(5, 120, c(paste("f = ", c("2/3", ".2"))), lty = 1, col = 2:3)
  • 3.8 時系列データ
    • 時系列データのグラフィクスは、時間と言う特殊な軸を使うので、また、時間に関する特徴(周期性など)のために、特化している
  • 3.9 Scatter plotの行列配置
  • 3.10 Coplot で条件別比較
  • 3.12 Brushing
    • Interactively mark, delete, modify, and save observations in graphs
  • 3.13 色
  • 3.14 統計的ばらつき
  • Chapter 4 は見せ方と感じ方に関すること
  • 4.2 線を重ねてその違いを読み取ることのむずかしさ、補間
  • 4.3 色づけのルール、色の順序
  • 4.5 格子
  • 4.6 点を打つ順序
  • 4.7 傾き45度
  • 4.8 相関と描図範囲