r4ds 8 pipe
距離と平均遅延時間の関係を目的地ごとに調べたい。
by_dest <- group_by(flights, dest)
> delay <- summarise(by_dest,
+ count = n(),
+ dist = mean(distance, na.rm = TRUE),
+ delay = mean(arr_delay, na.rm = TRUE)
+ )
> delay <- filter(delay, count > 20, dest != “HNL”)
1 行先ごとにフライトをグループ分けする
2 距離、平均遅延、便数を計算して要約する
3 直近の空港よりも2倍は離れているホノルル空港とノイズをフィルタで取り除く
中間のデータフレームに名前を付けないといけない。
→パイプを使って処理する。thenと読む。
ctrl+shift+M
delays <- flights %>%
+ group_by(dest) %>%
+ summarise(
+ count = n(),
+ dist = mean(distance, na.rm = TRUE),
+ delay = mean(arr_delay, na.rm = TRUE)
+ ) %>%
+ filter(count > 20, dest != “HNL”)
ディスカッション
コメント一覧
まだ、コメントがありません