r4ds 8 pipe

距離と平遅延時間の関係を目的地ごとに調べたい。

by_dest <- group_by(flights, dest)
> delay <- summarise(by_dest,
+ count = n(),
+ dist = mean(distance, na.rm = TRUE),
+ delay = mean(arr_delay, na.rm = TRUE)
+ )
> delay <- filter(delay, count > 20, dest != “HNL”)

1 行先ごとにフライトをグループ分けする
2 距離、平均遅延、便数を計算して要約する
3 直近の空港よりも2倍は離れているホノルル空港とノイズをフィルタで取り除く

中間のデータフレームに名前を付けないといけない。
→パイプを使って処理する。thenと読む。
ctrl+shift+M

delays <- flights %>%
+ group_by(dest) %>%
+ summarise(
+ count = n(),
+ dist = mean(distance, na.rm = TRUE),
+ delay = mean(arr_delay, na.rm = TRUE)
+ ) %>%
+ filter(count > 20, dest != “HNL”)

Follow me!