我正在选择航班的前10个目的地,以及有多少航班去了那里。为了实现这一点,我需要使用总结,它抛弃了我在group_by(…)
中没有提到的一切。
后来我需要源
列,但是我不能再检索这个列了,因为它和其他列一起被丢弃了。为了保留源
,我似乎需要在我的group_by(…)
中提到它,但是我不想要这个,因为我的结果会不正确。我如何才能得到这些前10个航班的来源?
library(tidyverse)
library(nycflights13)
(newFlights<- flights %>%
group_by("Destination" = dest) %>%
summarise("AllFlights" = n()) %>%
arrange(desc(AllFlights)) %>% top_n(10))
您希望在对group_by()
的调用中包含源
。请参阅留档:
newFlights <- as.data.frame(flights %>%
group_by(origin, dest)%>%
summarize("AllFlights" = n()) %>%
arrange(desc(AllFlights)) %>%
top_n(10)
)
head(newFlights, 10)
给你:
origin dest AllFlights
1 JFK LAX 11262
2 LGA ATL 10263
3 LGA ORD 8857
4 JFK SFO 8204
5 LGA CLT 6168
6 EWR ORD 6100
7 JFK BOS 5898
8 LGA MIA 5781
9 JFK MCO 5464
10 EWR BOS 5327