我有一些关于人们学术背景的数据。用户信息可能有重复,所以我用Unique_Elements提取每个条目一次。
demographics %>%
group_by(Academic_Level) %>%
summarise(Unique_Elements = n_distinct(userID))
输出如下所示:
Academic_Level Unique_Elements
Freshman 22
Sophomore 76
Junior 87
Senior 56
NA 10 # Non responding candidates
N的总值=253。
现在,如果我想编辑上面的代码来获取百分比,我应该做什么?
我看到了以下两个相关的帖子,但它们对我没有帮助。对此的任何建议都将不胜感激。谢谢!
与dplyr的相对频率/比例
使用group_by和总结查找子组中的百分比
我们可以试试
demographics %>%
group_by(Academic_Level) %>%
summarise(Unique_Elements = n_distinct(userID)) %>%
mutate(perc = 100 * Unique_Elements/sum(Unique_Elements))