我试图计算一个新的变量,基于对多个已有变量的求和。 我可以在R中这样做:
R代码:
data_2017_18 <- data_2017_18 %>%
mutate(
income =
income3a +
income3b +
income3c +
income3d +
income3e +
income3f +
income3g +
income3h +
income3i +
income3j +
income3k +
income3l +
income3m +
income3n +
income3o +
income3p +
income3q
)
我试着用python这样做:
data_2017_18.satisfaction = (data_2017_18.income3a +
data_2017_18.income3b +
data_2017_18.income3c +
data_2017_18.income3d +
data_2017_18.income3e +
data_2017_18.income3f +
data_2017_18.income3g +
data_2017_18.income3h +
data_2017_18.income3i +
data_2017_18.income3j +
data_2017_18.income3k +
data_2017_18.income3l +
data_2017_18.income3m +
data_2017_18.income3n +
data_2017_18.income3o +
data_2017_18.income3p +
data_2017_18.income3q)
然而,当我运行频率计数时,我得到了垃圾:
data_2017_18.income.value_counts()
00100010001000000 1 100000000000000100 1
感谢您的指点!
干杯。
当您在python中添加时,它假定每个变量都是字符串,因此是串联的。
使用int()
键入cast it并执行相同的操作。