我的Dataframe大约有200个条目,构建如下:
text <- as.data.frame("Lorem ipsum dolor sit amet, consetetur \n sadipscing elitr, sed diam nonumy eirmod tempor invidunt \n ut labore et dolore magna aliquyam erat, sed diam voluptua.\nAt vero eos et accusam et justo duo dolores et ea rebum.")
colnames(text) = "Lorem"
我正在尝试删除每个条目的最后一段。所有这些在文本和长度上都不同。我最新的尝试方法是在最后一次换行后找到一种方法来细分所有内容。
text %>% mutate(Lorem = sub("\n{.,}$","", Lorem))
我试图找到合适的正则表达式,但似乎没有成功。
我已经能够创造我需要的相反的东西。
text %>% mutate(Lorem = sub(".*\n","", Lorem))
结果是:“在vero eos et的指控和Justo二重奏dolore et ea rebum。”
但似乎也找不到正确的否定方式。
For this example the result would be: "Lorem ipsum dolor sit amet, consetetur \n sadipscing elitr, sed diam nonumy eirmod tempor invidunt \n ut labore et dolore magna aliquyam erat, sed diam voluptua."
你可以这样做:
text %>% mutate(Lorem = sub("\n[^\n]+$", "", Lorem))