提问者:小点点

使用Python将文本和数字从字母数字文本中分离出来


我有一个excel工作表,在列a和列B中包含大量数据,如下所示。 列B总是以字母M开头,然后是数字。

   A         B
Pradeep440  M440
Azhar541    M541
Venkat456   M456
Akash144    M144
Vipul157    M157
Fairo452    M452
Akshay449   M449
Pavan249    M249
Asad114     M114
Rudra890    M890
Niranjan120 M120
Darshan334  M334
Veeresh876  M876

我需要如下所示的输出,在C列中我只需要数字

    A         B      C 
Pradeep440  M440    440
Azhar541    M541    531
Venkat456   M456    456
Akash144    M144    144
Vipul157    M157    157
Fairo452    M452    452
Akshay449   M449    449
Pavan249    M249    249
Asad114     M114    114
Rudra890    M890    890
Niranjan120 M120    120
Darshan334  M334    334
Veeresh876  M876    876

有人能指导我如何使用python拆分或分离它吗?我是python的新手。感谢您的帮助。


共2个答案

匿名用户

使用条带

df['C']=df.B.str.strip('M')
df
Out[132]: 
              A     B    C
0    Pradeep440  M440  440
1      Azhar541  M541  541
2     Venkat456  M456  456
3      Akash144  M144  144
4      Vipul157  M157  157
5      Fairo452  M452  452
6     Akshay449  M449  449
7      Pavan249  M249  249
8       Asad114  M114  114
9      Rudra890  M890  890
10  Niranjan120  M120  120
11   Darshan334  M334  334
12   Veeresh876  M876  876

匿名用户

您可以执行提取:

df['C'] = df['B'].str.extract('(\d+)$')[0]