正则表达式匹配空白字符和文本开始前的多个可选模式

提问者：小点点

正则表达式匹配空白字符和文本开始前的多个可选模式

我正在解析包含如下代码的字符串。它可以从一个空行开始，然后是多个可选模式。这些模式可以是python风格的内联注释（使用散列#字符），也可以是命令！我的命令”，两者都必须从一行的开头开始。我如何写一个正则表达式匹配到代码的开始？

mystring = """

# catch this comment
!mycommand
# catch this comment
#catch this comment too
!mycommand

# catch this comment
!mycommand
!mycommand

some code. match until the previous line
# do not catch this comment
!mycommand
# do not catch this comment
"""

import re
pattern = r'^\s*^#.*|!mycommand\s*'
m = re.search(pattern, mystring, re.MULTILINE)
mystring[m.start():m.end()]

mystring = 'code. do not match anything' + mystring
m = re.search(pattern, mystring, re.MULTILINE)

我希望正则表达式将字符串匹配到“some code.catch，直到前一行”。我尝试了不同的方法，但我可能被两种不同的模式困住了

共3个答案

匿名用户

无需重新安装。多行可以在匹配前后重复匹配0个空格字符

^(?:\s*(?:#.*|!mycommand\s*))+\s*

正则表达式演示| Python演示

例如

import re
m = re.search(r'^(?:\s*(?:#.*|!mycommand\s*))+\s*', mystring)
print(m.group())

匿名用户

您的模式匹配#...或的一个实例！我的命令。解决这个问题的一个方法是将它们全部放入一个匹配中，并使用re.search查找第一个匹配。

为此，您需要重复匹配#...或的部分！使用MY-MY-MY-MY-MY-MY-MY-MY-MY-MY-MY-MY-MY-MY-MY-MY-MY-MY-MY-MY-MY-MY-MY-MY-MY-MY-MY-MY-MY-MY-MY-MY-MY-MY-MY

^\s*^(?:#.*\s*|!mycommand\s*)*

我还更改了#*到#*\s*这样它就一直到下一行，在那里可以找到非空白。

演示

回应您的评论：

如果字符串以代码开头，则此正则表达式不应匹配任何内容

你可以试试：

\A\s*^(?:#.*\s*|!mycommand\s*)+

我改为\A，这样它只匹配字符串的绝对开头，而不是行的开头。我还将最后一个*更改为，因此至少有一个\或！mycommand必须存在。


                        

                
                    匿名用户

                




                
					
匹配并返回字符串开头的注释
不需要正则表达式，读取并将这些行追加到列表中，直到一行不以开头或#并忽略所有空行：
mystring = "YOUR_STRING_HERE"

results = []
for line in mystring.splitlines():
  if not line.strip():                                      # Skip blank lines
    continue
  if not line.startswith('#') and not line.startswith('!'): # Reject if does not start with ! or #
    break
  else:
    results.append(line)                                    # Append comment

print(results)
请参阅Python演示。结果：
['# catch this comment', '!mycommand', '# catch this comment', '#catch this comment too', '!mycommand', '# catch this comment', '!mycommand', '!mycommand']
删除字符串开头的注释
results = []
flag = False
for line in mystring.splitlines():
  if not flag and not line.strip():
    continue
  if not flag and not line.startswith('#') and not line.startswith('!'):
    flag = True
  if flag:
    results.append(line)

print("\n".join(results))
输出：
some code. match until the previous line
# do not catch this comment
!mycommand
# do not catch this comment
请看这个Python演示。
正则表达式方法
import re
print(re.sub(r'^(?:(?:[!#].*)?\n)+', '', mystring))
如果行的开头有可选的缩进空格，请添加[^\S\n]*：
print(re.sub(r'^(?:[^\S\n]*(?:[!#].*)?\n)+', '', mystring, count=1))
参见regex演示和Python演示。count=1将确保我们只是删除第一个匹配（您不需要检查所有其他行）。
正则表达式详细信息
^-字符串的开始

(?:[^\S\n]*(?:[!#]。*）？\n）-出现1个或多个

[^\S\n]*-可选的水平空格
（？：[！#]。*）？-一个可选的序列

[！#]-！或#
.*-行的其余部分


		      
                相关问题
                

																                
					
										   在Hashmap中查找匹配的键/值对
										   服务如何订阅当前路由的ParamMap？
										   *具有多个异步管道变量的ngIF
										   如何编写一个函数，使超文本传输协议请求并返回请求的结果？
										   Angular 2缓存超文本传输协议请求使用可观察对象的力量
										   如何取消订阅角度组件中的多个可观察对象？
										   角度超文本传输协议-取消订阅时请求流
										   如何在angular2使用超文本传输协议把请求？
										   在Angular的超文本传输协议中使用rxjs（）
										   我们需要在Angular中取消订阅超文本传输协议调用吗？[重复]
										   不和谐机器人在完成音乐前断开连接
										   使用Maven管理微服务之间的多个依赖
										   如何包括多个分组与累加器在一个摩洛哥查询？
										   在MongoDB中将字符串日期转换为时间戳
										   带有聚合管道的文本搜索-MongoDB/PHP
										   如何从oracle中的列中提取子字符串？
										   C/C不允许文字字符串连接
										   如果您将一个runnable提交给具有多个线程的执行器服务，多个线程会执行该runnable吗？
										   java中具有并发映射的生产者消费者模式
										   如何实现多个线程安全的读/写锁（并发哈希图）

正则表达式匹配空白字符和文本开始前的多个可选模式

共3个答案

相关问题

热门标签

微信关注