我怎么能把文本分成单词。NET,返回单词及其分隔符和标点符号。
输入:
"Hello world! What's up?"
输出:“你好', ' ', '世界', '!', ' ','',' ','”,“?”
(?=[^\w'])|(?<=[^\w'])
你可以用这个分开。见演示。
https://regex101.com/r/iJ7bT6/15
var输出=Regex。拆分(输入“([^A-Z0-9])”,RegexOptions。信号空间);
使用此正则表达式:
'(?=[^\w'])|(?<=[^\w'])`