-
Notifications
You must be signed in to change notification settings - Fork 1.3k
/
正则表达式匹配.py
56 lines (53 loc) · 2.91 KB
/
正则表达式匹配.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
'''
请实现一个函数用来匹配包括'.'和'*'的正则表达式。
模式中的字符'.'表示任意一个字符,而'*'表示它前面的字符可以出现任意次(包含0次)。
在本题中,匹配是指字符串的所有字符匹配整个模式。
例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但是与"aa.a"和"ab*a"均不匹配
'''
# -*- coding:utf-8 -*-
class Solution:
# s, pattern都是字符串
def match(self, s, pattern):
if not s or not pattern:
return False
# 如果s和pattern匹配, 直接True
if s == pattern:
return True
# 如果pattern为'', 因为s和pattern不相等, 直接False
elif pattern == '':
return False
# 当s为'', 如果pattern为'.', 则返回True
# 当s为'', 如果pattern长度为1且不为'.', 或者pattern第二个字符不是*, 则pattern不可能为空, 返回False
# 若pattern长度不为1, 且第二个字符为*, pattern还有空的可能, 从第三个字符开始迭代
elif s == '':
if pattern == ".":
return True
elif len(pattern) == 1 or pattern[1] != '*':
return False
else:
return self.match(s, pattern[2:])
# 如果pattern长度不小于二, 而且pattern的第二个字符不是*的情况下
# 当 pattern[0] 不等于s[0], 且不为 . 的时候, s和pattern必不相等
# 否则, s 和 pattern 都右移一位, 继续比较
if len(pattern) >= 2 and pattern[1] != '*':
if s[0] != pattern[0] and pattern[0] != '.':
return False
else:
return self.match(s[1:], pattern[1:])
# 如果pattern长度不小于2, 且pattern第二个字符为*的情况下
# 如果s[0]不等于pattern[0], 且pattern[0]不为 . , 那么第一位比较不成功, pattern必须后移两位继续比较后面是否能和s第一位匹配
# 如果s[0]等于pattern[0], 或者pattern[0]为 . , 第一位匹配, 那么会有
# 1. aaa 和 a*a 这种情况, 星号代表了多个a, 因此s需要不断右移一位继续比较
# 2. a 和 a*a 中这情况, 这时候星号代表0个a, 因此s不需要右移, pattern需要右移两位
# 3. abc 和 a*bc 这种情况, 星号代表了1个a, s右移一位, pattern右移两位继续比较
elif len(pattern) >= 2 and pattern[1] == '*':
if s[0] != pattern[0] and pattern[0] != '.':
return self.match(s, pattern[2:])
else:
return self.match(s[1:], pattern) or self.match(s, pattern[2:]) or self.match(s[1:], pattern[2:])
# 除去上述pattern不小于2情况, 只剩下pattern等于1的情况, 因此如果pattern为".", 而且s长度为1, 返回True
elif pattern == '.' and len(s) == 1:
return True
return False
s = Solution()
print(s.match('aaa', 'a*a'))