`re.findall` 是 Python 中 `re` 模块的一个函数,用于在字符串中找到所有与正则表达式模式匹配的所有子字符串,并返回一个列表。这对于文本数据的提取特别有用。如果模式中存在多个匹配项,它将返回所有匹配项的列表。如果没有找到任何匹配项,它将返回一个空列表。
下面是 `re.findall` 的基本用法:
```python
import re
text = "Hello, world! How are you today?"
pattern = "o" # 这是一个简单的正则表达式模式,用于匹配字母 'o'
matches = re.findall(pattern, text) # 使用 re.findall 在文本中查找所有匹配的子字符串
print(matches) # 输出结果:['o', 'o', 'o']
```
在这个例子中,`re.findall` 在文本字符串 `"Hello, world! How are you today?"` 中找到了所有与模式 `"o"` 匹配的子字符串,并返回了一个包含这些子字符串的列表 `['o', 'o', 'o']`。在这个简单的例子中,匹配的所有 'o' 都匹配成功并返回了结果。对于更复杂的正则表达式模式,`re.findall` 同样有效。
注意:正则表达式模式可以是简单的也可以是复杂的,取决于你的需求。如果你不熟悉正则表达式,可能需要先学习一些基础知识才能有效地使用它。