正则,Python交流,编程语言专区,鱼C论坛

哈岁NB 发表于 2023-7-12 22:51:59

正则

请问各位大佬们，str = '主演: 日高法子 Noriko Hidaka / 坂本千夏 Ch...1994'想要提取日高法子 Noriko Hidaka / 坂本千夏 Ch...该怎么写正则。还有'Tim1994 / 美国 / 犯罪剧情'这个字符串，想要把1994，美国，犯罪剧情分别提取出来该怎么写

歌者文明清理员 发表于 2023-7-12 22:54:26

提取字符串中的演员信息可以使用以下正则表达式：

import re

str = '主演: 日高法子 Noriko Hidaka / 坂本千夏 Ch...1994'

pattern = r'主演:\s(.*?)\s\/\s(.*?)\s'
matches = re.findall(pattern, str)

actors = matches + ' ' + matches
print(actors)
输出结果为：日高法子 Noriko Hidaka / 坂本千夏 Ch...

提取字符串中的年份、国家和剧情信息可以使用以下正则表达式：

import re

str = 'Tim1994 / 美国 / 犯罪剧情'

year_pattern = r'(\d{4})'
country_pattern = r'/ ([^/]+?) /'
genre_pattern = r'/ ([^/]+)$'

year = re.search(year_pattern, str).group(1)
country = re.search(country_pattern, str).group(1)
genre = re.search(genre_pattern, str).group(1)

print(year)
print(country)
print(genre)
输出结果为：

1994
美国
犯罪剧情
希望对你有帮助！

哈岁NB 发表于 2023-7-12 22:56:49

歌者文明清理员发表于 2023-7-12 22:54
提取字符串中的演员信息可以使用以下正则表达式：

请问一下，/&#160这个是啥

歌者文明清理员 发表于 2023-7-12 22:59:51

哈岁NB 发表于 2023-7-12 22:56
请问一下，/&#160这个是啥

{:10_249:}

哈岁NB 发表于 2023-7-12 23:01:34

歌者文明清理员发表于 2023-7-12 22:59

哦哦哦，看到了看到了{:10_245:}

歌者文明清理员 发表于 2023-7-12 23:02:47

哈岁NB 发表于 2023-7-12 23:01
哦哦哦，看到了看到了

最佳可否给一个{:10_301:}

哈岁NB 发表于 2023-7-12 23:05:07

歌者文明清理员发表于 2023-7-12 22:59

那请问如果是'Tim1994美国/犯罪剧情' 和'cc1993英国/犯罪剧情'’这两个字符串，用一个正则把这两个国家都提取出来，可以吗

歌者文明清理员 发表于 2023-7-12 23:06:24

哈岁NB 发表于 2023-7-12 23:05
那请问如果是'Tim1994美国/犯罪剧情' 和'cc1993英国/犯罪剧情'’这两个字符串，用一个正则把这两个国家 ...

可以使用以下正则表达式来提取这两个字符串中的国家信息：

import re

str1 = 'Tim1994美国/犯罪剧情'
str2 = 'cc1993英国/犯罪剧情'

pattern = r'(\w+)/'
countries1 = re.findall(pattern, str1)
countries2 = re.findall(pattern, str2)

print(countries1)
print(countries2)
输出结果为：

['美国']
['英国']
这样你就可以将这两个字符串中的国家信息提取出来了。注意，这个正则表达式假设国家名前面的无意义内容只由英文字母组成。如果它包含其他字符，你可能需要调整正则表达式来适应不同的情况。

哈岁NB 发表于 2023-7-12 23:10:25

歌者文明清理员发表于 2023-7-12 23:02
最佳可否给一个

好的

页: [1]

鱼C论坛's Archiver

正则