哈岁NB 发表于 2023-7-12 22:51:59

正则

请问各位大佬们,str = '主演: 日高法子 Noriko Hidaka / 坂本千夏 Ch...1994'想要提取日高法子 Noriko Hidaka / 坂本千夏 Ch...该怎么写正则。还有'Tim1994 / 美国 / 犯罪 剧情'这个字符串,想要把1994,美国,犯罪 剧情分别提取出来该怎么写

歌者文明清理员 发表于 2023-7-12 22:54:26

提取字符串中的演员信息可以使用以下正则表达式:

import re

str = '主演: 日高法子 Noriko Hidaka / 坂本千夏 Ch...1994'

pattern = r'主演:\s(.*?)\s\/\s(.*?)\s'
matches = re.findall(pattern, str)

actors = matches + ' ' + matches
print(actors)
输出结果为:日高法子 Noriko Hidaka / 坂本千夏 Ch...

提取字符串中的年份、国家和剧情信息可以使用以下正则表达式:

import re

str = 'Tim1994 / 美国 / 犯罪 剧情'

year_pattern = r'(\d{4})'
country_pattern = r'/ ([^/]+?) /'
genre_pattern = r'/ ([^/]+)$'

year = re.search(year_pattern, str).group(1)
country = re.search(country_pattern, str).group(1)
genre = re.search(genre_pattern, str).group(1)

print(year)
print(country)
print(genre)
输出结果为:

1994
美国
犯罪 剧情
希望对你有帮助!

哈岁NB 发表于 2023-7-12 22:56:49

歌者文明清理员 发表于 2023-7-12 22:54
提取字符串中的演员信息可以使用以下正则表达式:




请问一下,/&#160这个是啥

歌者文明清理员 发表于 2023-7-12 22:59:51

哈岁NB 发表于 2023-7-12 22:56
请问一下,/&#160这个是啥

{:10_249:}

哈岁NB 发表于 2023-7-12 23:01:34

歌者文明清理员 发表于 2023-7-12 22:59


哦哦哦,看到了看到了{:10_245:}

歌者文明清理员 发表于 2023-7-12 23:02:47

哈岁NB 发表于 2023-7-12 23:01
哦哦哦,看到了看到了

最佳可否给一个{:10_301:}

哈岁NB 发表于 2023-7-12 23:05:07

歌者文明清理员 发表于 2023-7-12 22:59


那请问如果是'Tim1994美国/犯罪 剧情' 和'cc1993英国/犯罪 剧情'’这两个字符串,用一个正则把这两个国家都提取出来,可以吗

歌者文明清理员 发表于 2023-7-12 23:06:24

哈岁NB 发表于 2023-7-12 23:05
那请问如果是'Tim1994美国/犯罪 剧情' 和'cc1993英国/犯罪 剧情'’这两个字符串,用一个正则把这两个国家 ...

可以使用以下正则表达式来提取这两个字符串中的国家信息:

import re

str1 = 'Tim1994美国/犯罪 剧情'
str2 = 'cc1993英国/犯罪 剧情'

pattern = r'(\w+)/'
countries1 = re.findall(pattern, str1)
countries2 = re.findall(pattern, str2)

print(countries1)
print(countries2)
输出结果为:

['美国']
['英国']
这样你就可以将这两个字符串中的国家信息提取出来了。注意,这个正则表达式假设国家名前面的无意义内容只由英文字母组成。如果它包含其他字符,你可能需要调整正则表达式来适应不同的情况。

哈岁NB 发表于 2023-7-12 23:10:25

歌者文明清理员 发表于 2023-7-12 23:02
最佳可否给一个

好的
页: [1]
查看完整版本: 正则