鱼C论坛

 找回密码
 立即注册
查看: 405|回复: 3

[已解决]如何在mysql中使用正则表达式确认一个长语句中是否包含某个关键词

[复制链接]
发表于 2024-2-13 23:25:33 | 显示全部楼层 |阅读模式
1鱼币
在一张名为posts的数据表中,包含keywords和content两列,现在需要判断keywords列的值是否在content列中的一个长句中。
例如:
1. keywords为war,长句为warning:404 not found,waring虽然包含war三个字母但是并不是同一个单词,因此不匹配;
2. keywords为house,长句为hello,welcome to my house,house在语句中出现过,可以匹配;
尝试编写如下:select * from posts where content regexp concat('\s',word,'\s') or content regexp concat('^',word,'\s') or content regexp concat('\s',word,'$') ,但无法得到正确结果,应该如何改进呢?
最佳答案
2024-2-13 23:25:34
zzong2019 发表于 2024-02-13 23:28
谢谢解答,按照你提示的方法运行了一下,系统报错:Il ...


抱歉,我之前给出的代码有一处错误。在MySQL中,正则表达式中的方括号`[]`并不是用来表示单词的边界,而是用来表示字符类,用于匹配某个字符集中的任意一个字符。要想正确地匹配单词的边界,可以使用`\b`元字符。修改后的代码如下:SELECT *FROM postsWHERE content REGEXP CONCAT('\\b', keywords, '\\b');这段代码中,`\\b`表示单词的边界。使用双斜杠`\\`是因为在字符串中需要转义斜杠。这样就能够正确地匹配完整的单词,而不是包含该关键词的其他单词。希望这次能够解决你的问题,如果还有其他疑问,请随时提问!

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。

最佳答案

查看完整内容

抱歉,我之前给出的代码有一处错误。在MySQL中,正则表达式中的方括号`[]`并不是用来表示单词的边界,而是用来表示字符类,用于匹配某个字符集中的任意一个字符。要想正确地匹配单词的边界,可以使用`\b`元字符。修改后的代码如下:SELECT *FROM postsWHERE content REGEXP CONCAT('\\b', keywords, '\\b');这段代码中,`\\b`表示单词的边界。使用双斜杠`\\`是因为在字符串中需要转义斜杠。这样就能够正确地匹配完整的单词,而 ...
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2024-2-13 23:25:34 | 显示全部楼层    本楼为最佳答案   
zzong2019 发表于 2024-02-13 23:28
谢谢解答,按照你提示的方法运行了一下,系统报错:Il ...


抱歉,我之前给出的代码有一处错误。在MySQL中,正则表达式中的方括号`[]`并不是用来表示单词的边界,而是用来表示字符类,用于匹配某个字符集中的任意一个字符。要想正确地匹配单词的边界,可以使用`\b`元字符。修改后的代码如下:SELECT *FROM postsWHERE content REGEXP CONCAT('\\b', keywords, '\\b');这段代码中,`\\b`表示单词的边界。使用双斜杠`\\`是因为在字符串中需要转义斜杠。这样就能够正确地匹配完整的单词,而不是包含该关键词的其他单词。希望这次能够解决你的问题,如果还有其他疑问,请随时提问!

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2024-2-13 23:25:49 | 显示全部楼层
你的思路是正确的,但是需要注意正则表达式中的一些问题。在MySQL中,可以使用REGEXP关键字进行正则表达式匹配。

你尝试的代码有一些问题,即`'\s'`并不是MySQL中的正则表达式元字符,它代表的是字母"s"。在MySQL的正则表达式中,你可以使用`[[:<:]]`和`[[:>:]]`来匹配单词的边界。

下面是一个修改后的示例代码:
SELECT *
FROM posts
WHERE content REGEXP CONCAT('[[:<:]]', keywords, '[[:>:]]');

这段代码使用`REGEXP`函数来匹配`content`列中是否包含`keywords`列的值。`CONCAT`函数用于将正则表达式的各个部分连接起来。

在正则表达式中,`[[:<:]]`表示单词的开始,`[[:>:]]`表示单词的结束。这样可以确保我们匹配的是完整的单词,而不是包含该关键词的其他单词。

这个代码应该能够解决你的问题。希望能对你有所帮助!

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2024-2-13 23:28:47 | 显示全部楼层
FishC 发表于 2024-2-13 23:25
你的思路是正确的,但是需要注意正则表达式中的一些问题。在MySQL中,可以使用REGEXP关键字进行正则表达式 ...

谢谢解答,按照你提示的方法运行了一下,系统报错:Illegal argument to a regular expression.非法的正则表达式,还应该怎么解决呢?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-12-22 09:36

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表