鱼C论坛

 找回密码
 立即注册
查看: 813|回复: 7

[已解决]python问题

[复制链接]
发表于 2023-12-9 00:13:06 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
python题目:计算余弦相似度

余弦相似度算法: 一个向量空间中两个向量夹角间的余弦值作为衡量两个个体之间差异的大小,余弦值接近1,夹角趋于0,表明两个向量越相似,余弦值接近于0,夹角趋于90度,表明两个向量越不相似。

题目:用户输入N个D维向量A,....) ,B........利用余弦相似度计算公式,分别计算N个向量之间得两两距离,并找出相似度最小的两个。
最佳答案
2023-12-9 00:15:14
首先,我们需要明确一下输入向量的格式。假设用户输入的N个D维向量都是以列表的形式表示,例如:

A = [a1, a2, ..., aD]
B = [b1, b2, ..., bD]

其中ai和bi分别表示向量A和B在第i个维度上的取值。

接下来,我们可以编写一个函数来计算两个向量之间的余弦相似度。可以使用numpy库来进行向量运算,因此需要安装numpy库。
  1. import numpy as np
  2. def cosine_similarity(vector1, vector2):
  3.     dot_product = np.dot(vector1, vector2)
  4.     norm1 = np.linalg.norm(vector1)
  5.     norm2 = np.linalg.norm(vector2)
  6.     similarity = dot_product / (norm1 * norm2)
  7.     return similarity
复制代码

在这个函数中,我们使用`np.dot()`函数计算两个向量的点积,使用`np.linalg.norm()`函数计算向量的范数,然后将点积除以范数的乘积得到余弦相似度。

接下来,我们可以编写主程序来实现用户输入N个向量,并计算两两向量之间的相似度。
  1. N = int(input("请输入向量个数:"))
  2. D = int(input("请输入向量维度:"))
  3. vectors = []
  4. for i in range(N):
  5.     vector = []
  6.     for j in range(D):
  7.         value = float(input("请输入第{}个向量的第{}个维度的取值:".format(i+1, j+1)))
  8.         vector.append(value)
  9.     vectors.append(vector)
  10. min_similarity = 1
  11. min_vectors = []
  12. for i in range(N):
  13.     for j in range(i+1, N):
  14.         similarity = cosine_similarity(vectors[i], vectors[j])
  15.         if similarity < min_similarity:
  16.             min_similarity = similarity
  17.             min_vectors = [vectors[i], vectors[j]]
  18. print("最小的相似度为:", min_similarity)
  19. print("对应的两个向量分别为:", min_vectors)
复制代码

在主程序中,我们使用两层循环遍历所有的向量组合,并调用`cosine_similarity()`函数计算它们的相似度。如果找到了更小的相似度,则更新最小相似度和对应的向量。

最后,输出最小相似度和对应的两个向量。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。

本帖被以下淘专辑推荐:

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2023-12-9 00:15:14 | 显示全部楼层    本楼为最佳答案   
首先,我们需要明确一下输入向量的格式。假设用户输入的N个D维向量都是以列表的形式表示,例如:

A = [a1, a2, ..., aD]
B = [b1, b2, ..., bD]

其中ai和bi分别表示向量A和B在第i个维度上的取值。

接下来,我们可以编写一个函数来计算两个向量之间的余弦相似度。可以使用numpy库来进行向量运算,因此需要安装numpy库。
  1. import numpy as np
  2. def cosine_similarity(vector1, vector2):
  3.     dot_product = np.dot(vector1, vector2)
  4.     norm1 = np.linalg.norm(vector1)
  5.     norm2 = np.linalg.norm(vector2)
  6.     similarity = dot_product / (norm1 * norm2)
  7.     return similarity
复制代码

在这个函数中,我们使用`np.dot()`函数计算两个向量的点积,使用`np.linalg.norm()`函数计算向量的范数,然后将点积除以范数的乘积得到余弦相似度。

接下来,我们可以编写主程序来实现用户输入N个向量,并计算两两向量之间的相似度。
  1. N = int(input("请输入向量个数:"))
  2. D = int(input("请输入向量维度:"))
  3. vectors = []
  4. for i in range(N):
  5.     vector = []
  6.     for j in range(D):
  7.         value = float(input("请输入第{}个向量的第{}个维度的取值:".format(i+1, j+1)))
  8.         vector.append(value)
  9.     vectors.append(vector)
  10. min_similarity = 1
  11. min_vectors = []
  12. for i in range(N):
  13.     for j in range(i+1, N):
  14.         similarity = cosine_similarity(vectors[i], vectors[j])
  15.         if similarity < min_similarity:
  16.             min_similarity = similarity
  17.             min_vectors = [vectors[i], vectors[j]]
  18. print("最小的相似度为:", min_similarity)
  19. print("对应的两个向量分别为:", min_vectors)
复制代码

在主程序中,我们使用两层循环遍历所有的向量组合,并调用`cosine_similarity()`函数计算它们的相似度。如果找到了更小的相似度,则更新最小相似度和对应的向量。

最后,输出最小相似度和对应的两个向量。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-12-9 00:28:52 | 显示全部楼层
FishC 发表于 2023-12-9 00:15
首先,我们需要明确一下输入向量的格式。假设用户输入的N个D维向量都是以列表的形式表示,例如:

A = [a1, ...

我给出两个向量间余弦值的公式,请你以此修正并简化一下代码。
公式:(ΣD(Ai+Bi))/(ΣD(Ai)ΣD(Bi))^1/2
其中Σ是求和符号ΣD表示i取值为1到D的数
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-12-9 00:29:51 | 显示全部楼层
Orig 发表于 2023-12-09 00:28
我给出两个向量间余弦值的公式,请你以此修正并简化一 ...

感谢您提供了修正后的余弦相似度公式,我们可以根据这个公式来简化代码。

首先,我们引入numpy库来进行向量运算,然后编写一个函数来计算两个向量之间的余弦相似度。
  1. import numpy as np
  2. def cosine_similarity(vector1, vector2):
  3.     dot_product = np.sum(vector1 * vector2)
  4.     norm1 = np.sqrt(np.sum(vector1 ** 2))
  5.     norm2 = np.sqrt(np.sum(vector2 ** 2))
  6.     similarity = dot_product / (norm1 * norm2)
  7.     return similarity
复制代码

在这个函数中,我们使用`np.sum()`函数计算两个向量对应元素的和,使用`np.sqrt()`函数计算平方根。然后按照公式计算余弦相似度。

接下来,我们可以编写主程序来实现用户输入N个向量,并计算两两向量之间的相似度。
  1. N = int(input("请输入向量个数:"))
  2. D = int(input("请输入向量维度:"))
  3. vectors = []
  4. for i in range(N):
  5.     vector = []
  6.     for j in range(D):
  7.         value = float(input("请输入第{}个向量的第{}个维度的取值:".format(i+1, j+1)))
  8.         vector.append(value)
  9.     vectors.append(vector)
  10. min_similarity = 1.0
  11. min_vectors = []
  12. for i in range(N):
  13.     for j in range(i+1, N):
  14.         similarity = cosine_similarity(vectors[i], vectors[j])
  15.         if similarity < min_similarity:
  16.             min_similarity = similarity
  17.             min_vectors = [vectors[i], vectors[j]]
  18. print("最小的相似度为:", min_similarity)
  19. print("对应的两个向量分别为:", min_vectors)
复制代码

在主程序中,我们使用两层循环遍历所有的向量组合,并调用`cosine_similarity()`函数计算它们的相似度。如果找到了更小的相似度,则更新最小相似度和对应的向量。最后,输出最小相似度和对应的两个向量。

希望这次修改满足了您的要求,如果还有其他问题,请随时提问。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-12-9 00:33:03 | 显示全部楼层
FishC 发表于 2023-12-9 00:29
感谢您提供了修正后的余弦相似度公式,我们可以根据这个公式来简化代码。

首先,我们引入numpy库来进行 ...

请不要引用其他第三方库,仅用python安装是自带的数学计算函数
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-12-9 00:33:53 | 显示全部楼层
Orig 发表于 2023-12-09 00:33
请不要引用其他第三方库,仅用python安装是自带的数学 ...

非常抱歉,我给出的代码中引用了第三方库 numpy。如果您想要使用纯Python内置的数学计算函数,以下是修正后的代码:def cosine_similarity(vector1, vector2):    dot_product = sum(vector1 * vector2 for i in range(len(vector1)))    norm1 = sum(vector1 ** 2 for i in range(len(vector1))) ** 0.5    norm2 = sum(vector2 ** 2 for i in range(len(vector2))) ** 0.5    similarity = dot_product / (norm1 * norm2)    return similarityN = int(input("请输入向量个数:"))D = int(input("请输入向量维度:"))vectors = []for i in range(N):    vector = []    for j in range(D):        value = float(input("请输入第{}个向量的第{}个维度的取值:".format(i+1, j+1)))        vector.append(value)    vectors.append(vector)min_similarity = 1.0min_vectors = []for i in range(N):    for j in range(i+1, N):        similarity = cosine_similarity(vectors, vectors[j])        if similarity < min_similarity:            min_similarity = similarity            min_vectors = [vectors, vectors[j]]print("最小的相似度为:", min_similarity)print("对应的两个向量分别为:", min_vectors)在这个修改后的代码中,我们使用纯Python内置的函数进行数学计算。其中,我们使用了列表推导式来计算向量内积和范数的求和。希望这次的修改满足了您的要求,如果还有其他问题,请随时提问。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-12-9 00:36:13 | 显示全部楼层
FishC 发表于 2023-12-9 00:33
非常抱歉,我给出的代码中引用了第三方库 numpy。如果您想要使用纯Python内置的数学计算函数,以下是修正 ...

请注意代码格式再写一遍代码,注意换行
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-12-9 00:36:56 | 显示全部楼层
Orig 发表于 2023-12-09 00:36
请注意代码格式再写一遍代码,注意换行

非常抱歉给您带来困扰,以下是修正后的代码,并注意了换行和代码格式:
  1. def cosine_similarity(vector1, vector2):
  2.     dot_product = sum(vector1[i] * vector2[i] for i in range(len(vector1)))
  3.     norm1 = (sum(vector1[i] ** 2 for i in range(len(vector1)))) ** 0.5
  4.     norm2 = (sum(vector2[i] ** 2 for i in range(len(vector2)))) ** 0.5
  5.     similarity = dot_product / (norm1 * norm2)
  6.     return similarity
  7. N = int(input("请输入向量个数:"))
  8. D = int(input("请输入向量维度:"))
  9. vectors = []
  10. for i in range(N):
  11.     vector = []
  12.     for j in range(D):
  13.         value = float(input("请输入第{}个向量的第{}个维度的取值:".format(i+1, j+1)))
  14.         vector.append(value)
  15.     vectors.append(vector)
  16. min_similarity = 1.0
  17. min_vectors = []
  18. for i in range(N):
  19.     for j in range(i+1, N):
  20.         similarity = cosine_similarity(vectors[i], vectors[j])
  21.         if similarity < min_similarity:
  22.             min_similarity = similarity
  23.             min_vectors = [vectors[i], vectors[j]]
  24. print("最小的相似度为:", min_similarity)
  25. print("对应的两个向量分别为:", min_vectors)
复制代码

这次修改后的代码应符合您的要求,感谢您的耐心。如果还有其他问题,请随时提问。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-20 17:39

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表