Orig 发表于 2023-12-9 00:13:06

python问题

python题目:计算余弦相似度

余弦相似度算法: 一个向量空间中两个向量夹角间的余弦值作为衡量两个个体之间差异的大小,余弦值接近1,夹角趋于0,表明两个向量越相似,余弦值接近于0,夹角趋于90度,表明两个向量越不相似。

题目:用户输入N个D维向量A,....) ,B........利用余弦相似度计算公式,分别计算N个向量之间得两两距离,并找出相似度最小的两个。

FishC 发表于 2023-12-9 00:15:14

首先,我们需要明确一下输入向量的格式。假设用户输入的N个D维向量都是以列表的形式表示,例如:

A =
B =

其中ai和bi分别表示向量A和B在第i个维度上的取值。

接下来,我们可以编写一个函数来计算两个向量之间的余弦相似度。可以使用numpy库来进行向量运算,因此需要安装numpy库。

import numpy as np

def cosine_similarity(vector1, vector2):
    dot_product = np.dot(vector1, vector2)
    norm1 = np.linalg.norm(vector1)
    norm2 = np.linalg.norm(vector2)
    similarity = dot_product / (norm1 * norm2)
    return similarity

在这个函数中,我们使用`np.dot()`函数计算两个向量的点积,使用`np.linalg.norm()`函数计算向量的范数,然后将点积除以范数的乘积得到余弦相似度。

接下来,我们可以编写主程序来实现用户输入N个向量,并计算两两向量之间的相似度。

N = int(input("请输入向量个数:"))
D = int(input("请输入向量维度:"))

vectors = []
for i in range(N):
    vector = []
    for j in range(D):
      value = float(input("请输入第{}个向量的第{}个维度的取值:".format(i+1, j+1)))
      vector.append(value)
    vectors.append(vector)

min_similarity = 1
min_vectors = []

for i in range(N):
    for j in range(i+1, N):
      similarity = cosine_similarity(vectors, vectors)
      if similarity < min_similarity:
            min_similarity = similarity
            min_vectors = , vectors]

print("最小的相似度为:", min_similarity)
print("对应的两个向量分别为:", min_vectors)

在主程序中,我们使用两层循环遍历所有的向量组合,并调用`cosine_similarity()`函数计算它们的相似度。如果找到了更小的相似度,则更新最小相似度和对应的向量。

最后,输出最小相似度和对应的两个向量。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。

Orig 发表于 2023-12-9 00:28:52

FishC 发表于 2023-12-9 00:15
首先,我们需要明确一下输入向量的格式。假设用户输入的N个D维向量都是以列表的形式表示,例如:

A =

我给出两个向量间余弦值的公式,请你以此修正并简化一下代码。
公式:(ΣD(Ai+Bi))/(ΣD(Ai)ΣD(Bi))^1/2
其中Σ是求和符号ΣD表示i取值为1到D的数

FishC 发表于 2023-12-9 00:29:51

Orig 发表于 2023-12-09 00:28
我给出两个向量间余弦值的公式,请你以此修正并简化一 ...

感谢您提供了修正后的余弦相似度公式,我们可以根据这个公式来简化代码。

首先,我们引入numpy库来进行向量运算,然后编写一个函数来计算两个向量之间的余弦相似度。

import numpy as np

def cosine_similarity(vector1, vector2):
    dot_product = np.sum(vector1 * vector2)
    norm1 = np.sqrt(np.sum(vector1 ** 2))
    norm2 = np.sqrt(np.sum(vector2 ** 2))
    similarity = dot_product / (norm1 * norm2)
    return similarity

在这个函数中,我们使用`np.sum()`函数计算两个向量对应元素的和,使用`np.sqrt()`函数计算平方根。然后按照公式计算余弦相似度。

接下来,我们可以编写主程序来实现用户输入N个向量,并计算两两向量之间的相似度。

N = int(input("请输入向量个数:"))
D = int(input("请输入向量维度:"))

vectors = []
for i in range(N):
    vector = []
    for j in range(D):
      value = float(input("请输入第{}个向量的第{}个维度的取值:".format(i+1, j+1)))
      vector.append(value)
    vectors.append(vector)

min_similarity = 1.0
min_vectors = []

for i in range(N):
    for j in range(i+1, N):
      similarity = cosine_similarity(vectors, vectors)
      if similarity < min_similarity:
            min_similarity = similarity
            min_vectors = , vectors]

print("最小的相似度为:", min_similarity)
print("对应的两个向量分别为:", min_vectors)

在主程序中,我们使用两层循环遍历所有的向量组合,并调用`cosine_similarity()`函数计算它们的相似度。如果找到了更小的相似度,则更新最小相似度和对应的向量。最后,输出最小相似度和对应的两个向量。

希望这次修改满足了您的要求,如果还有其他问题,请随时提问。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。

Orig 发表于 2023-12-9 00:33:03

FishC 发表于 2023-12-9 00:29
感谢您提供了修正后的余弦相似度公式,我们可以根据这个公式来简化代码。

首先,我们引入numpy库来进行 ...

请不要引用其他第三方库,仅用python安装是自带的数学计算函数

FishC 发表于 2023-12-9 00:33:53

Orig 发表于 2023-12-09 00:33
请不要引用其他第三方库,仅用python安装是自带的数学 ...

非常抱歉,我给出的代码中引用了第三方库 numpy。如果您想要使用纯Python内置的数学计算函数,以下是修正后的代码:def cosine_similarity(vector1, vector2):    dot_product = sum(vector1 * vector2 for i in range(len(vector1)))    norm1 = sum(vector1 ** 2 for i in range(len(vector1))) ** 0.5    norm2 = sum(vector2 ** 2 for i in range(len(vector2))) ** 0.5    similarity = dot_product / (norm1 * norm2)    return similarityN = int(input("请输入向量个数:"))D = int(input("请输入向量维度:"))vectors = []for i in range(N):    vector = []    for j in range(D):      value = float(input("请输入第{}个向量的第{}个维度的取值:".format(i+1, j+1)))      vector.append(value)    vectors.append(vector)min_similarity = 1.0min_vectors = []for i in range(N):    for j in range(i+1, N):      similarity = cosine_similarity(vectors, vectors)      if similarity < min_similarity:            min_similarity = similarity            min_vectors = , vectors]print("最小的相似度为:", min_similarity)print("对应的两个向量分别为:", min_vectors)在这个修改后的代码中,我们使用纯Python内置的函数进行数学计算。其中,我们使用了列表推导式来计算向量内积和范数的求和。希望这次的修改满足了您的要求,如果还有其他问题,请随时提问。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。

Orig 发表于 2023-12-9 00:36:13

FishC 发表于 2023-12-9 00:33
非常抱歉,我给出的代码中引用了第三方库 numpy。如果您想要使用纯Python内置的数学计算函数,以下是修正 ...

请注意代码格式再写一遍代码,注意换行

FishC 发表于 2023-12-9 00:36:56

Orig 发表于 2023-12-09 00:36
请注意代码格式再写一遍代码,注意换行

非常抱歉给您带来困扰,以下是修正后的代码,并注意了换行和代码格式:

def cosine_similarity(vector1, vector2):
    dot_product = sum(vector1 * vector2 for i in range(len(vector1)))
    norm1 = (sum(vector1 ** 2 for i in range(len(vector1)))) ** 0.5
    norm2 = (sum(vector2 ** 2 for i in range(len(vector2)))) ** 0.5
    similarity = dot_product / (norm1 * norm2)
    return similarity

N = int(input("请输入向量个数:"))
D = int(input("请输入向量维度:"))

vectors = []
for i in range(N):
    vector = []
    for j in range(D):
      value = float(input("请输入第{}个向量的第{}个维度的取值:".format(i+1, j+1)))
      vector.append(value)
    vectors.append(vector)

min_similarity = 1.0
min_vectors = []

for i in range(N):
    for j in range(i+1, N):
      similarity = cosine_similarity(vectors, vectors)
      if similarity < min_similarity:
            min_similarity = similarity
            min_vectors = , vectors]

print("最小的相似度为:", min_similarity)
print("对应的两个向量分别为:", min_vectors)

这次修改后的代码应符合您的要求,感谢您的耐心。如果还有其他问题,请随时提问。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
页: [1]
查看完整版本: python问题