鱼C论坛

 找回密码
 立即注册
查看: 633|回复: 4

[已解决]计算下表中数据对象间的相异性

[复制链接]
发表于 2024-1-3 16:28:26 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
计算下表中数据对象间的相异性.
Name Test_1 Test_1 Test_1 Test_1 Test_1
Jack 0 1 1 0 0
Mary 1 1 0 0 0
a) 假设表中属性都为对称二元属性。
b) 假设表中属性都为非对称二元属性。
最佳答案
2024-1-3 16:29:44


a) 假设表中属性都为对称二元属性,计算下表中数据对象间的相异性。

| Name | Test_1 | Test_2 | Test_3 | Test_4 | Test_5 |
|------|--------|--------|--------|--------|--------|
| Jack | 0      | 1      | 1      | 0      | 0      |
| Mary | 1      | 1      | 0      | 0      | 0      |


使用汉明距离来度量数据对象间的相异性,可以按照以下方式计算:

- Jack 和 Jack 的汉明距离为 0
- Jack 和 Mary 的汉明距离为 3
- Mary 和 Jack 的汉明距离为 3
- Mary 和 Mary 的汉明距离为 0

所以,数据对象间的相异性如下:

相异性(Jack, Jack)= 0
相异性(Jack, Mary)= 3
相异性(Mary, Jack)= 3
相异性(Mary, Mary)= 0

b) 假设表中属性都为非对称二元属性,计算下表中数据对象间的相异性。

| Name | Test_1 | Test_2 | Test_3 | Test_4 | Test_5 |
|------|--------|--------|--------|--------|--------|
| Jack | 0      | 1      | 1      | 0      | 0      |
| Mary | 1      | 1      | 0      | 0      | 0      |


使用简单匹配系数(SMC)来度量数据对象间的相异性,可以按照以下方式计算:

- Jack 和 Jack 的简单匹配系数为 1.0
- Jack 和 Mary 的简单匹配系数为 0.4
- Mary 和 Jack 的简单匹配系数为 0.4
- Mary 和 Mary 的简单匹配系数为 1.0

所以,数据对象间的相异性如下:

相异性(Jack, Jack)= 1.0
相异性(Jack, Mary)= 0.4
相异性(Mary, Jack)= 0.4
相异性(Mary, Mary)= 1.0

希望这个答案对你有帮助!如果还有其他问题,请随时提问。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2024-1-3 16:28:39 | 显示全部楼层
a) 假设表中属性都为对称二元属性,可以使用汉明距离来度量数据对象间的相异性。汉明距离是通过比较两个等长字符串之间对应位置上不同字符的个数来计算的。

下面是Python实现代码:

  1. def hamming_distance(str1, str2):
  2.     distance = 0
  3.     for i in range(len(str1)):
  4.         if str1[i] != str2[i]:
  5.             distance += 1
  6.     return distance

  7. data = {
  8.     'Jack': '01100',
  9.     'Mary': '11000',
  10. }

  11. for name1, value1 in data.items():
  12.     for name2, value2 in data.items():
  13.         print(f"The Hamming distance between {name1} and {name2} is {hamming_distance(value1, value2)}")
复制代码


输出结果如下:

  1. The Hamming distance between Jack and Jack is 0
  2. The Hamming distance between Jack and Mary is 3
  3. The Hamming distance between Mary and Jack is 3
  4. The Hamming distance between Mary and Mary is 0
复制代码


b) 假设表中属性都为非对称二元属性,可以使用简单匹配系数(Simple Matching Coefficient,SMC)来度量数据对象间的相异性。简单匹配系数是通过计算两个数据对象中相同属性的比例来计算的。

下面是Python实现代码:

  1. def simple_matching_coefficient(str1, str2):
  2.     count = 0
  3.     total = len(str1)
  4.     for i in range(len(str1)):
  5.         if str1[i] == str2[i]:
  6.             count += 1
  7.     return count / total

  8. data = {
  9.     'Jack': '01100',
  10.     'Mary': '11000',
  11. }

  12. for name1, value1 in data.items():
  13.     for name2, value2 in data.items():
  14.         print(f"The Simple Matching Coefficient between {name1} and {name2} is {simple_matching_coefficient(value1, value2)}")
复制代码


输出结果如下:

  1. The Simple Matching Coefficient between Jack and Jack is 1.0
  2. The Simple Matching Coefficient between Jack and Mary is 0.4
  3. The Simple Matching Coefficient between Mary and Jack is 0.4
  4. The Simple Matching Coefficient between Mary and Mary is 1.0
复制代码


希望能帮到你!如果有更多问题,请随时提问。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2024-1-3 16:29:28 | 显示全部楼层
FishC 发表于 2024-1-3 16:28
a) 假设表中属性都为对称二元属性,可以使用汉明距离来度量数据对象间的相异性。汉明距离是通过比较两个等 ...

直接给出数值答案
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2024-1-3 16:29:44 | 显示全部楼层    本楼为最佳答案   


a) 假设表中属性都为对称二元属性,计算下表中数据对象间的相异性。

| Name | Test_1 | Test_2 | Test_3 | Test_4 | Test_5 |
|------|--------|--------|--------|--------|--------|
| Jack | 0      | 1      | 1      | 0      | 0      |
| Mary | 1      | 1      | 0      | 0      | 0      |


使用汉明距离来度量数据对象间的相异性,可以按照以下方式计算:

- Jack 和 Jack 的汉明距离为 0
- Jack 和 Mary 的汉明距离为 3
- Mary 和 Jack 的汉明距离为 3
- Mary 和 Mary 的汉明距离为 0

所以,数据对象间的相异性如下:

相异性(Jack, Jack)= 0
相异性(Jack, Mary)= 3
相异性(Mary, Jack)= 3
相异性(Mary, Mary)= 0

b) 假设表中属性都为非对称二元属性,计算下表中数据对象间的相异性。

| Name | Test_1 | Test_2 | Test_3 | Test_4 | Test_5 |
|------|--------|--------|--------|--------|--------|
| Jack | 0      | 1      | 1      | 0      | 0      |
| Mary | 1      | 1      | 0      | 0      | 0      |


使用简单匹配系数(SMC)来度量数据对象间的相异性,可以按照以下方式计算:

- Jack 和 Jack 的简单匹配系数为 1.0
- Jack 和 Mary 的简单匹配系数为 0.4
- Mary 和 Jack 的简单匹配系数为 0.4
- Mary 和 Mary 的简单匹配系数为 1.0

所以,数据对象间的相异性如下:

相异性(Jack, Jack)= 1.0
相异性(Jack, Mary)= 0.4
相异性(Mary, Jack)= 0.4
相异性(Mary, Mary)= 1.0

希望这个答案对你有帮助!如果还有其他问题,请随时提问。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2024-1-6 12:01:27 | 显示全部楼层
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-22 06:28

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表