a) 假设表中属性都为对称二元属性,计算下表中数据对象间的相异性。
| Name | Test_1 | Test_2 | Test_3 | Test_4 | Test_5 |
|------|--------|--------|--------|--------|--------|
| Jack | 0 | 1 | 1 | 0 | 0 |
| Mary | 1 | 1 | 0 | 0 | 0 |
使用汉明距离来度量数据对象间的相异性,可以按照以下方式计算:
- Jack 和 Jack 的汉明距离为 0
- Jack 和 Mary 的汉明距离为 3
- Mary 和 Jack 的汉明距离为 3
- Mary 和 Mary 的汉明距离为 0
所以,数据对象间的相异性如下:
相异性(Jack, Jack)= 0
相异性(Jack, Mary)= 3
相异性(Mary, Jack)= 3
相异性(Mary, Mary)= 0
b) 假设表中属性都为非对称二元属性,计算下表中数据对象间的相异性。
| Name | Test_1 | Test_2 | Test_3 | Test_4 | Test_5 |
|------|--------|--------|--------|--------|--------|
| Jack | 0 | 1 | 1 | 0 | 0 |
| Mary | 1 | 1 | 0 | 0 | 0 |
使用简单匹配系数(SMC)来度量数据对象间的相异性,可以按照以下方式计算:
- Jack 和 Jack 的简单匹配系数为 1.0
- Jack 和 Mary 的简单匹配系数为 0.4
- Mary 和 Jack 的简单匹配系数为 0.4
- Mary 和 Mary 的简单匹配系数为 1.0
所以,数据对象间的相异性如下:
相异性(Jack, Jack)= 1.0
相异性(Jack, Mary)= 0.4
相异性(Mary, Jack)= 0.4
相异性(Mary, Mary)= 1.0
希望这个答案对你有帮助!如果还有其他问题,请随时提问。
以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。