Data Mining Exercise 10
This article provides a solution to a K-NN classification problem using both Euclidean and Manhattan distance metrics.
K-NN Solution From Given Problem
โจทย์
ให้ข้อมูล 2 คลาส และต้องทำนายคลาสของจุดเป้าหมาย T = (0,0,0) ด้วยวิธี 3-NN โดยคำนวณทั้ง:
- Euclidean distance
- Manhattan distance
ข้อมูล:
- Class A:
- A1 = (2,3,0)
- A2 = (5,7,2)
- A3 = (1,6,1)
- A4 = (3,4,3)
- A5 = (2,8,5)
- Class B:
- B1 = (7,5,9)
- B2 = (9,4,10)
- B3 = (6,2,12)
- B4 = (8,7,11)
- B5 = (10,6,10)
สูตรที่ใช้
- Euclidean (3 มิติ): d = sqrt((x-0)^2 + (y-0)^2 + (z-0)^2)
- Manhattan (3 มิติ): d = |x-0| + |y-0| + |z-0|
ตารางคำนวณระยะจาก T=(0,0,0)
| Point | Coordinates (x,y,z) | Class | Euclidean Distance | Manhattan Distance |
|---|---|---|---|---|
| A1 | (2,3,0) | A | sqrt(13) = 3.606 | 5 |
| A2 | (5,7,2) | A | sqrt(78) = 8.832 | 14 |
| A3 | (1,6,1) | A | sqrt(38) = 6.164 | 8 |
| A4 | (3,4,3) | A | sqrt(34) = 5.831 | 10 |
| A5 | (2,8,5) | A | sqrt(93) = 9.644 | 15 |
| B1 | (7,5,9) | B | sqrt(155) = 12.450 | 21 |
| B2 | (9,4,10) | B | sqrt(197) = 14.036 | 23 |
| B3 | (6,2,12) | B | sqrt(184) = 13.565 | 20 |
| B4 | (8,7,11) | B | sqrt(234) = 15.297 | 26 |
| B5 | (10,6,10) | B | sqrt(236) = 15.362 | 26 |
จัดอันดับระยะ (น้อยไปมาก)
Euclidean
- A1 = 3.606 (A)
- A4 = 5.831 (A)
- A3 = 6.164 (A)
- A2 = 8.832 (A)
- A5 = 9.644 (A)
- B1 = 12.450 (B)
- B3 = 13.565 (B)
- B2 = 14.036 (B)
- B4 = 15.297 (B)
- B5 = 15.362 (B)
3 จุดที่ใกล้สุด (k=3): A1, A4, A3 -> A, A, A
Manhattan
- A1 = 5 (A)
- A3 = 8 (A)
- A4 = 10 (A)
- A2 = 14 (A)
- A5 = 15 (A)
- B3 = 20 (B)
- B1 = 21 (B)
- B2 = 23 (B)
- B4 = 26 (B)
- B5 = 26 (B)
3 จุดที่ใกล้สุด (k=3): A1, A3, A4 -> A, A, A
สรุปคำตอบ
- ผลจาก Euclidean: ทำนายเป็น Class A
- ผลจาก Manhattan: ทำนายเป็น Class A
ดังนั้นจุด T=(0,0,0) ถูกจัดให้อยู่ใน Class A ทั้งสองวิธี