Data Mining Exercise 10

This article provides a solution to a K-NN classification problem using both Euclidean and Manhattan distance metrics.

K-NN Solution From Given Problem

โจทย์

ให้ข้อมูล 2 คลาส และต้องทำนายคลาสของจุดเป้าหมาย T = (0,0,0) ด้วยวิธี 3-NN โดยคำนวณทั้ง:

  • Euclidean distance
  • Manhattan distance

ข้อมูล:

  • Class A:
    • A1 = (2,3,0)
    • A2 = (5,7,2)
    • A3 = (1,6,1)
    • A4 = (3,4,3)
    • A5 = (2,8,5)
  • Class B:
    • B1 = (7,5,9)
    • B2 = (9,4,10)
    • B3 = (6,2,12)
    • B4 = (8,7,11)
    • B5 = (10,6,10)

สูตรที่ใช้

  • Euclidean (3 มิติ): d = sqrt((x-0)^2 + (y-0)^2 + (z-0)^2)
  • Manhattan (3 มิติ): d = |x-0| + |y-0| + |z-0|

ตารางคำนวณระยะจาก T=(0,0,0)

PointCoordinates (x,y,z)ClassEuclidean DistanceManhattan Distance
A1(2,3,0)Asqrt(13) = 3.6065
A2(5,7,2)Asqrt(78) = 8.83214
A3(1,6,1)Asqrt(38) = 6.1648
A4(3,4,3)Asqrt(34) = 5.83110
A5(2,8,5)Asqrt(93) = 9.64415
B1(7,5,9)Bsqrt(155) = 12.45021
B2(9,4,10)Bsqrt(197) = 14.03623
B3(6,2,12)Bsqrt(184) = 13.56520
B4(8,7,11)Bsqrt(234) = 15.29726
B5(10,6,10)Bsqrt(236) = 15.36226

จัดอันดับระยะ (น้อยไปมาก)

Euclidean

  1. A1 = 3.606 (A)
  2. A4 = 5.831 (A)
  3. A3 = 6.164 (A)
  4. A2 = 8.832 (A)
  5. A5 = 9.644 (A)
  6. B1 = 12.450 (B)
  7. B3 = 13.565 (B)
  8. B2 = 14.036 (B)
  9. B4 = 15.297 (B)
  10. B5 = 15.362 (B)

3 จุดที่ใกล้สุด (k=3): A1, A4, A3 -> A, A, A

Manhattan

  1. A1 = 5 (A)
  2. A3 = 8 (A)
  3. A4 = 10 (A)
  4. A2 = 14 (A)
  5. A5 = 15 (A)
  6. B3 = 20 (B)
  7. B1 = 21 (B)
  8. B2 = 23 (B)
  9. B4 = 26 (B)
  10. B5 = 26 (B)

3 จุดที่ใกล้สุด (k=3): A1, A3, A4 -> A, A, A


สรุปคำตอบ

  • ผลจาก Euclidean: ทำนายเป็น Class A
  • ผลจาก Manhattan: ทำนายเป็น Class A

ดังนั้นจุด T=(0,0,0) ถูกจัดให้อยู่ใน Class A ทั้งสองวิธี