Pemetaan Sammon adalah teknik pengurangan dimensi nonlinier yang digunakan untuk mewakili data dimensi tinggi dalam ruang dimensi yang lebih rendah sambil menjaga jarak berpasangan antara titik data sebanyak mungkin. Teknik ini diperkenalkan oleh John W. Sammon Jr. pada tahun 1969.
Algoritma pemetaan Sammon mencoba meminimalkan fungsi tegangan yang mengukur perbedaan antara jarak berpasangan dalam ruang dimensi tinggi asli dan jarak berpasangan dalam ruang dimensi yang lebih rendah. Algoritma secara iteratif menyesuaikan posisi titik data dalam ruang dimensi yang lebih rendah sampai fungsi tegangan diminimalkan.
Fungsi Sammon di perpustakaan ini menyediakan implementasi algoritma pemetaan Sammon. Fungsi mengambil parameter berikut:
x : seperti array, bentuk (n_samples, n_features) data input.
n : int, opsional (default: 2) dimensi ruang output. Standarnya adalah 2.
display : int, opsional (default: 0) apakah akan menampilkan informasi iterasi atau tidak. Standarnya adalah 0.
inputdist : str, opsional (default: 'mentah') Jenis metrik jarak yang digunakan dalam ruang input.
Nilai yang mungkin adalah:
maxhalves : int, opsional (default: 20) Jumlah maksimum Prosedur separuh langkah dapat diterapkan. Standarnya adalah 20.
maxiter : int, opsional (default: 500) Jumlah maksimum iterasi. Standarnya adalah 500.
tolfun : float, opsional (default: 1e-9) Toleransi untuk perubahan fungsi stres. Standarnya adalah 1E-9.
init : str, opsional (default: 'pca') Jenis inisialisasi yang digunakan untuk ruang output.
Nilai yang mungkin adalah:
y : seperti array, bentuk (n_samples, n_components) data output yang diubah.
stress : Mengapungkan nilai akhir dari fungsi stres.
Implementasi ini didasarkan pada algoritma yang dijelaskan dalam makalah berikut:
Sammon, JW (1969). Pemetaan nonlinier untuk analisis struktur data. Transaksi IEEE pada komputer, C-18 (5), 401-409. doi: 10.1109/tc.1969.222678