การทำแผนที่ Sammon เป็นเทคนิคการลดมิติแบบไม่เชิงเส้นที่ใช้เพื่อแสดงข้อมูลมิติสูงในพื้นที่มิติที่ต่ำกว่าในขณะที่รักษาระยะทางคู่ระหว่างจุดข้อมูลให้มากที่สุด เทคนิคนี้ได้รับการแนะนำโดย John W. Sammon Jr. ในปี 1969
อัลกอริทึมการทำแผนที่ Sammon พยายามลดฟังก์ชั่นความเครียดที่ลดปริมาณความแตกต่างระหว่างระยะทางคู่ในพื้นที่มิติสูงดั้งเดิมและระยะทางคู่ในพื้นที่มิติที่ต่ำกว่า อัลกอริทึมจะปรับตำแหน่งของจุดข้อมูลซ้ำ ๆ ในพื้นที่มิติที่ต่ำกว่าจนกว่าฟังก์ชั่นความเครียดจะลดลง
ฟังก์ชั่น Sammon ในไลบรารีนี้ให้การใช้งานอัลกอริทึมการทำแผนที่ Sammon ฟังก์ชั่นใช้พารามิเตอร์ต่อไปนี้:
x : อาร์เรย์, รูปร่าง (n_samples, n_features) ข้อมูลอินพุต
n : Int, ตัวเลือก (ค่าเริ่มต้น: 2) มิติของพื้นที่เอาต์พุต ค่าเริ่มต้นคือ 2
display : int, ตัวเลือก (ค่าเริ่มต้น: 0) ไม่ว่าจะแสดงข้อมูลการทำซ้ำหรือไม่ ค่าเริ่มต้นคือ 0
inputdist : STR, ตัวเลือก (ค่าเริ่มต้น: 'RAW') ประเภทของตัวชี้วัดระยะทางที่ใช้ในพื้นที่อินพุต
ค่าที่เป็นไปได้คือ:
maxhalves : Int, ตัวเลือก (ค่าเริ่มต้น: 20) จำนวนสูงสุดของขั้นตอนขั้นตอนการลดขั้นตอนการลดลง ค่าเริ่มต้นคือ 20
maxiter : Int, ตัวเลือก (ค่าเริ่มต้น: 500) จำนวนสูงสุดของการวนซ้ำ ค่าเริ่มต้นคือ 500
tolfun : ลอย, เป็นตัวเลือก (ค่าเริ่มต้น: 1E-9) ความอดทนสำหรับการเปลี่ยนแปลงในฟังก์ชันความเครียด ค่าเริ่มต้นคือ 1E-9
init : STR, ตัวเลือก (ค่าเริ่มต้น: 'PCA') ประเภทของการเริ่มต้นที่ใช้สำหรับพื้นที่เอาต์พุต
ค่าที่เป็นไปได้คือ:
y : อาร์เรย์, รูปร่าง (n_samples, n_components) ข้อมูลเอาต์พุตที่แปลงแล้ว
stress : ลอยค่าสุดท้ายของฟังก์ชันความเครียด
การนำไปใช้นี้ขึ้นอยู่กับอัลกอริทึมที่อธิบายไว้ในบทความต่อไปนี้:
Sammon, JW (1969) การทำแผนที่แบบไม่เชิงเส้นสำหรับการวิเคราะห์โครงสร้างข้อมูล ธุรกรรม IEEE บนคอมพิวเตอร์, C-18 (5), 401-409 ดอย: 10.1109/tc.1969.222678