Картирование Sammon-это нелинейный метод уменьшения размерности, который используется для представления высокомерных данных в более низком пространстве, сохраняя при этом парные расстояния между точками данных. Техника была представлена Джоном В. Саммоном -младшим в 1969 году.
Алгоритм отображения Саммона пытается минимизировать функцию напряжения, которая количественно определяет разницу между парными расстояниями в исходном высокомерном пространстве и парными расстояниями в нижнем пространстве. Алгоритм итеративно регулирует положения точек данных в пространстве нижних размеров, пока функция напряжения не будет сведена к минимуму.
Функция Саммона в этой библиотеке обеспечивает реализацию алгоритма отображения Саммона. Функция принимает следующие параметры:
x : массивная, форма (n_samples, n_features) Входные данные.
n : int, необязательно (по умолчанию: 2) размерность выходного пространства. По умолчанию 2.
display : int, необязательно (по умолчанию: 0) отображать информацию о итерации или нет. По умолчанию 0.
inputdist : str, необязательный (по умолчанию: «необработанный») тип метрики расстояния, используемой в входном пространстве.
Возможные значения:
maxhalves : int, необязательно (по умолчанию: 20) максимальное количество раз, когда можно применить процедуру этапа. По умолчанию 20.
maxiter : int, необязательно (по умолчанию: 500) максимальное количество итераций. По умолчанию 500.
tolfun : Float, необязательный (по умолчанию: 1E-9) допуск к изменению функции напряжения. По умолчанию 1e-9.
init : str, необязательный (по умолчанию: «PCA») Тип инициализации, используемой для выходного пространства.
Возможные значения:
y : массивная, форма (n_samples, n_components) преобразованные выходные данные.
stress : Плоть конечное значение функции напряжения.
Эта реализация основана на алгоритме, описанном в следующей статье:
Саммон, JW (1969). Нелинейное отображение для анализа структуры данных. IEEE транзакции на компьютерах, C-18 (5), 401-409. doi: 10.1109/tc.1969.222678