Sammonマッピングは、データポイント間のペアワイズ距離を可能な限り保存しながら、低次元空間で高次元データを表すために使用される非線形寸法削減技術です。この技術は、1969年にジョン・W・サモン・ジュニアによって導入されました。
Sammonマッピングアルゴリズムは、元の高次元空間のペアワイズ距離と下寸法空間のペアワイズ距離の差を定量化する応力関数を最小限に抑えようとします。アルゴリズムは、応力関数が最小化されるまで、低次元空間のデータポイントの位置を繰り返し調整します。
このライブラリのSammon関数は、Sammonマッピングアルゴリズムの実装を提供します。関数は次のパラメーターを取得します。
x :アレイのような、形状(n_samples、n_features)入力データ。
n :int、オプション(デフォルト:2)出力空間の次元。デフォルトは2です。
display :int、オプション(デフォルト:0)反復情報を表示するかどうか。デフォルトは0です。
inputdist :str、optional(default: 'raw')入力空間で使用される距離メトリックのタイプ。
考えられる値は次のとおりです。
maxhalves :int、optional(default:20)ステップハービング手順の最大回数を適用できます。デフォルトは20です。
maxiter :int、オプション(デフォルト:500)最大反復数。デフォルトは500です。
tolfun :float、オプション(デフォルト:1E-9)ストレス関数の変化に対する許容範囲。デフォルトは1E-9です。
init :str、オプション(デフォルト: 'pca')出力スペースに使用される初期化のタイプ。
考えられる値は次のとおりです。
y :アレイのような、形状(n_samples、n_components)変換された出力データ。
stress :ストレス関数の最終値を浮かびます。
この実装は、次の論文で説明されているアルゴリズムに基づいています。
Sammon、JW(1969)。データ構造分析のための非線形マッピング。コンピューターでのIEEEトランザクション、C-18(5)、401-409。 doi: 10.1109/tc.1969.222678