如果您在科學出版物中使用該軟件,請引用該軟件:
Dive是一個交互式的3D網絡查看器,在一個代表數據的屏幕上,最多可達百萬分。它的目的是為查看以前已嵌入3D中的高維數據提供交互。為了嵌入(非線性維度降低或流動學習),我們建議使用大型VIS(Microsoft Research的新算法)或TSNE。
有關在線演示,請單擊此處。您還可以使用此站點上傳符合下面描述的數據格式的數據集。
新:Linux的管道由大節和潛水組成,已在此處發布:https://github.com/sonjageorgiegska/embed-dive。
最簡單的方法是通過瀏覽器下載代碼並打開index.html 。通過從數據文件夾上傳數據集來嘗試一下。該應用程序可以完全離線工作。
將其與本地HTTP服務器一起使用:
npm install connect serve-staticnode server.jshttp://localhost:8082/index.html npm install以安裝所有構建要求grunt 。由此產生的編譯JavaScript將位於dist/ ,文檔將在doc/ 每個點都有3個坐標和一個獨特的ID。 (為了最好的觀點,坐標的絕對值應小於1。當使用具有相似性(權重)作為輸入的大個子時,可以通過重新縮放相似性以小於1來實現這一點。
一個點也具有Properties :
Properties是可以空的字符串列表。每個數字的字符串代表相應數值屬性的值。每個數字的字符串代表相應分類屬性的值。這些值用於Web頁面UI的著色部分。當用戶選擇屬性時,如果屬性具有分類(非數字)值,則每個點都以代表分類屬性值的顏色為顏色。如果屬性是數字的,則在用戶選擇顏色後,每個點都會顏色為所選顏色的陰影。顏色的強度對應於特定點所選特性的強度。節點也可以具有與之關聯的圖像,請參閱“數據格式”部分以獲取更多信息。
用戶可以使用搜索部分搜索所有在其ID,名稱或屬性中包含特定子字符串的點。然後,所有比賽的點變成紅色,其餘的變成灰色。還可以搜索正則表達式的布爾表達式。布爾表達的一個示例是xx AND yy OR NOT zz ,其中xx,yy和zz是正則表達式,並且不超過和結合,它比OR綁定更多。在這種情況下,所有包含其元數據中的點XX和YY,或不包含ZZ的所有點,將以紅色為顏色。
顯示僅找到節點只會顯示搜索產生的節點。
底部的簡歷顏色按鈕將點的顏色返回到先前的著色方案。
如節數據描述和功能所述。
數據採用JSON(JavaScript對象符號)格式。 (有關示例,請參見文件夾數據。)獲取數據。 JS ,首先是數據結構
Dictionary<string, Point>
是在任何編程語言中創建的,其中鍵是點的ID,而Point是類的對象
public class Point
{
public List<double> Coordinates;
public List<double> Properties;
}
Coordinates和Properties如上一節所討論。
接下來,使用JavaScriptSerializer序列化字典並用Data.json編寫(名稱是靈活的)。這是data.json文件中序列化字典的輸入的示例:
"3951" : {
"Coordinates" : [ 0.99860800383893167 , 0.61276015046241838 , 0.450976426942296 ],
"Properties" : [ " 0 " , " 1 " , " 5 " , " 12688892 " , " 0.998 " , " 5 " , " True " , " 0 " , " False " , " 5 " , " 1 " , " True " , " 1 " , " 518 " , " 0 " , " -1 " , " Rhodotorula " , " " , " Sporidiobolales " , " Microbotryomycetes " ]
}可選地,如果數據具有屬性,則字典還應包含一個條目
"NamesOfProperties" :[ " name1 " , " name2 " , , " name_n " ] (可選),如果圖像與節點關聯,則在懸停在節點上時,節點圖像可以顯示在彈出窗口中。如果DataFile以namedataset_開頭,則具有圖像的文件夾應為文件夾data中的images_namedataset 。 (請參閱文件夾data中的示例,很抱歉它們的大小)。圖像的名稱應為nodeId.jpg 。
如果您的映像具有.png擴展名,則可以選擇fingerprints_namedataset文件夾,儘管目前是用於夏洛克的目的。
大節的輸出是一個文本文件 - 每行都有該點的ID,而3個坐標(實數)。只有第一行是一個例外:它包含點的數量和維度。這是一個示例:
4271 3
0 -33.729916 17.692684 17.466749
1 -32.923210 17.249269 18.111458
可以通過使用Python腳本“ MakeVizDatawithPropermetadata.py”將其處理成查看器的輸入。它被稱為
python MakeVizDataWithProperMetaData.py -coord coordinatesFile -metadata metaDataFile -dir baseDir -np -namesOfPropertiesFile
coordinatesFile :大個子的輸出文件
metaData :包含有關數據的元信息的文件。格式: [id] [metadata] 。元數據的格式: "first_line" "second_line" "third_line" (行數不限)。 metadata的示例線: 35 "A dog" "Age:2" "Color brown" 。
baseDir :存儲輸出文件的基本目錄
namesOfPropertiesFile :一個包含屬性名稱列表的JSON文件。例如: ["Height", "Weight", "Place of birth"] 。如果省略了文件,則其名稱應為"No"
該軟件是根據GPL2許可發布的。如果您想要具有Apache許可證的版本,請聯繫作者