如果您在科学出版物中使用该软件,请引用该软件:
Dive是一个交互式的3D网络查看器,在一个代表数据的屏幕上,最多可达百万分。它的目的是为查看以前已嵌入3D中的高维数据提供交互。为了嵌入(非线性维度降低或流动学习),我们建议使用大型VIS(Microsoft Research的新算法)或TSNE。
有关在线演示,请单击此处。您还可以使用此站点上传符合下面描述的数据格式的数据集。
新:Linux的管道由大节和潜水组成,已在此处发布:https://github.com/sonjageorgiegska/embed-dive。
最简单的方法是通过浏览器下载代码并打开index.html 。通过从数据文件夹上传数据集来尝试一下。该应用程序可以完全离线工作。
将其与本地HTTP服务器一起使用:
npm install connect serve-staticnode server.jshttp://localhost:8082/index.html npm install以安装所有构建要求grunt 。由此产生的编译JavaScript将位于dist/ ,文档将在doc/ 每个点都有3个坐标和一个独特的ID。 (为了最好的观点,坐标的绝对值应小于1。当使用具有相似性(权重)作为输入的大个子时,可以通过重新缩放相似性以小于1来实现这一点。
一个点也具有Properties :
Properties是可以空的字符串列表。每个数字的字符串代表相应数值属性的值。每个数字的字符串代表相应分类属性的值。这些值用于Web页面UI的着色部分。当用户选择属性时,如果属性具有分类(非数字)值,则每个点都以代表分类属性值的颜色为颜色。如果属性是数字的,则在用户选择颜色后,每个点都会颜色为所选颜色的阴影。颜色的强度对应于特定点所选特性的强度。节点也可以具有与之关联的图像,请参阅“数据格式”部分以获取更多信息。
用户可以使用搜索部分搜索所有在其ID,名称或属性中包含特定子字符串的点。然后,所有比赛的点变成红色,其余的变成灰色。还可以搜索正则表达式的布尔表达式。布尔表达的一个示例是xx AND yy OR NOT zz ,其中xx,yy和zz是正则表达式,并且不超过和结合,它比OR绑定更多。在这种情况下,所有包含其元数据中的点XX和YY,或不包含ZZ的所有点,将以红色为颜色。
显示仅找到节点只会显示搜索产生的节点。
底部的简历颜色按钮将点的颜色返回到先前的着色方案。
如节数据描述和功能所述。
数据采用JSON(JavaScript对象符号)格式。 (有关示例,请参见文件夹数据。)获取数据。JS ,首先是数据结构
Dictionary<string, Point>
是在任何编程语言中创建的,其中键是点的ID,而Point是类的对象
public class Point
{
public List<double> Coordinates;
public List<double> Properties;
}
Coordinates和Properties如上一节所讨论。
接下来,使用JavaScriptSerializer序列化字典并用Data.json编写(名称是灵活的)。这是data.json文件中序列化字典的输入的示例:
"3951" : {
"Coordinates" : [ 0.99860800383893167 , 0.61276015046241838 , 0.450976426942296 ],
"Properties" : [ " 0 " , " 1 " , " 5 " , " 12688892 " , " 0.998 " , " 5 " , " True " , " 0 " , " False " , " 5 " , " 1 " , " True " , " 1 " , " 518 " , " 0 " , " -1 " , " Rhodotorula " , " " , " Sporidiobolales " , " Microbotryomycetes " ]
}可选地,如果数据具有属性,则字典还应包含一个条目
"NamesOfProperties" :[ " name1 " , " name2 " , , " name_n " ] (可选),如果图像与节点关联,则在悬停在节点上时,节点图像可以显示在弹出窗口中。如果DataFile以namedataset_开头,则具有图像的文件夹应为文件夹data中的images_namedataset 。 (请参阅文件夹data中的示例,很抱歉它们的大小)。图像的名称应为nodeId.jpg 。
如果您的映像具有.png扩展名,则可以选择fingerprints_namedataset文件夹,尽管目前是用于夏洛克的目的。
大节的输出是一个文本文件 - 每行都有该点的ID,而3个坐标(实数)。只有第一行是一个例外:它包含点的数量和维度。这是一个示例:
4271 3
0 -33.729916 17.692684 17.466749
1 -32.923210 17.249269 18.111458
可以通过使用Python脚本“ MakeVizDatawithPropermetadata.py”将其处理成查看器的输入。它被称为
python MakeVizDataWithProperMetaData.py -coord coordinatesFile -metadata metaDataFile -dir baseDir -np -namesOfPropertiesFile
coordinatesFile :大个子的输出文件
metaData :包含有关数据的元信息的文件。格式: [id] [metadata] 。元数据的格式: "first_line" "second_line" "third_line" (行数不限)。 metadata的示例线: 35 "A dog" "Age:2" "Color brown" 。
baseDir :存储输出文件的基本目录
namesOfPropertiesFile :一个包含属性名称列表的JSON文件。例如: ["Height", "Weight", "Place of birth"] 。如果省略了文件,则其名称应为"No"
该软件是根据GPL2许可发布的。如果您想要具有Apache许可证的版本,请联系作者