生物科学门户网站
BIO1000.COM

大型复杂数据集的可视化方面的进步

对主要的数据可视化工具t分布随机邻域嵌入(t-SNE)的改进,称为优化的t-SNE(opt-SNE),为研究人员准确查看其中的内容提供了新的亮点。他们的数据集。

opt-SNE是近十年前广泛使用的t-SNE的改进。尽管t-SNE可以准确分析任何给定样本中的大约一百万个细胞,但近年来,单细胞数据集已经变得更大。借助opt-SNE,研究人员现在可以以前所未有的分辨率可视化包含数千万个细胞的样本中的数据。

opt-SNE的开发由波士顿大学医学院(BUSM)病理学和实验室医学助理教授Anna Belkina博士领导。

除了能够正确处理大型数据集之外,opt-SNE还能够成功地可视化所测血样中很小的不同细胞群(这些组中的每个细胞十分罕见,占总数的十万分之一)样本中的细胞数)。在opt-SNE之前,这种精确的大规模可视化不可能同时放大微小的种群。“ t-SNE最初是一种“千篇一律”的算法,但是opt-SNE计算是针对每个单独的数据集量身定制的,因此可以鸟瞰和近距离查看样品中的物质。 opt-SNE,既可以看到大海捞针,也可以看到里面的针头。”该研究的通讯作者Belkina解释说。”

使用t-SNE(左)和opt-SNE(中,右)可视化2000万个人类血细胞样本中的不同人群

opt-SNE使研究人员可以找出以前无法检测到的特征,从而将病变样品与对照区分开。这种进入疾病状态的新视角可能揭示出治疗的新目标以及新的生物学现象。由于Belkina与主要的单细胞数据分析平台的开发人员正在进行的合作,该方法已被多个研究小组采用,后者已将opt-SNE实施到Omiq.ai云分析平台(Christopher Ciccolella,MS)和FlowJo软件(Josef Spidlen)中,博士和Richard Halpert博士)并共同撰写了手稿。开源的opt-SNE软件包也已发布。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。