全部版块 我的主页
论坛 经济学人 二区 外文文献专区
381 0
2022-03-13
摘要翻译:
我们引入了一种图论方法,在不使用任何先验信息的情况下,以无监督和确定性的方式提取复杂数据集中的聚类和层次。这是通过构建包含最重要链路子集的拓扑嵌入网络并分析网络结构来实现的。对于平面嵌入,该方法提供了描述簇组成方式的簇内层次结构和描述簇聚集方式的簇间层次结构。首先通过对几个人工数据集的研究,我们讨论了该方法的性能、鲁棒性和可靠性,发现它可以显著优于其他已有的方法。然后我们证明了我们的方法可以成功地在各种真实数据集中区分出有意义的聚类和层次结构。特别是,我们发现对淋巴瘤样本基因表达模式的应用揭示了生物学上有意义的基因群,这些基因群在一些最相关的人类淋巴恶性肿瘤的诊断、预后和治疗中发挥着关键作用。
---
英文标题:
《Hierarchical information clustering by means of topologically embedded
  graphs》
---
作者:
Won-Min Song, T. Di Matteo, Tomaso Aste
---
最新提交年份:
2011
---
分类信息:

一级分类:Physics        物理学
二级分类:Data Analysis, Statistics and Probability        数据分析、统计与概率
分类描述:Methods, software and hardware for physics data analysis: data processing and storage; measurement methodology; statistical and mathematical aspects such as parametrization and uncertainties.
物理数据分析的方法、软硬件:数据处理与存储;测量方法;统计和数学方面,如参数化和不确定性。
--
一级分类:Computer Science        计算机科学
二级分类:Data Structures and Algorithms        数据结构与算法
分类描述:Covers data structures and analysis of algorithms. Roughly includes material in ACM Subject Classes E.1, E.2, F.2.1, and F.2.2.
涵盖数据结构和算法分析。大致包括ACM学科类E.1、E.2、F.2.1和F.2.2中的材料。
--
一级分类:Physics        物理学
二级分类:Biological Physics        生物物理学
分类描述:Molecular biophysics, cellular biophysics, neurological biophysics, membrane biophysics, single-molecule biophysics, ecological biophysics, quantum phenomena in biological systems (quantum biophysics), theoretical biophysics, molecular dynamics/modeling and simulation, game theory, biomechanics, bioinformatics, microorganisms, virology, evolution, biophysical methods.
分子生物物理、细胞生物物理、神经生物物理、膜生物物理、单分子生物物理、生态生物物理、生物系统中的量子现象(量子生物物理)、理论生物物理、分子动力学/建模与模拟、博弈论、生物力学、生物信息学、微生物、病毒学、进化论、生物物理方法。
--
一级分类:Quantitative Biology        数量生物学
二级分类:Quantitative Methods        定量方法
分类描述:All experimental, numerical, statistical and mathematical contributions of value to biology
对生物学价值的所有实验、数值、统计和数学贡献
--
一级分类:Quantitative Finance        数量金融学
二级分类:Computational Finance        计算金融学
分类描述:Computational methods, including Monte Carlo, PDE, lattice and other numerical methods with applications to financial modeling
计算方法,包括蒙特卡罗,偏微分方程,格子和其他数值方法,并应用于金融建模
--

---
英文摘要:
  We introduce a graph-theoretic approach to extract clusters and hierarchies in complex data-sets in an unsupervised and deterministic manner, without the use of any prior information. This is achieved by building topologically embedded networks containing the subset of most significant links and analyzing the network structure. For a planar embedding, this method provides both the intra-cluster hierarchy, which describes the way clusters are composed, and the inter-cluster hierarchy which describes how clusters gather together. We discuss performance, robustness and reliability of this method by first investigating several artificial data-sets, finding that it can outperform significantly other established approaches. Then we show that our method can successfully differentiate meaningful clusters and hierarchies in a variety of real data-sets. In particular, we find that the application to gene expression patterns of lymphoma samples uncovers biologically significant groups of genes which play key-roles in diagnosis, prognosis and treatment of some of the most relevant human lymphoid malignancies.
---
PDF链接:
https://arxiv.org/pdf/1110.4477
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群