CellTree is an open-source R/bioconductor package to infer the hierarchical structure of cell populations from single-cell RNA-seq data, using Latent Dirichlet Analysis and dedicated tree-building heuristics.
ビッグデータから、ある現象に関する原因究明を行う際、統計的手法が多く用いられますが、その結果の信頼性に関しては、なんの評価値も与えられない場合が多く、誤った結果により損害が発生することもあります。本研究では、離散数学と、従来の統計科学を融合した離散構造統計学を創出し、原因究明精度の飛躍的改善を達成します。国内三カ所の有力がん研究機関と連携し、開発した新統計手法を利用して、新生児5000人に一人の高確率で発症する小児がんである神経芽腫の原因究明に挑戦します。
We designed a Regularisation-path algorithm that uses patterns of input variables (itemsets) as covariates to fit a Cox Proportional Hazards regression model. Full description of method and algorithm published in Oxford Journal's Bioinformatics (based on work by Park & Hastie (2006): L1 Regularization Path Algorithm for Generalized Linear Models).
The entire source code (in R) for this project, can be found on a public GitHub repository.