笑对人生 (2022-10-07 22:00):
#paper doi: 10.1038/s41467-022-30033-z. Reference-free cell type deconvolution of multi-cellular pixel-resolution spatially resolved transcriptomics data. Nat Commun. 2022 Apr 29;13(1):2339. 空间转录组技术能够揭示组织内不同区域的细胞转录谱特征,对理解组织的细胞生物学功能具有重要意义。然而,目前空间转录组技术存在一定的局限性,一是基于测序的空间转录组技术分辨率较低,无法达到真正的单细胞水平,二是基于原位杂交或显微成像的空间转录组技术检测的RNA数量有限且价格昂贵。 为了解决上述的问题,科学家开发了一系列整合单细胞转录组数据和空间转录组的算法,用于预测多细胞空间分辨率(multi-cellular pixel-resolution)下的细胞类型和复原单个细胞的完整转录表达谱。SPOTlight主要是利用来自单细胞转录组数据(scRNA-seq)的细胞类型标记基因矩阵,基于种子非负向矩阵分解方法对空间转录组的捕获位置(spot)进行细胞类型去卷积。RCTD需要利用scRNA-seq中每种细胞类型所有marker基因的表达均值作为参考数据的输入,用于建立能够反映spot内每种细胞贡献的概率统计模型,进而预测细胞类型及其比例。SpatialDWLS首先使用来自scRNAseq的细胞类型特征基因去做GSEA富集,然后利用阻尼最小二乘法(dampened weighted least squares)算法推断spot的细胞类型组成。然而,以上的这些方法均依赖于合适的scRNAseq数据,受成本、技术和生物学差异等因素的影响较大。尽管目前已公布了众多的健康人器官或组织图谱文章,但也可能存在批次效应和异质性问题。此外,基于液滴的scRNAseq需要对组织进行解离和捕获,可能会导致scRNAseq鉴定细胞类型和空间转录组不一致的问题。基于以上种种原因,有必要开发一种无需参考数据的spot细胞类型解卷积方法。 STdeconvolve是一个无需单细胞参考数据即可对空间转录组数据进行细胞类型反卷积的软件包。STdeconvolve的核心算法是隐狄利克雷分配模型(Latent Dirichlet Allocation,LDA)。LDA是自然语言处理中被普遍使用的一种统计模型,可以用于发现文档集(documents)中潜在的主题(latent topics),并最终以概率分布的形式输出。当LDA应用到空间转录组数据时,则以多细胞空间分辨率下的基因表达计数矩阵(count matrix)作为输入,进而推断每种细胞类型(主题)的转录表达谱和每种细胞类型的占比。无论是在模拟的ST数据,还是在不同分辨率的空间转录组数据(10X Visium、DBiT-seq和Slide-seq),STdeconolve都能够有效地复原组织内某一细胞类型的转录表达谱信息以及在原分辨率下的每种细胞占比。当存在匹配的单细胞参考数据集时,STdeconolve的细胞类型反卷积性能与其他依赖参考数据的软件相当。而当缺乏匹配数据集时,STdeconolve的性能更优。文章中的性能评价指标是均方根误差(Root Mean Square Error,RMSE),RMSE可用于表示模型预测中产生的误差大小,一般来说,RMSE越小,表示模型的预测能力越好。
IF:14.700Q1 Nature communications, 2022-04-29. DOI: 10.1038/s41467-022-30033-z PMID: 35487922
Reference-free cell type deconvolution of multi-cellular pixel-resolution spatially resolved transcriptomics data
翻译
Abstract:
Recent technological advancements have enabled spatially resolved transcriptomic profiling but at multi-cellular pixel resolution, thereby hindering the identification of cell-type-specific spatial patterns and gene expression variation. To address this challenge, we develop STdeconvolve as a reference-free approach to deconvolve underlying cell types comprising such multi-cellular pixel resolution spatial transcriptomics (ST) datasets. Using simulated as well as real ST datasets from diverse spatial transcriptomics technologies comprising a variety of spatial resolutions such as Spatial Transcriptomics, 10X Visium, DBiT-seq, and Slide-seq, we show that STdeconvolve can effectively recover cell-type transcriptional profiles and their proportional representation within pixels without reliance on external single-cell transcriptomics references. STdeconvolve provides comparable performance to existing reference-based methods when suitable single-cell references are available, as well as potentially superior performance when suitable single-cell references are not available. STdeconvolve is available as an open-source R software package with the source code available at https://github.com/JEFworks-Lab/STdeconvolve .
翻译
回到顶部