研究人员开发空间转录组生物组织亚结构解析新工具(张世华等)

2022-04-02 | 撰稿: | 浏览:

       近年来,空间转录组学(Spatial Transcriptomics,简称ST)的突破性进展使得研究人员在全基因组层面测量组织切片中特定空间位点的基因表达信息成为可能,这为研究人员破译组织的空间结构,理解复杂的生物学功能提供了条件。组织切片中具有相似基因表达空间模式的区域形成组织中特异的亚结构(简称为空间域)。精确破译空间域是空间转录组数据解析中最基本和关键的环节。然而,适用于单细胞异质性识别的经典聚类方法,并没有充分利用空间位置信息,导致聚类结果极易受到技术噪音的影响,在空间中往往是过度离散的。 
      2022年4月1日,中国科学院数学与系统科学研究院张世华课题组在Nature Communications发表了题为“Deciphering spatial domains from spatially resolved transcriptomics with an adaptive graph attention auto-encoder”的研究论文,针对不同空间转录组技术、不同生物组织建立破译生物组织空间亚结构的新工具-STAGATE。 
该工具首先将空间位置信息转化为空间位点间的临近网络,然后将基因表达信息与空间临近网络输入图注意力自编码神经网络,学习整合了空间信息与表达信息的位点低维表示(图1)。与经典的自编码器不同,STAGATE在中间隐层中引入了图注意力机制,可以自适应的学习临近位点间异质的相似程度。最终,得到的低维表示用于后续聚类以识别二维组织切片的空间域。值得关注的是,STAGATE可用于分析不同分辨率、不同测序技术平台(包括10x Visium, Slide-seq, Stereo-seq等)的空间转录组数据。
图1. STAGATE算法工作流程图。

       研究人员将STAGATE应用于空间分辨率较高的两种(Slide-seqV2和Stereo-seq)小鼠绣球组织切片的空间转录组数据。相比其他方法,STAGATE更精确的刻画了小鼠绣球中的层次结构,显示了其在不同平台数据中的稳健性和通用性(图2)。STAGATE还通过引入临近切片间的空间临近信息的方式实现了对三维空间域的识别。研究人员在一个通过堆叠连续切片产生的小鼠海马体合成三维空间数据中进行了测试,三维空间网络的引入显著降低了切片间的批次效应,确保了三维空间结构的准确识别。
图2. STAGATE准确鉴别了两种不同技术Stereo-seq和Slide-seqV2空间转录组表征的小鼠嗅球组织切片的层状组织。
 
       简而言之,该工作开发了结合空间与表达信息的生物组织亚结构解析新工具STAGATE。随着空间转录组技术的日益推广和数据的不断积累,STAGATE将对大规模空间转录组数据的精确解析提供助力。
      论文信息:Dong, K., Zhang, S. Deciphering spatial domains from spatially resolved transcriptomics with an adaptive graph attention auto-encoder. Nat Commun 13, 1739 (2022).https://doi.org/10.1038/s41467-022-29439-6    

科研进展中国科学院数学与系统科学研究院应用数学研究所
地址 北京市海淀区中关村东路55号 思源楼6-7层 南楼5-6、8层 邮编:100190 电子邮箱:iam@amss.ac.cn
@2000-2022 京ICP备05058656号-1