来自杂志 bioRxiv 的文献。
当前共找到 42 篇文献分享,本页显示第 41 - 42 篇。
41.
颜林林 (2022-06-01 07:41):
#paper doi:10.1101/2022.05.29.493900 bioRxiv 2022, Cost-efficient whole genome-sequencing using novel mostly natural sequencing-by-synthesis chemistry and open fluidics platform. 这是来自MIT的一家创业公司Ultima Genomics的新作品,它从设计原理上对当前“边合成边测序”的方法进行突破创新。通过在圆形大晶片上设计流控和光学系统,使相应的试剂耗材更加便宜。相对于Illumina测序在每个cycle进行可逆阻断的碱基追加方法,本文通过使用非阻断的方法,使碱基追加过程更加快速,同时配合一套CNN算法,来实现准确的base calling。实测下来,该测序方法可以做到在20小时以内、300bp长读长、Q30>85%高质量的高通量测序,且每Gb数据成本低于1美元。本文还使用GIAB及千人基因组的样本进行了基准测试,验证了测序结果的准确度。我们很多人天天都在围绕高通量测序做研究,早已把Illumina测序原理当做习以为常且理所当然的技术,默认了它的垄断和天花板地位,很少去考虑它还有什么可以进一步改善的地方。这篇文章是个拓展这方面眼界的机会。
Abstract:
We introduce a massively parallel novel sequencing platform that combines an open flow cell design on a circular wafer with a large surface area and mostly natural nucleotides that allow … >>>
We introduce a massively parallel novel sequencing platform that combines an open flow cell design on a circular wafer with a large surface area and mostly natural nucleotides that allow optical end-point detection without reversible terminators. This platform enables sequencing billions of reads with longer read length (~300bp) and fast runs times (<20hrs) with high base accuracy (Q30 > 85%), at a low cost of $1/Gb. We establish system performance by whole-genome sequencing of the Genome-In-A-Bottle reference samples HG001-7, demonstrating high accuracy for SNPs (99.6%) and Indels in homopolymers up to length 10 (96.4%) across the vast majority (>98%) of the defined high-confidence regions of these samples. We demonstrate scalability of the whole-genome sequencing workflow by sequencing an additional 224 selected samples from the 1000 Genomes project achieving high concordance with reference data. <<<
翻译
42.
颜林林 (2022-03-06 20:48):
#paper doi:10.1101/2021.07.19.452956, bioRxiv, 2022, The Tabula Sapiens: a multiple organ single cell transcriptomic atlas of humans. 这是一篇preprint,介绍了对于单细胞转录组测序而言非常重磅的一项资源。它纳入了15位捐赠者(一般由于中风、外伤或缺氧等导致死亡,参见:https://tabula-sapiens-portal.ds.czbiohub.org/whereisthedata)所提供的24个不同组织器官,分离得到将近50万个单细胞,分别进行了10x和/或SmartSeq2的单细胞转录组测序技术,分析得到400多种细胞类型的组织特异性表达数据,提供了组织间T细胞克隆分布、B细胞组织特异性突变率、细胞周期状态及不同细胞在组织器官之间的分布、个体不同组织间细胞类型特异性RNA剪接形式等重要参考基准图谱信息。同时,通过对样本进行病理切片和H&E染色等分析,也将转录组数据与宏观临床相关信息,如不同组织类型的空间异质性、细胞相对丰度估计等都做了关联和讨论。这个项目由 Tabula Sapiens Consortium 执行,其数据(包括原始测序数据和分析结果)存放在AWS、FigShare、CellXGene等平台,供全世界开放使用(但不允许在未征得该委员会及合作方同意前发表图谱或组织规模的数据分析文章),相关信息可在项目网站(https://tabula-sapiens-portal.ds.czbiohub.org/)上找到,该网站还提供了一套流程,帮助用户使用其结果来注释和解读自己的数据。有两点很值得一提:一、该委员会及项目主要由 Chan Zuckerberg Initiative 基金会支持,该基金会由 Facebook创始人马克·扎克伯格及其妻子普莉希拉·陈(生物学专业)共同创办,bioRxiv和medRxiv也是由该基金会支持建立和维持运营;二、这篇文章的通讯作者Stephen R Quake,是生物技术领域的超级大牛,他也应该是在很早期将自己基因组贡献出来验证相关高通量测序技术的名人之一,可参见2009年NBT文章(doi:10.1038/nbt.1561),该文章的受试者P0(猜测很可能就是Quake本人),基于已成为历史的Helicos Biosciences公司的单分子高通量测序技术(应该属于三代测序体系;要知道,二代测序的兴起,也仅仅开始于2008年左右),测定了该技术的最早人全基因组数据。Quake的贡献及事迹这里不做展开,有兴趣者可自行搜索。
回到顶部