响马读paper

一个要求成员每月至少读一篇文献并打卡的学术交流社群

当前共有 918 篇文献,本页显示第 61 - 80 篇。

61.
2023, Proceedings of the National Academy of Sciences. DOI: 10.1073/pnas.2313269120
2023-12-30 08:42:00
#paper The quantum house of cards 10.1073/pnas.2313269120 Pub Date  : 2023-12-26 量子计算机已被提议解决许多重要问题,例如发现新药、肥料生产的新催化剂、破解加密协议、优化金融投资组合或实施新的人工智能应用。然而,迄今为止,诸如 3 乘以 5 之类的简单任务超出了现有的量子硬件的能力。本文探讨了量子计算机兑现其承诺需要解决的困难。我讨论了构建量子计算机的整个技术堆栈,从顶层(实际算法和相关应用程序)到最底层(量子硬件、其控制电子设备、低温等),而不是忘记了量子纠错的关键中间层。
62.
2023, Nature Computational Science. DOI: 10.1038/s43588-023-00573-5
2023-12-30 00:06:00
#paper,Using sequences of life-events to predict human lives. Nat Comput Sci (2023). Lives,https://doi.org/10.1038/s43588-023-00573-5,大语言模型可以精准算命了吗?是的!发表于Nature Computational Science的论文提出预测人生走向的模型,用与语言结构相似的方式来表示人类生活,将一系列人类行为事件构建为生命序列。该论文提出了一个名为life2vec的深度学习模型,用于预测人类生活轨迹的各种结果,比如早逝风险和个性特质。该模型基于Transformer架构,可以学习表示人生事件序列的稠密向量表示。研究使用了丹麦全国范围内约600万居民近10年的详细劳动力和医疗数据,构建了生活事件序列。L2V模型的Accuracy达到了78.8%(0.788 [0.782, 0.794])。 该模型包含三个组件:嵌入层、编码器和特定任务的解码器。模型首先通过masked language modeling任务和sequence ordering预测任务进行预训练,学习事件表示和序列结构。之后进行微调,通过早逝预测和个性特质预测等下游任务学习整个生活轨迹的向量表示。结果显示,该模型能够准确预测各种不同领域的结果,在早逝预测任务上明显优于当前最先进的方法。 研究同时分析了模型学习的事件表示空间和个体表示空间,发现它们具有明显的结构,能够体现事件之间的语义关联。该研究也证明了Transformer模型和大规模数据集可用于预测和理解个体生活轨迹,为社会科学和医疗健康领域的新研究打开了新的可能性。需要注意的是,该模型目前只用于研究目的,实际应用中有许多伦理考量需要谨慎对待。那么问题来了,还有什么是大模型所不能的呢。
63.
2023, arXiv. DOI: 10.48550/arXiv.2312.03701 arXiv ID: 2312.03701
2023-12-28 20:39:00
#paper https://doi.org/10.48550/arXiv.2312.03701 , Self-conditioned Image Generation via Generating Representations 这篇文章介绍了一种名为“表示条件图像生成”(RCG)的新型图像生成框架。RCG 不依赖于人类标注,而是基于自监督的表示分布来生成图像。使用预训练的编码器将图像分布映射到表示分布,然后通过表示扩散模型(RDM)从中采样,最后通过像素生成器根据采样的表示生成图像。RCG 在 ImageNet 256×256 数据集上实现了显著的性能提升,其 FID 和 IS 分别达到了 3.31 和 253.4。这个方法不仅显著提升了类无条件图像生成的水平,而且与当前领先的类条件图像生成方法相比也具有竞争力,弥补了这两种任务之间长期存在的性能差距。
64.
2018, Cytometry Part A. DOI: 10.1002/cyto.a.23690
2023-12-28 19:27:00
#paper doi:10.1002/cyto.a.23690 , Best Practices for Preparing a Single Cell Suspension from Solid Tissues for Flow Cytometry 本文是一篇综述,描述了从组织制备单细胞悬液的一般性经验和原则。制备单细胞悬液的本质是消化和降解掉细胞间的连接物,即胶原蛋白、蛋白聚糖和糖蛋白,同时也要注意试剂不能破坏细胞膜的完整性,以保护细胞表面分子的完整性,避免造成表位丢失。 分散酶、胶原酶、透明质酸酶用作将组织解离成小细胞团块,其中分散酶可能会破坏细胞表位。细胞-细胞间存在3种链接:1)闭塞连接、2)通信连接和3)锚定连接,使用胰蛋白酶或木瓜蛋白酶破坏他们。胰蛋白酶会对细胞膜蛋白有非常严重的影响,且会导致游离DNA诱导的细胞聚集,因此要避免使用。一种替代方案是木瓜蛋白酶,但其同样会导致游离 DNA 诱导的细胞聚集。还需要引入DNA酶来降解游离的DNA,通常使用DNase-I而非DNase-II,因为前者不启动细胞凋亡途径。钙离子在这一步是必要的,因其能充当DNA酶的激活剂。 关于酶的使用,确定酶解中所用酶的最佳强度和浓度是经验性的,对于正确分离细胞和成功消化组织至关重要。根据酶的不同,酶解也可以在 4°C或冰上进行,这些较低的温度可能会减慢酶的反应速率并延长潜伏期,但有助于最大限度地减少细胞死亡。 酶解结束后推荐使用流式计数,添加核染色剂可以区分完整细胞和细胞碎片,添加活性染料可以定量死细胞的百分比。如果下游是流式分析且需要保存一段时间,最好使用多聚甲醛固定,特别是对于脆弱/异质群体(例如肺单细胞)。 文章最后还提供了其他有益建议。
65.
2022, Journal of the American Chemical Society. DOI: 10.1021/jacs.2c04325
2023-12-28 11:25:00
#paper doi:10.1021/jacs.2c04325,JACS,2022,DNA Strand-Displacement Temporal Logic Circuits 这篇文章通过时间记忆的策略,结合DNA电路链置换反应,实现逻辑与门,用n个输入可以得到附带时序信息的n!个组合,对比传统电路只能得到n个输出结果的电路,很大程度提高了可拓展性,并在研究过程中发现改进门中杂交链的错配可用于降低电路设计的复杂性,缩短特定的立足点可用于提高电路行为的鲁棒性。为以后在更复杂的DNA计算提供了可能,该作者也正在研发此此类电路与神经网路和机器学习结合的新方法。
66.
2023, arXiv. DOI: 10.48550/arXiv.2312.11514 arXiv ID: 2312.11514
2023-12-27 15:11:00
#paper arXiv:2312.11514v1 ,2023, LLM in a flash: Efficient Large Language Model Inference with Limited Memory 大型语言模型(LLMs)在现代自然语言处理中具有重要作用,但其高昂的计算和内存需求对于内存有限的设备构成了挑战。为了高效运行超过可用DRAM容量的LLMs,该论文采用了存储模型参数在闪存上,并按需将其调入DRAM的方法。研究方法包括构建与闪存行为协调的推理模型,并在两个关键领域进行优化:减少闪存传输的数据量和以更大、更连续的块来读取数据。在这个框架下,引入了两种主要技术:“windowing”策略通过重复使用先前激活的神经元减少数据传输,“row-column bunding”则充分利用了闪存的顺序数据访问特性,增加了从闪存中读取的数据块的大小。这些方法使得可以在有限DRAM上运行比原先两倍大的模型,相较于朴素的加载方法,在CPU和GPU上推断速度分别提高了4-5倍和20-25倍。
67.
2023, bioRxiv. DOI: 10.1101/2023.10.04.560604
2023-12-27 12:42:00
#paper doi:10.1101/2023.10.04.560604. bioRxiv, 2023, Federated Learning for multi-omics: a performance evaluation in Parkinson's disease. 这篇文章基于两个帕金森病研究的数据集(PPMI和PDBP),这两个数据集都入组了数百例患者和对照健康人,分别都进行了WGS和RNA-seq,获得了多组学检测的分析特征结果。通过将PPMI拆分为K折,留出一折后所剩余K-1折用于模型训练,再将模型放到PPMI预先留出的一折数据和PBMP上进行测试和性能评估。建模分别使用了集中化的机器学习方法,以及将数据拆分到多个节点(site)以采取联邦学习法,并使用了不同的联邦学习策略。结果显示,虽然样本在不同site的分散程度、联邦学习的策略等都会对最终性能有所影响,但联邦学习的最优结果,能与集中化训练的性能相当。此外,本文对联邦学习的训练时间进行评估,比集中化的方法至少高出一个数量级。虽然如此,由于联邦学习可以避免大规模数据在不同sites之间分享和传输,对于整合更广泛的数据,提升模型性能,还是有优势的。提供了对联邦学习在多组学和特别是在帕金森病预测中的应用的深入分析,展示了其作为一种协作工具在处理大规模异构数据时的潜力和挑战。
68.
2020, eLife. DOI: 10.7554/eLife.55389
2023-12-13 23:02:00
#paper,https://doi.org/10.7554/eLife.55389,A Bayesian and efficient observer model explains concurrent attractive and repulsive history biases in visual perception,人类的视觉感知受到历史经验的影响,同时产生排斥性偏差和吸引性偏差,且二者具有不同的时间尺度:吸引性偏差的衰减速度快,只由上一个试次刺激影响产生,排斥性偏差衰减速度慢,可以持续受到过去数分钟的刺激的影响,暗示吸引性和排斥性偏差的机制是分离的。但是,目前仍不清楚吸引性的偏差和排斥性的偏差在知觉决策过程中是否相互作用以及如何相互作用。这篇研究结合了快速编码框架和贝叶斯解码模型,同时捕获了吸引性偏差和排斥性偏差的关键特征。
69.
2020, Nature Human Behaviour. DOI: 10.1038/s41562-019-0804-2
2023-12-01 00:00:00
#paper, https://doi.org/10.1038/s41562-019-0804-2,Quantum reinforcement learning during human decision-making,这篇nature子刊很有意思,探讨了量子强化学习(QRL)在人类决策中的应用。QRL在人类决策中的新颖应用:该研究是首次将QRL应用于人类决策的实证研究。QRL在计算机模拟中表现出色,但此研究首次在人类决策环境中对其进行了特殊测试。研究利用了参与者在执行爱荷华赌博任务时的行为数据和功能性磁共振成像(fMRI)数据,将2个QRL模型与12个已建立的CRL模型进行了对比。研究者开发了两种新的QRL模型:量子叠加状态学习(QSL)和量子叠加状态加持续性(QSPP)。这些模型的表现在某些方面优于最好的CRL模型。这一发现在包括健康个体和吸烟者在内的不同受试者群体中得到了确认,表明这些模型的稳健性和普遍适用性。量子类过程的神经表征:该研究的一个重要创新是确定了表示量子类过程的神经基质。例如,QSPP模型显示了在大脑中如何表征量子距离和转换幅度——QRL的关键概念。这一发现弥合了认知量子模型和神经科学之间的差距,为决策中的量子类过程提供了神经生物学基础。对于决策中的不确定性理解,论文还探讨了决策中不确定性的角色。通过将QSPP模型与CRL模型(VPPDecayTIC)进行比较,突出了大脑如何不同地处理由不稳定的外部环境影响的内部状态不确定性。这一研究方面强调了QRL模型在提供对决策认知过程更细微洞察方面的潜力。​​
70.
2023, Nature Biomedical Engineering. DOI: 10.1038/s41551-023-01114-1
2023-11-30 23:40:00
小W:
#paper doi:doi.org/10.1038/s41551-023-01114-1 Detection of cellular traction forces via the force-triggered Cas12a-mediated catalytic cleavage of a fluorogenic reporter strand 本文介绍了利用CRISPR相关蛋白(Cas)-Cas12a 检测活细胞表面受体分子力事件的方法,其技术路径:激活剂是固定在表面(如玻璃载玻片)上的ssDNA,激活剂通过与互补链杂交而被隐藏,互补链又与配体肽结合;当细胞被植入该表面时,表面受体和配体结合,并施加力,超过双链的机械耐受性的力会导致其断裂,暴露激活剂;激活Cas12a会高效地催化切割荧光性ssDNA报告基因。在作为测试的血小板力检测中,其具有以下优势1.活细胞2.只需要~5 μl或更少的血液来进行每次测量,降低了高通量筛选的难度3.检测结果与出血风险更高的相关4.更短的时间(30min),更易识别的信号,可能更低的成本。对 CRISPR 检测不太了解,欢迎斧正。
71.
2023, Clinical and Translational Medicine. DOI: 10.1002/ctm2.1354
2023-11-30 23:39:00
#paper doi: 10.1002/ctm2.1354 IMPACT: A web server for exploring immunotherapeutic predictive and cancer prognostic biomarkers 这是一篇临床转化医学的数据库的文章,作者来自燃石、中国国家肿瘤中心等单位。数据库纳入了23000+样品、覆盖37种肿瘤,数据来源包括公共数据库、文献来源的数据集以及作者自己收集的一系列数据。数据库的主旨是挖掘和分析影响肿瘤预后的生物标志物。数据库功能还是比较多的,与既有的数据库相比更加灵活和细化,操作比较简便和直观,界面简洁一目了然,使用者可快速执行感兴趣的操作,提高分析效率。
72.
2022, IEEE Transactions on Medical Imaging. DOI: 10.1109/TMI.2022.3174827
2023-11-30 23:19:00
#paper 10.1109/TMI.2022.3174827 PTNet3D: A 3D High-Resolution Longitudinal Infant Brain MRI Synthesizer Based on Transformers 最近看了一些基于GAN的医学图像生成的文章(当然现在的热点都转向diffusion model了),感觉都很没有创意,有点无聊,并且都存在一些共性问题。第一,纵向婴幼儿图像生成算法仅仅是通过在每个年龄段训练模型来构建,完全可以把年龄作为条件直接生成;第二,为了缓解数据维度高且数据量小的问题,大多数这类生成算法都基于slice或者patch的生成方式,不可避免的会导致生成图像的不连续性,而且基本上所有文章都没解决这个问题。在我的新工作(不是单纯的图像生成任务)里,这些问题都得到了重视并予以解决,估计年后会release预印本出来,敬请期待。
73.
2023, arXiv. DOI: 10.48550/arXiv.2311.05332 arXiv ID: 2311.05332
2023-11-30 23:11:00
#paper doi.org/10.48550/arXiv.2311.05332, 2023, On the Road with GPT-4V(ision): Early Explorations of Visual-Language Model on Autonomous Driving. 文远知行的团队近期的论文,把GPT应用在自动驾驶领域。测试结果显示GPT在图像识别,点云识别,天气识别,V2X图像,模拟图像识别,多角度图片识别都有较高准确率;在交通灯识别,左右空间区分上容易出错
74.
2023, Cell Reports. DOI: 10.1016/j.celrep.2023.113238
2023-11-30 23:05:00
#paper: Schonhaut, D. R., Aghajan, Z. M., Kahana, M. J., & Fried, I. (2023). A neural code for time and space in the human brain. Cell Reports, 42(11). https://doi.org/10.1016/j.celrep.2023.113238 时间和空间对人类的记忆来说是非常重要的两个维度,不仅可以帮助构建我们的经验,也可以帮助我们预测未来。以往有部分研究发现了时间和空间的神经关联,比如时间细胞和位置细胞的发现等。但是这两个维度是如何在个体记忆中被整合的仍未可知。作者基于这一问题记录了在定时性空间导航虚拟游戏中10个病人的单细胞放电情况,任务分为延迟等待阶段,寻金时间(编码阶段),下一个延迟等待阶段和挖金阶段(提取阶段)。结果发现,内侧颞叶和前额叶皮层神经元在无任务延迟期间编码时间信息,在空间探索过程中,时间和位置是独立表征的,时间细胞会在相似的事件下重新编码(remap)但是位置细胞仍会以稳定的模式放电,群体神经活动代表序列中多个事件的时间信息。本文的亮点在于首次在人类中同时研究了时间和空间信息在记忆形成中的放电特征。
75.
2021, Immunology. DOI: 10.1111/imm.13441
2023-11-30 22:58:00
#paper https://doi.org/10.1111/imm.13441 Velikkakam, T, Gollob, KJ, and Dutra, WO. Double-negative T cells: setting the stage for disease control or progression. Immunology. (2022) 165:371–85. 这篇文献是关于双阴性T细胞DNT的综述文章。DNT是一群独特的T细胞,缺乏CD4和CD8辅助受体,但表达αβ TCR或γδ TCR,在人外周血中占比较低。DNT细胞能有效产生细胞因子,是免疫反应的关键协调者。1.DNT从哪里来?DNT 的确切来源仍有很多盲点,有研究表明DNT细胞可以源自胸腺和外周环境。外周血中DNT细胞可以通过可能逃避胸腺中的负选择以及随后在外周中的激活和扩增。另外,体外也可诱导产生DNT细胞。2.DNT亚群:存在高度异质性,未有正式定义,来源不同研究课题,如初始nDNT和激活态aDNT。3.DNT与疾病:它是多种人类疾病的发病机制的主角,特别是自身免疫疾病、炎症性疾病和移植。其调节功能损害了必要的炎症效应机制,或者介导细胞死亡和组织破坏。多数文献DNT研究源自小鼠模型,许多是转基因的。人类DNT会有所区别,还是需要系统的梳理DNT细胞的功能和在疾病中的作用。
76.
2021, Genes. DOI: 10.3390/genes12040478
2023-11-30 22:19:00
#paper https://doi.org/10.3390/genes12040478, gene, 2021,Performance of Cell-Free DNA Screening for Fetal Common Aneuploidies and Sex Chromosomal Abnormalities: A Prospective Study from a Less Developed Autonomous Region in Mainland China. 这篇前瞻性研究论文主要分析研究了NIPT在86193例人群样本中对常见的T21,T18,T13三体异常、性染色体异常以及其他常染色体异常和一些CNVs中的检测效果。相对而言,这篇文章的突出特点是样本量比较大,阳性检出率和阳性预测值等这些检测性能上的参数给出了一定的参考。
77.
2023, Nature. DOI: 10.1038/s41586-023-05710-8
2023-11-30 21:45:00
#paper https://doi.org/10.1038/s41586-023-05710-8 Nassour, J., Aguiar, L.G., Correia, A. et al. Telomere-to-mitochondria signalling by ZBP1 mediates replicative crisis. Nature 614, 767–773 (2023). 这篇文献主要是发现了永生化细胞不死的机制,通过讲端粒、衰老和和免疫结合起来,从侧面为肿瘤细胞的异常增殖提供了新的思路。全文仅仅用了简单的WB和免疫荧光等技术,完成了比较有创新性的课题并发表在了nature上。整篇文献发现永生化细胞中ZBP1表达升高和I型干扰素信号通路激活,通过分析发现ZBP1可以与端粒不稳定相关RNA结合并定位于线粒体上,从而激活MAVS和下游I型干扰素信号通路维持细胞的生长,而端粒的不稳定又会激活cGAS信号通路,引起I型干扰素信号通路激活导致ZBP1升高,从而形成了一个环路。
78.
2019, NeuroImage. DOI: 10.1016/j.neuroimage.2019.01.074
2023-11-30 19:59:00
#paper doi:https://doi.org/10.1016/j.neuroimage.2019.01.074 Reproducibility of functional brain alterations in major depressive disorder: Evidence from a multisite resting-state functional MRI study with 1,434 individuals 静息态功能磁共振成像研究表明,重度抑郁症患者的脑功能存在广泛的改变。 然而,由于大样本、多站点数据集的稀缺,关于 MDD 相关改变的可重复模式的清晰一致的结论仍然有限。 研究者过五个中心的 1434 名参与者(709 名 MDD 患者和 725 名健康对照)的大型 R-fMRI 数据集来解决这个问题。 我们观察到,与对照组相比,重度抑郁症患者的眶额皮层、感觉运动皮层和视觉皮层显著减退,额顶皮层显著过度活跃。 这些改变不受不同统计分析策略、全局信号回归和药物状态的影响,并且通常可以在各个中心重现。 然而,这些组间差异部分受到患者发病状态和发病年龄的影响,并且脑-临床变量关系表现出较差的跨中心再现性
79.
2017, 华东师范大学硕士学位论文.
2023-11-30 19:20:00
#paper 王伟. “她为什么换了导师——一项导生关系的案例研究.” 华东师范大学硕士学位论文. 近年来导师和研究生的关系恶化的事件时有发生,看到这篇论文,一个是抱着八卦的心态,想看看“她到底为啥换了导师”,另外一个是好奇,作者是怎么把一起换导师事件做成一项研究的,用什么样的研究方法可以使其成为一篇硕士研究生论文。 读下来发现研究方法并不难,主要是做访谈,再加一些文献阅读与分析。作者访谈了换导师的A同学,A同学的同门师兄B,A同学的同寝室同学C,以及A同学换的新导师Z。可惜A同学的原导师Y并不愿意接受访谈,因此少了她的视角。通过访谈还原了整个换导师过程:A同学本来选择的另一个导师,被调剂到导师Y门下,一进师门就给了个下马威:随时可以走。之后写论文的选题成为导火索,A同学想要写的选题,导师Y不认可;导师Y给A同学定的选题和大纲,A同学不认可,认为导师学术水平不高,但又不敢违背,再加上在实习问题上的矛盾,A同学萌生退学、拿不到毕业证的想法。后来在系里帮助下,A同学换了新导师。 在厘清基本事实后,作者对我国现行导师制进行了分析,认为导师-学生匹配上的责权不一、导生互动中教育性和学术性的淡化以及评价机制的缺失是值得反映的问题。 有意思的案例研究,但是深度稍显欠缺,是一篇评论能容纳的信息量。
80.
2023, Cell Systems. DOI: 10.1016/j.cels.2023.10.006
2023-11-30 16:36:00
#paper Hamed Khakzad, Ilia Igashov, Arne Schneuing, et al. A new age in protein design empowered by deep learning. Cell Systems 14, 925–939 (2023). https://doi.org/10.1016/j.cels.2023.10.006. 蛋白质作为细胞的主要组成,参与了包括酶促反应、信号转导等在内的各种生命反应,其意义毋庸置疑。但是如何通过人工的方式设计特定的蛋白质,从而解决疾病治疗、药物研发等一系列生命科学问题,一直是科学家的追求。人工智能的发展,特别是深度学习的发展,给这个主题带来了特别巨大的进展。这篇最新的综述就是对使用深度学习进行蛋白质设计的几类范式和sota方法进行了介绍。从方法角度看,介绍的非常全面。有意思的是,我们会发现目前生成式模型在AI的冲击已经迁移到蛋白质设计领域,并孵化出独有的味道。图神经网络、物理启发的模型、语言模型的模仿、深度生成模型的利用在蛋白质设计领域都展现出不错的性能,特别是当把几何先验通过数学的手段,比如群轮与深度学习进行结合,往往可以较好的捕获蛋白质精巧晦涩的结构信息。当然,考虑到蛋白质设计所涉及的序列、结构、功能三者的精密联系,如何协调序列建模、结构建模等方法,也成为未来发展的关键问题。文章中对数据、benchmark等方面的讨论也很有价值。当然,问题也是一大堆,最令人不爽的是,拥有生命科学基本属性的蛋白质设计,最终的效果需要实验甚至实际效果进行验证,因此计算方法论上再优秀的设计,也需要湿实验、临床实验的验证。希望随着技术的进步,这个领域的自动化agent技术会带来全新的范式。
TOP