本页面显示本月的文献分享。共有 29 篇文献。

2022, The Lancet Microbe. DOI: 10.1016/S2666-5247(22)00185-9
The early-life gut microbiome and vaccine efficacy
[Open]

[2022-09-28 11:59:00] Summer:
doi: 10.1016/S2666-5247(22)00185-9

The early-life gut microbiome and vaccine efficacy
09-08,  Lancet子刊:生命早期肠道菌群与疫苗效力(综述)

① 许多疫苗的效力在不同地区的婴儿间存在很大差异,这与肠道菌群组成差异有关;② 肠道菌群和免疫系统间的互作,以及遗传和环境的影响,可以解释个体间对疫苗免疫反应的差异;③ 双歧杆菌、拟杆菌及其代谢产物具有免疫调节特性,可影响早期免疫接种结果;④ 短链脂肪酸,胞外多糖和细菌细胞外囊泡等微生物产物可以调节宿主的免疫应答;⑤ 对健康婴儿肠菌中的关键菌株及其副产物的进一步了解和定性,可能催生新一代疫苗增强疗法。
2022, Cancer Cell. DOI: 10.1016/j.ccell.2022.08.006
Detection and localization of early- and late-stage cancers using platelet RNA
[Open]

[2022-09-27 09:09:00] 惊鸿:
doi:Volume 40, Issue 9, 12 September 2022, Pages 999-1009.e6Detection and localization of early- and late-stage cancers using platelet 这篇论文解释了RNA癌症患者受益于早期肿瘤检测,因为治疗结果对不太晚期的癌症更有利。血小板参与癌症进展,被认为是癌症检测的有前途的生物来源,因为它们根据局部和全身线索改变其RNA含量。我们表明,基于肿瘤的血小板(TEP)RNA血液测试能够检测18种癌症类型。血栓形成Seq在无症状对照组的特异性为99%,在I-IV期癌症患者的1,096份血液样本中有三分之二和352名I-III期肿瘤中的一半中正确检测到癌症的存在。对症对照组,包括炎症和心血管疾病以及良性肿瘤,假阳性检测结果增加,平均特异性为78%。此外,血栓形成Seq在超过80%的癌症患者中正确确定了五种不同肿瘤类型的肿瘤起源部位。这些结果突出了TEP衍生的RNA组合的潜在特性,以补充当前基于血液的癌症筛查方法。
2022, American Journal of Medical Genetics Part A. DOI: 10.1002/ajmg.a.62974
Reduced resource utilization with early use of next‐generation sequencing in rare genetic diseases in an Asian cohort

[2022-09-26 23:20:00] 颜林林:
doi:10.1002/ajmg.a.62974 American Journal of Medical Genetics, 2022, Reduced resource utilization with early use of next-generation sequencing in rare genetic diseases in an Asian cohort. 这篇来自新加坡的文章,回顾了一家三级医院从2004到2020年的患者数据,调取其做过遗传检测且有相应计费数据的病例,最终筛选出近百例罕见病患者,覆盖GDD(全身发育迟缓)、MCA(多发性先天异常)、NMD(神经肌肉疾病)和 PID(原发性免疫缺陷)四种遗传疾病。根据他们病历中记录的所做检测内容,结合医疗常规实践路径规范,评价按照规范依次进行多种不同检测、对比合理去掉其中一个或多个检测项目,直至只留下最终采取全外显子组测序(WES)的策略。分别进行经济学和检测准确性方面的评估,由此给出一些实践建议。虽然病例收集时间跨度长,但最终可用病例数仍然有限,其结果价值也因此受到影响。不过该文章思路挺值得学习的,对于推动将WES或WGS(全基因组测序)提升至一线或早期的诊断方法,是一个合理且有说服力的策略。若在中国这样一个人口基数大的国家,建设并长期详细记录诊疗数据,用于此类回顾研究的开展,将是价值更加巨大的。
2016, Nature Reviews Genetics. DOI: 10.1038/nrg.2016.67
Computational genomics tools for dissecting tumour–immune cell interactions

[2022-09-26 22:58:00] na na na:
doi: 10.1038/nrg.2016.67 Nat Rev Genet, 2016, Computational genomics tools for dissecting tumour-immune cell interactions. 分享一篇比较早的16年综述,本文全方面收录了研究肿瘤免疫中各个环节涉及到的热点软件工具和数据库,描述了基于基因表达谱、DNA甲基化谱和免疫组织化学等分子信息的多种来源和可用于研究肿瘤免疫表型的生信算法,并且深入浅出的讲述了肿瘤免疫相关的技术发展现况、面临的挑战、现今研究重点、未来发展,既可帮助入门学习肿瘤免疫,也可用于深入肿瘤免疫相关研究。虽然时间有点久了,但其中讲述的观点和算法工具至今依然受用。
2014, Plastic and Reconstructive Surgery. DOI: 10.1097/01.prs.0000436812.73412.a4
Discussion: The embrace Device Significantly Decreases Scarring following Scar Revision Surgery in a Randomized Controlled Trial
[Open]

[2022-09-26 21:03:00] 李翛然:
doi: 10.1097/01.prs.0000436812.73412.a4 The embrace Device Significantly Decreases Scarring following Scar Revision Surgery in a Randomized Controlled Trial 这篇文章是上一篇(https://paper-hub.cn/xiangma/paper/430)的引用,主要是想看看医美的产品应用。没想到今年我们做了一些实验后,最近有个大发现,联合我们的生发蛋白及配合其中的胶原蛋白成型机制,可以甚至刺激烧伤病人的恢复后的毛囊分化。 这是个大事。下面的工作是具体的试验和基因编辑模型来看看验证一下猜测。

最近连续推荐是因为我们的药物 找到了新的联合用药和适应症方向!并且是一个前沿性靶点!我们一定要做透!
2022, medRxiv. DOI: 10.1101/2022.09.20.22280143
Whole-Genome Promoter Profiling of Plasma Cell-Free DNA Exhibits Predictive Value for Preterm Birth
[Preprint] [Open]

[2022-09-25 15:32:00] 颜林林:
doi:10.1101/2022.09.20.22280143 medRxiv, 2022, Whole-Genome Promoter Profiling of Plasma Cell-Free DNA Exhibits Predictive Value for Preterm Birth. 这篇文章试图从孕期母亲外周血cfDNA中发现早产相关生物标志物。对20例足月与20例早产的入组孕产妇进行全基因组测序,以及相应胎盘和外周血的全转录组测序,从中找到差异表达基因,并与外周血cfDNA中相应基因上游调控序列的覆盖深度进行关联,由此得到的特征,在2590例孕产妇(2072足月对518早产)的NIPT数据中进行验证,并预期此检测将为当前NIPT服务提供更多附加价值。这是一篇预发表文章,其摘要仅仅提及最后的两千多例的模型及性能,与正文整体逻辑还是有一定区别的,显然其文章逻辑还需要再继续打磨,不过这套数据及结果还是挺值得关注下的。
2022, PLOS Genetics. DOI: 10.1371/journal.pgen.1010404
Analysis of low-level somatic mosaicism reveals stage and tissue-specific mutational features in human development
[Preprint] [Open]

[2022-09-23 22:56:00] 颜林林:
doi:10.1371/journal.pgen.1010404 PLOS Genetics, 2022, Analysis of low-level somatic mosaicism reveals stage and tissue-specific mutational features in human development. 这篇文章纳入了来自190人的498个样本,包括神经疾病患者、脑肿瘤患者和健康对照,样本类型包括外周血及脑、心脏、肝脏等组织,对这些样本进行配对的全外显子测序(平均深度~500x),研究各样本的体细胞突变,以及它们在不同组织类型和不同发育阶段的分布情况,以及突变特征差异。对这些突变,还采取Sanger和靶向扩增超高深度测序等方法进行验证,对于突变在不同类型细胞的分布,也使用了流式细胞术进行了验证。分析方法上都比较常规,但作为一套数百例不同组织部位的深度全外显子数据,以及它所描述的体细胞突变的分布,还是比较有重分析挖掘的价值的。
2022, Genome Biology. DOI: 10.1186/s13059-022-02757-0
Genetic regulation of RNA splicing in human pancreatic islets
[Open]

[2022-09-22 22:58:00] 徐炳祥:
doi: 10.1186/s13059-022-02757-0 Genome Biology, 2022, Genetic regulation of RNA splicing in human pancreatic islets。在胰岛细胞中存在的非编码编译影响了细胞转录组,从而在I型和II型糖尿病发病过程中可能扮演重要角色。本文在由399名患者组成的队列中分析了一类特殊的常见基因组变异(sQTL,splicing QTL,那些能可变剪接事件的QTL)。sQTL 的靶基因不同于eQTL,暗示着两类QTL可能独立发挥作用。作者识别了一批新的与sQTL关联的I型和II型糖尿病风险基因。作者据此认为胰岛细胞中的可变剪接事件是重要的糖尿病风险因素。
2021, arXiv. DOI: 10.48550/arXiv.2106.00750 arXiv ID: 2106.00750
Unsupervised Representation Learning for Time Series with Temporal Neighborhood Coding
[Preprint] [Open]

[2022-09-21 11:01:00] 张浩彬:
https://doi.org/10.48550/arXiv.2106.00750
Unsupervised Representation Learning for Time Series with Temporal Neighborhood Coding
21年ICLR论文,时间序列对比学习
代码:https://github.com/sanatonek/TNC_ representation_learning
样本的选择思想是,认为领域内的信号是相似的,领域外的信号是需要区分的
正样本的选择:邻域的信号都是服从某个高斯分布,均值为t*,方差是窗口大小和邻域长度.领域内是正样本正样本。如果确定邻域,使用ADF检验。
负样本:不在邻域内的就是负样本,但是这一点,作者在损失函数里进一步优化了
损失函数:作者认为,不在一个领域不能都认为是负样本,因为时序问题具有周期性,因此应该把它归为正无标记样本(即正类和负类混合)。在处理上,根据PU学习的一些经验,它在上面的负样本中引入权重,同时进入损失函数。、
数据:总共3个数据:1个模拟数据(4个类别,HMM生成),1个医疗临床房颤数据(MIT-BIH,特点是类别交替进行,类别非常不平衡,少量个体(人)具体非常长的数据),1个人类活动数据(UCI-HAR数据)
下游任务:聚类与分类,其中主要目标是为了尽可能比较表征学习,因此对于同一任务,不同的模型都用了相同的,并且简单的编码器结构。由于不同数据集特点不一样,因此不同任务的编码器不同。
聚类用了简单的kmeans;分类用了简单的knn;本文的TNC都取得了最好的结果
2022, Human Mutation. DOI: 10.1002/humu.24458
A survey of current methods to detect and genotype inversions

[2022-09-21 07:48:00] 颜林林:
doi:10.1002/humu.24458 Human Mutation, 2022, A survey of current methods to detect and genotype inversions. 倒位(inversion)是基因组上一类特殊的变异,越来越多的技术方法可以对其进行发现和鉴定,也因此发现该事件广泛存在于不同物种的基因组中。这篇综述从技术角度,分别介绍了PCR、NGS序列比对、单倍体型识别、模板链测序(template‐strand sequencing,Strand‐seq)、光学图谱(optical mapping,Bionano)及基因组组装这六类方法对倒位的鉴定,以及相应方法所取得的研究进展。
2022, Human Mutation. DOI: 10.1002/humu.24465
Long‐read sequencing for molecular diagnostics in constitutional genetic disorders

[2022-09-20 06:54:00] 颜林林:
doi:10.1002/humu.24465 Human Mutations, 2022, Long-read sequencing for molecular diagnostics in constitutional genetic disorders. 这是一篇关于使用三代长读长测序进行遗传病基因检测的综述,来自费城儿童医院。文章列举了其医院提供的耳聋基因检测的例子,来说明在实践中整合使用多种不同检测技术,实现检测上百个基因不同类型疾病相关突变的需求。此外,也通过实例,系统地分析了诸如重复片段、假基因、同一基因发生多个距离较远突变(需要进行phasing,即定相)等可能造成检测结果误判的问题,以及长读长测序技术如何解决相应问题。三代测序用于遗传基因检测,目前最大瓶颈在于所积累的证据和人群数据,但这正好是时间可以逐步积累并解决的。从这篇文章展示的这些几乎只能使用长读长相关技术才能解决的问题案例,可以预期不久的未来将迎来一批相应的长读长测序基因检测方法的落地应用。
2022, Scientific Reports. DOI: 10.1038/s41598-022-17585-2
Recursive integration of synergised graph representations of multi-omics data for cancer subtypes identification
[Open]

[2022-09-19 22:00:00] 颜林林:
doi:10.1038/s41598-022-17585-2 Scientific Reports, 2022, Recursive integration of synergised graph representations of multi‑omics data for cancer subtypes identification. 随着高通量测序技术在不同组学水平上的应用,肿瘤研究也早已进入多组学研究阶段。如何将多组学高维数据进行有效整合,一直是一项有挑战的工作。与此相关的方法学研发工作,大多聚焦于单组学数据的各类降维和特征提取。本文开发了一个名为RISynG(Recursive Integration of Synergised Graph-representations)的方法,通过从原始的组学数据中提取Gramian和Laplacian两个表征矩阵(representation matrices),使整合不同组学之间更加有效。相比过去大多数将多组学数据进行简单串联堆叠的方式,能够取得更好的分类效果,实现基于肿瘤多组学数据(如TCGA)进行肿瘤分型。
2022, arXiv. DOI: 10.48550/arXiv.2206.00426 arXiv ID: 2206.00426
Semantic Probabilistic Layers for Neuro-Symbolic Learning
[Preprint] [Open]

[2022-09-19 19:40:00] 张德祥:
https://doi.org/10.48550/arXiv.2206.00426 Semantic Probabilistic Layers for Neuro-Symbolic Learning 论文为结构化输出预测设计了一个预测层,可以嵌入神经网络中,保证预测与标签约束一致,通过建模复杂的相关性和约束,结合了概率推理和逻辑推理。是现在唯一满足六个条件的实现。(概率性,高表达力,保证逻辑约束一致,通用-支持各种约束的形式语言表达,模块化嵌入神经网络端对端训练,高效的线性时间);核心是论文通过带约束的概率线路来实现。应用:路径规划(有障碍物、水路等限制),层级多标签训练等。
2002, Nature. DOI: 10.1038/22307
‘Green revolution’ genes encode mutant gibberellin response modulators

[2022-09-18 20:36:00] 哪有情可长:
'Green revolution' genes encode mutant gibberellin response modulators, Nature 1999 Jul 15;400(6741):256-61. doi: 10.1038/22307.
绿色革命是将在拟南芥中发现的矮杆的基因引用到作物中,降低了水稻、小麦等作物的株高,然后加上水肥等配套设施开始完善,从而使得作物产量增加,也降低了作物成熟后期大风和降雨导致的倒伏减产。进而使得矮杆基因在’绿色革命‘中得以应用。作物中的矮杆突变主要是由于该类基因突变后,导致对GA(赤霉素)不敏感,反应异常导致的。该文主要从拟南芥、水稻、玉米、小麦中的矮杆基因的基因结构,蛋白功能以及突变位点的差异导致的表型的差异变化。分析物种之间矮杆基因的共线性、矮杆基因中发现的SH2 domain结构。且赤霉素信号转导在单子叶和双子叶植物中非常相似,可能涉及SH2 domian与磷酸化酪氨酸残基的相互作用。
该作者首先在1993年在拟南芥中发现了一个GAI的基因,该基因是负调控赤霉素(GA)信号通路的一个基因。获取拟南芥中该基因突变体,后再1997年又发了一篇关于拟南芥GAI基因的文章,后续他又在小麦中进行研究,发现无论是双子叶植物还是单子叶植物,该类基因的功能是同源性较好的基因。
2022, Molecular Cell. DOI: 10.1016/j.molcel.2022.08.019
Developmental and housekeeping transcriptional programs in Drosophila require distinct chromatin remodelers
[Open]

[2022-09-16 23:18:00] 颜林林:
doi:10.1016/j.molcel.2022.08.019 Molecular Cell, 2022, Developmental and housekeeping transcriptional programs in Drosophila require distinct chromatin remodelers. 这篇文章吸引到我,是因为浏览它时,我看到了两个词,“Drosophila(果蝇)”和“auxin(植物生长素)”,于是很好奇这两者是怎么联系起来的。过去在生物专业课上,就听说过植物生长素在植物研究领域中的至尊江湖地位。这篇文章提及一项技术“auxin-inducible degradation (AID)”,源自2009年的一篇Nature Methods文章(doi:10.1038/nmeth.1401),该技术通过为目标蛋白加入一段特定序列,使得在有植物生长素的情况下,能引发蛋白泛素化降解机制,从而可以人为控制蛋白的降解过程。由于泛素化降解是一个广泛存在于不同物种的机制,这项技术就可以应用于非植物的各种生物体系中。本文通过这项技术,对果蝇的看家基因(house keeping gene)和发育基因(developmental gene)进行了研究,前者普遍表达于所有类型细胞,后者则只在特定组织器官类型的细胞中表达。通过人为控制相应基因的蛋白降解,揭示了两类基因在染色质重塑(chromatin remodelling)及其他相关特征上的差异。
2021, International Journal of Approximate Reasoning. DOI: 10.1016/j.ijar.2021.09.012
Strudel: A fast and accurate learner of structured-decomposable probabilistic circuits
[Open]

[2022-09-16 09:57:00] 张德祥:
DOI:https://doi.org/10.1016/j.ijar.2021.09.012 Strudel: A fast and accurate learner of structured-decomposable probabilistic circuits
Probabilistic circuits (PCs)将概率分布表示为计算图,并添加图结构属性保证推理计算效率。
结构化可分解是一个吸引人的属性。
它能够有效和精确地计算复杂逻辑公式的概率,并可用于在缺失数据的情况下推理某些预测模型的预期输出。
本文提出一种简单、快速、准确的结构化可分解 PCs 学习算法 Strudel: STRUctured-DEcomposable Learner,从数据中直接学习概率计算图网络。
2020, .
Probabilistic Circuits: A Unifying Framework for Tractable Probabilistic Models
[Open]

[2022-09-16 09:36:00] 张德祥:

URL: http://starai.cs.ucla.edu/papers/ProbCirc20.pdf
Probabilistic circuits: A unifying framework for tractable probabilistic models
概率模型是现代机器学习(ML)和人工智能(AI)的核心。
事实上,概率论为在不确定性存在的情况下做出决策提供了一个原则性的、几乎普遍采用的机制。例如,在机器学习中,我们假设我们的数据来自未知的概率分布;
许多机器学习任务简化为简单地执行概率推理。类似地,许多形式的基于模型的人工智能寻求直接将支配我们周围世界的机制表示为某种形式的概率分布。
难怪 ML 中的许多注意力都放在从数据中学习分布上。我们将越来越多的表达性概率模型作为密度估计器,这些模型越来越接近产生数据的分布
但是之前模型及深度学习中的模型效率都不高,而且还不准确,我们要开发理论上可靠的模型且推理时间可控。且富有表现力,现在可以用统一的模型Probabilistic Circuits来处理。
Probabilistic Circuits特点:Probabilistic Circuits就是神经网络,而且是分层混合网络模型
2022, Human Mutation. DOI: 10.1002/humu.24455
de novo variant calling identifies cancer mutation signatures in the 1000 Genomes Project
[Open]

[2022-09-15 22:35:00] 颜林林:
doi:10.1002/humu.24455 Human Mutation, 2022, de novo variant calling identifies cancer mutation signatures in the 1000 Genomes Project. 本文开发了一种能利用GPU加速、基于trio(一家三口,父母两人及一个子女)全基因组测序数据、检测新发突变(de novo variant)的工具。并使用该工具重新分析了三个大规模trio人群数据,三个人群分别是Simons Simplex Collection(SSC)、Simons Foundation Powering Autism Research(SPARK)和千人基因组(1000 Genomes Project,1000G),其样本类型分别为外周血、唾液和细胞系。结果发现细胞系的新发突变数量和特征,明显不符合预期。通过对1000G中的这些新发突变的特征分析,发现它们与B细胞淋巴瘤相似,从而推断其大多应为细胞系制备过程(即EBV处理)中引入的artifacts。
2022, Human Mutation. DOI: 10.1002/humu.24460
CIC missense variants contribute to susceptibility for spina bifida

[2022-09-14 05:52:00] 颜林林:
doi:10.1002/humu.24460 Human Mutation, 2022, CIC missense variants contribute to susceptibility for spina bifida. 既往研究发现,叶酸摄入对于神经系统发育具有重要作用,其缺乏可能导致神经管缺陷(Neural tube defects,NTDs)这样的严重先天畸形。本文应该是从另一项研究出发,由入组的140例散发脊柱裂(spina bifida)病例,进行的全基因组测序结果中,发现8例CIC基因的罕见错义突变。通过近缘物种间序列保守性,确认了这些突变可能存在重要作用。在细胞系中通过质粒转染和叶酸缺乏培养等实验,引入野生型或携带上述突变的CIC基因的质粒,通过免疫荧光观察突变对表达量和亚细胞定位的影响。此外,还使用Western、qPCR等方法,对CIC所调控的基因的表达进行测定,确认了所发现的CIC突变,确实会对相关通路造成影响。这是一篇用湿实验方法对所发现基因突变功能进行验证的典型研究。
2022, Vaccine. DOI: 10.1016/j.vaccine.2022.08.036
Serious adverse events of special interest following mRNA COVID-19 vaccination in randomized trials in adults
[Open]

[2022-09-13 07:21:00] 颜林林:
doi:10.1016/j.vaccine.2022.08.036 Vaccine, 2022, Serious adverse events of special interest following mRNA COVID-19 vaccination in randomized trials in adults. 这篇文章跟进了Pfizer和Moderna两家公司的新冠RNA疫苗的三期临床试验,针对其报出的严重不良反应进行二次分析,确认各自疫苗相对于安慰剂所增加的风险比值。该结果提示应该进行更加详尽正式的利弊分析。而文末也再次呼吁要求公开受试者级别的相关数据,以保证临床试验的透明度和各类评估分析得以正确进行。
2022, bioRxiv. DOI: 10.1101/2022.09.09.453067
HexSE: Simulating evolution in overlapping reading frames
[Preprint] [Open]

[2022-09-11 23:59:00] 颜林林:
doi:10.1101/2022.09.09.453067 bioRxiv, 2022, HexSE: Simulating evolution in overlapping reading frames. 重叠基因是在病毒(质粒)中发现的一种有趣现象,即同一段核酸序列,因为翻译蛋白质的起始位置不同(即阅读框不同)导致形成不同蛋白。到目前为止的研究,发现在许多物种中都存在此现象。本文通过分析序列演化速率,来从积累的大量已被测序的基因组数据中,寻找这样的重叠基因。其基本假设是,如果存在重叠基因,则相应序列上受到的演化选择压力会有所不同,于是在结果上呈现出不同的演化速率。这是个很有意思的思路和研究课题。
2022, arXiv. DOI: 10.48550/arXiv.2206.13236 arXiv ID: 2206.13236
Pruned RNN-T for fast, memory-efficient ASR training
[Preprint] [Open]

[2022-09-09 09:04:00] song:
https://doi.org/10.48550/arXiv.2206.13236 Pruned RNN-T for fast, memory-efficient ASR training
来自于小米新一代kaldi团队。RNN-T是目前端到端语音识别的主流范式之一,是目前流式解码模型中表现最好和最易工业化部署的,缺点是训练时内存比其他主流模型占用内存至少高一个数量级。究其原因是因为比其他模型如CTC和attention模型的内存多了一个解码器的输出帧数,U,导致的。U值一般在几十到几百之间。本文提出了一种在不降低模型性能的情况下对模型进行剪枝以降低U值的方法。该团队首先发现在RNN-T loss计算过程中,并不是每个计算节点都参与进了计算过程中。计算节点的数量和输出帧数U成正比,只要选择并只保留对模型训练有作用的计算节点便可减少模型内存提高模型训练速度。在计算梯度过程中,只有中间一段连续的计算节点参与进训练之中,根据不同的常见,这个连续节点数,S,为4或5。在实验中,训练时间达到之前sota的约十六分之一,内存占用达到之前的约五分之一,模型性能仅降了0.05%。个人尝试下来,仅用4张V100已经较少的调参便可完全重现并部署。中小型公司将sota模型应用于产品之中的成本和人力将大大减少
2010, Journal of Abnormal Child Psychology. DOI: 10.1007/s10802-010-9396-z
Mother and Adolescent Reports of Associations Between Child Behavior Problems and Mother-Child Relationship Qualities: Separating Shared Variance from Individual Variance
[Open]

[2022-09-07 11:47:00] 魏魏魏:
doi:10.1007/s10802-010-9396-z. Journal of Abnormal Child Psychology, (2010), Mother and Adolescent Reports of Associations Between Child Behavior Problems and Mother-Child Relationship Qualities: Separating Shared Variance from Individual Variance. 基于共同命运模型(Common Fate Model, CFM)的研究很少,所以看到了2010年的文献,只为更好地学习这种方法。共同命运模型很适合研究夫妻、母子和父子关系这种双方成员共享生活环境的人,即双方受到共同的环境变量影响,在一些变量上双方具有相似性。关系中的双方都需要在相关变量上报告自己的情况,这样就形成了配对数据(dyadic data),而且,双方的数据会存在依存性(interdependence),这也就打破了传统的相关分析需要变量各自独立的假设前提,此时共同命运模型可以解决这个问题。再有,传统研究只考察了单个被试在自变量和结果变量上的情况,这可能会出现因数据有共同来源而导致的共同方法变异(Common method variance),这会使最终结果的变异被夸大或缩小,也会影响我们对实际情况的准确认识。此时,这个模型也很有优势,因为它引进了另一个关系被试的情况,使得数据的来源多元化。基于共同命运模型的分析除了考察单个被试内变量的相关情况,也考察了被试间在同样的变量上的相关情况,还考察了关系水平上自变量与结果变量的相关情况。在这个过程中,关系双方共享因素带来的变异被分解了出来,帮助人们更好地了解了自变量与因变量的真实关系。当前研究考察了青少年行为问题与母子关系品质的关系,在两个变量上,母子双方有共同的认识,彼此间也会存在差异。基于共同命运模型,该研究同时考察了母子在相同变量上的情况。在具体分析中,除了考察子女报告的变量间的相关情况,也考察了母亲报告的变量间的相关情况,还从母子关系水平上分析了变量间的相关,并同时在模型中分别分析了母子在变量间的相关情况,并比较了多个相关系数之间在大小上的差异情况。最终发现了不同于基于传统研究的发现结果。
2022, 数字技术与应用. DOI: 10.19695/j.cnki.cn12-1369.2022.07.22 CNKI ID: SZJT202207022
论人工智能在大学校园的重要应用

[2022-09-04 21:57:00] 马斯克齊:
doi:10.19695/j.cnki.cn12-1369,2022,论人工智能在大学校园的重要应用。随着人工智能技术的不断发展以及疫情大背景下,校园学习如何与时代接轨列出人工智能在校园的一些应用,智能教学,智慧图书馆,智慧校园生活等都会有不一样的体验,同时对未来的教学改革产生重要影响。
2022, arXiv. DOI: 10.48550/arXiv.2208.11970 arXiv ID: 2208.11970
Understanding Diffusion Models: A Unified Perspective
[Preprint] [Open]

[2022-09-01 22:03:00] 张德祥:
https://doi.org/10.48550/arXiv.2208.11970 Understanding Diffusion Models: A Unified Perspective ;最近大火的视频生成模型 dall-e 等背后都是diffusion 模型,这篇论文细致的讲解了diffusion模型的来龙去脉,从ELBO 到VAE 到hierarchical VAE 到diffusion 模型,及diffusion模型的三个视角及diffusion模型的局限,整篇论文公式推导清晰易读是了解diffusion模型的好资料。
2015, Gender and Couple Relationships National Symposium on Family Issues. DOI: 10.1007/978-3-319-21635-5_9
Why Do Fathers Matter for Children’s Development?

[2022-09-01 15:01:00] 魏魏魏:
doi:10.1007/978-3-319-21635-5_9 National Symposium on Family Issues, (2016), Why Do Fathers Matter for Children’s Development?
延续此前阅读的内容,持续关注父亲和父亲的教养行为对子女发展的影响。这是一篇评论或综述性文章,作者介绍了此前研究中发现的父亲不同于母亲的教养行为,比如参与的行为领域不同,他更喜欢打闹类的游戏,而母亲更多是照料行为等,而且,发现这种不同对子女发展的影响也是有差异的。作者对此做出了分析和点评,认为这可能都是表面现象,可能都受到了文化影响下的教养观念的影响,比如,子女性别会影响父亲具体的教养行为。他认为,父母教养行为可能在本质上可能区别并不大。作者认为,为了更好地理解父亲的教养行为对子女的影响,可以基于“父子关系生态学的扩展模型”来分析相关影响因素(环境因素和个人特征因素)以及具体的影响方式。以后的研究应该继续关注父亲的教养行为并深入分析其具体机制。
.
2022, IEEE Transactions on Neural Networks and Learning Systems. DOI: 10.1109/TNNLS.2022.3152527
Learning From Noisy Labels With Deep Neural Networks: A Survey

[2022-09-01 14:36:00] 王昊:
doi:10.1109/TNNLS.2022.3152527 Hwanjun Song, Minseok Kim, Dongmin Park, Yooju Shin, and Jae-Gil Lee. 2022. Learning From Noisy Labels With Deep Neural Networks: A Survey. IEEE Transactions on Neural Networks and Learning Systems: 1–19. 本文是噪声标签2022年的综述论文,主要介绍结构化数据、图片分类数据集等进行去噪的各种方法。具体类别总结如下:
【Robust Architecture】基于attention注意力机制给干净样本和噪声数据进行打分,文章叫做Attention Feature Mixup,在计算最终loss的时候有两部分,一部分是同一个类的每张图和标签计算的交叉熵损失;另外一个损失是数据mixup得到的新的数据x'和标签y'计算的loss.
【Robust Regularization】
这一部分主要是通过一些添加正则ticks,防止模型过拟合到噪声数据上,常用的正则方法包含:label smooth、l1、l2、MixUp等.
【Sample Selection】Area Under the Margin metric (AUM):在训练过程中一边训练一边筛选数据的方式.
【数据划分】是通过密度聚类的思路,将一个类的数据分成easy dataset、smi-hard dataset 和 hard dataset,一般噪声数据是较为困难训练的数据,对于每张图分配一个权重,文中建议1.0、0.5和0.5;模型的训练借鉴了课程学习的思路.
【Semi-supervised Learning】基于半监督学习的带噪学习算法,首先介绍DivideMix方法,其实还是co-teaching的思路,但是在挑出干净样本和噪音样本后,把噪音样本当做无标签样本,通过 FixMatch 的方法进行训练,目前半监督图像分类的 SOTA 应该还是 FixMatch. (这个性能比较好)
【Label correction】“label correction phase”通过一个pre-trained模型得到随机选择每个类中的几张图采用聚类的方法得到Prototype样本的每个类的聚类中心,对输入图片得到的特征向量和各类聚类中心计算距离,得到图片的伪标签,最后的loss是原始标签计算的交叉熵损失和伪标签计算的伪标签的求和。
2022, 2021 IEEE/CVF International Conference on Computer Vision (ICCV). DOI: 10.1109/ICCV48922.2021.00014
Learning with Noisy Labels via Sparse Regularization

[2022-09-01 14:34:00] 王昊:
doi:10.1109/ICCV48922.2021.00014 ZHOU X, LIU X, WANG C, 等. Learning with Noisy Labels via Sparse Regularization[C/OL]//2021 IEEE/CVF International Conference on Computer Vision (ICCV). 2021: 72-81. https://doi.org/10.1109/ICCV48922.2021.00014. 本文使用稀疏正则化的方法,将输出尽可能地往one-hot上引导,使得输出锐化(一个是1,其它都是0,相当于有很大的确信度就是那一个答案,其它的概率都很低), 具体使用使用Lp Norm方法来达成. 该方法属于噪声标签去噪的损失函数方法的paper。噪声标签去噪综述可参见: SONG H, KIM M, PARK D, 等. Learning From Noisy Labels With Deep Neural Networks: A Survey[J/OL]. IEEE Transactions on Neural Networks and Learning Systems, 2022: 1-19. https://doi.org/10.1109/TNNLS.2022.3152527
2022, Experimental Cell Research. DOI: 10.1016/j.yexcr.2022.113176
N6-methyladenosine (m6A) reader IGF2BP1 accelerates gastric cancer aerobic glycolysis in c-Myc-dependent manner

[2022-09-01 12:18:00] 龙海晨:
Luo F, Lin K. N6-methyladenosine (m6A) reader IGF2BP1 accelerates gastric cancer aerobic glycolysis in c-Myc-dependent manner[J]. Experimental Cell Research, 2022, 417(1): 113176. PMID: 35489385 
DOI: 10.1016/j.yexcr.2022.113176
该文章研究了N 6-甲基腺苷(m 6 A),RNA m 6 A reader IGF2BP1 在胃癌发生发展中的作用。m 6 A参与调节多种癌症中的癌细胞增殖、转移、形成。文章分析了IGF2BP1在胃癌(gastric cancer,GC)中的功能和机制。研究结果表明,IGF2BP1 在 GC 组织中上调,可作为 GC 患者预后不良的预测因子。在功能上,IGF2BP1 促进体外 GC 细胞迁移和有氧糖酵解。IGF2BP1 敲低抑制了体内肿瘤的生长。文章证明了 IGF2BP1 通过 m6A 依赖性方式直接与 c-MYC mRNA 相互作用。文章发现,m 6 A reader IGF2BP1 以依赖 m 6 A/c-Myc 方式促进了 GC 的致癌性,这可能为 GC 提供治疗策略。