新策略!人工神经网络终于可以清晰地解读人类基因调节
在这个“大数据”时代,人工智能(AI)已经成为科学家的左臂右膀,例如,机器学习算法正在帮助生物学家理解成千上万个控制着基因功能的分子信号。但随着分析更多数据的新算法被开发出来,这些算法也变得更加复杂和难以解释。对此,定量生物学家Justin B. Kinney和Ammar Tareen提出了一种设计高级机器学习算法的策略,这种算法可以更容易被生物学家理解。
这种算法是一种人工神经网络(ANN)。受大脑中神经元连接和分支方式的启发,神经网络是高级机器学习的计算基础,不过虽然名字叫人工神经网络,但人工神经网络并不是专门用来研究大脑。
像Tareen和Kinney这样的生物学家会使用ANN来分析一种叫做“大规模平行报告分析”(MPRA)的实验方法的数据(MPRA是一种研究DNA的方法)。利用这些数据,定量生物学家可以制造出能够预测哪些分子在基因调控过程中控制特定基因的人工神经网络。
细胞并不总是会需要所有的蛋白质。相反,它们会根据需要,依赖复杂的分子机制来开启或关闭产生蛋白质的基因。而当这些机制不能正常工作的时候,疾病和不适通常就会随之而来。
Kinney说:“这种机制上的知识——就像理解基因调控的原理——常常是开发出治疗疾病的分子疗法的关键。”
但不幸的是,从MPRA数据中形成的标准人工神经网络方式,和科学家们在生命科学中提出问题的方式非常不同,这种差异意味着生物学家很难解释基因调控的原理。
而现在,Kinney和Tareen开发了一种新的方法,在计算工具和生物学家的思维方式之间架起了沟通的桥梁。他们创造出了定制的神经网络,这种神经网络可以从数学上反映生物学中关于基因和控制基因的分子的概念。通过这种方式,这两位科学家实际上是在迫使他们的机器学习算法以生物学家能够理解的方式处理数据。
Kinney解释说,这些研究突出了对现代工业人工智能技术进行优化,使其能够应用于生命科学的潜力。在验证了这种定制化人工神经网络的新策略之后,Kinney的实验室正在将其应用于多种生物系统的研究之中,包括与人类疾病有关的关键基因回路的研究。
12月13日,研究的结果在加拿大温哥华举行的第一届计算生物学机器学习会议上正式公布,在CSHL的bioRxiv服务器上可以看到研究结果的预印本。
本文来自: 前瞻网