深度学习在生物医学领域的应用进展述评*

栏目导航

综合新闻

期刊导读

现在的位置：主页 > 期刊导读 >

来源：医学食疗与健康 【在线投稿】栏目：期刊导读时间：2021-01-15

【作者】网站采编

【关键词】

【摘要】深度学习（Deep Learning，DL）作为机器学习（Machine Learning，ML）领域的一个新兴学科和快速发展的分支，已经被广泛应用于图像识别、自动语音识别、自动机器翻译、自然语言处理等多个

深度学习（Deep Learning，DL）作为机器学习（Machine Learning，ML）领域的一个新兴学科和快速发展的分支，已经被广泛应用于图像识别、自动语音识别、自动机器翻译、自然语言处理等多个领域［1-3］。深度学习框架最早在20世纪80年代建立，由于计算机计算能力的大幅度提升和大量可获取数据集的涌现，其在2006年开始快速发展，并逐渐扩大在计算机领域的影响［4，5］。

在机器学习过程中，构建学习模型需要领域专家参与设计特征抽取器，从而提高算法的识别精度。而深度学习作为一种表示学习的形式，并不需要太多相关领域的专家知识。它是由多个顺序排列的表示层与大量原始的非线性操作组合而成，使得一层的表示（从原始数据输入开始）被馈入下一层，并转换成更抽象的表示，反复操作直到数据点变得可区分。通过这种方式，该模型可以学习高度复杂的函数［6］，实现准确的数据预测。深度学习可以提供更高准确度、处理更复杂问题，因此也意味着需要海量的数据样本、大量的计算资源、特定的模型架构和高额的成本投入。

表1 深度学习各模型对比表Tab.1 Comparison Table of Deep Learning Models模型名称优点缺点主要用途卷积神经网络共享权值，局部感知；具有良好的数据特征提取和学习能力位检测等循环神经网路有效处理时序数据长时依赖会产生梯度消失和梯度爆炸无记忆功能，处理时序数据能力有限；全连接模式冗余且低效图片分类检索、目标分割、目标定语音处理、语言建模、自然语言处理等深度置信网络高度灵活、易拓展，性能效果良好；不易因随机初始化权值参数而陷入局部最优；更加抽象地学习高层特征应用范围有限，网络结构复杂，消耗算力；无法学习观察变量时间联系上的关系语音识别、文字检测、遥感图像分类等生成对抗网络能更好地建模数据分布；在理论上可训练任何一种生成器网络；无复杂的变分下界，避开近似计算棘手的概率难题难训练、不稳定，易出现模式缺失问题；生成器和判别器同步困难图像生成、图像转化、图片修复等深度强化学习不需要大量的数据训练，引入自我学习，通过“奖励机制”，易于产生近乎无限的经验。环境探索难，数据昂贵；奖励函数难设计；系统复杂；采样效率低智能控制机器人、游戏、分析预测、自动驾驶等

深度学习最常见的几种模型主要有卷积神经网络（Convolutional Neural Networks，CNN）、循环神经网络（Recurrent Neural Network，RNN）和深度置信网络（Deep Belief Networks，DBN）（表1）。典型的CNN拥有卷积层、池化层和全连接层三部分，其中卷积层负责提取目标的局部特征；池化层用来大幅降低参数量级（降维）；全连接层用来输出想要的结果。CNN通过卷积层的特征提取和池化层的数据降维，具有共享权值和局部感知的特点，能够较好地识别对象特征，在生物医学领域的图像配准、影像识别方面应用较多［7］；RNN结构简单，主要由输入层、隐藏层和输出层组成，较传统神经网络的区别在于每次都会将前一隐藏层的输出数据带入下一隐藏层一起训练。RNN由于对时域序列的输入数据处理更胜一筹，能够对序列的演进方向进行递归，因此在生物医学领域主要应用于患者的病例识别、文本处理等自然语言处理过程（Natural Language Processing，NLP）；深度置信网络由多层受限玻尔兹曼感知机（Restricted Boltzmann Machine，RBM）和前馈反向传播（Back Propagation，BP）网络组成，其不仅克服了BP网络局部最优与训练时间长的缺点，而且结合了有监督学习与无监督学习的优点，具有高灵活性、容易扩展的特点［8］。

近年来，随着生物医疗设备、治疗记录和应用程序能够以图像、声音、文本、图形和信号的形式生成大量数据，已经逐步促成了生物医学大数据的概念。深度学习在生物医学和医疗保健方面的分析和应用受到了前所未有的关注。该技术已挖掘出了许多有意义的功能并完成了部分迄今为止其他方法和专家无法解决的任务［9］。

本研究的目的在于通过对国内外相关文献的研究，了解深度学习在生物医学方面的应用现状。获取深度学习在现阶段主要应用的技术框架，预测该技术可能对生物医学实践发展做出的推动作用。

1 深度学习在生物医学领域应用

随着可穿戴式设备、智能手机、医疗设备、电子健康记录的广泛使用，以及现代生物医学技术的推广，生物医学数据量呈现指数式增长态势。例如，Gene Expression Omnibus（GEO）数据库中的基因表达数据集在过去15年从条增至条，蛋白质数据库（Protein Data Bank，PDB）中的大分子结构数量从2005年的个增加到2020年3月12日的个（图1）。各种生物医学数据在反映人群状态、揭露机体原理的同时，如何有效地被二次利用也逐渐得到大家的关注。深度学习作为大规模数据的有效解释器，在疾病预测、诊断、治疗和预后等方面呈现出巨大潜力。除此之外，相关算法专家利用深度学习在生物信息学、医学图像识别、临床辅助决策、药物开发等领域也做出了不菲的成绩（表2，数据截止至2020年3月，因此2020年数据不全）。

文章来源：《医学食疗与健康》网址: http://www.yxslyjkbjb.cn/qikandaodu/2021/0115/595.html

上一篇：《右江医学》微信平台开通
下一篇：中医药院校医学生成长过程中心理健康问题研究