您当前的位置：首页 > 实用范文 > 读后感 > 内容

TD,learning，PER和Epsilon：深度学习对高等教育教学的启示

材料写作网时间: 2020-03-28 06:55:33 阅读:次

　　摘要：本文从研究深度学习出发，提出深度学习在增强学习领域能被高等教育借鉴的三种重要算法：时间差分学习、优先经验回放、创新指数，通过对这些算法的具体分析，总结这些算法如何优势互补，综合运用到高等教育教学实践上，提高高等教育教学效果。
　　关键词：深度学习；时间差分学习；优先经验回放；创新指数
　　中图分类号：G642.41 文献标志码：A 文章编号：1674-9324（2018）31-0239-03
　　一、引言
　　'深度学习“本质上是一个计算机科学领域的概念。谷歌的深度学习机器人Alpha-Go在围棋上轻松战胜人类顶尖高手的故事已经家喻户晓。如果把中国棋院、韩国棋院、日本棋院比作世界围棋界最顶尖的三所高校，顶尖的棋手是这三所高校最优秀的毕业生。而Alpha-Go开发团队里围棋水平最高的工程师也只有业余五段，相当于小学毕业学历，一天大学都没有上过，但是掌握了深度学习方法的学生，结果成绩远远超越了所有顶尖大学最优秀的毕业生。这是一个值得思考和研究的问题。深度学习和AI（Artificial Intelligence）'人工智能“紧密相关。
　　计算机是通过数理逻辑运算来进行学习的，如果计算机的深度学习算法反向被人类学习借鉴，那就表明这些学习方法在数理逻辑上也是可以被证明有效的。本文从这个角度出发，提出已经在深度学习上得到检验有效的'算法“，反过来也可以让人类的学习方法和效率得到提升，最后提出深度學习的研究成果对高等教育教学的启示。
　　二、深度学习概述
　　深度学习是近十年才被提出的一个概念（Hinton[1]，2006）。简单地说深度学习就是让计算机通过模仿人类大脑的神经网络能够像人类一样学习。
　　深度学习分为'认知“学习和'增强“学习两大类。
　　（一）认知学习
　　深度学习根据其应用的领域不同，或者说模仿人脑的机能不同，分为'认知“学习和'增强“学习两大类。
　　所谓'认知学习“，就是每一项输入都有一个标准的输出答案。例如图像识别、语音识别、数学计算题、史实知识点，等等。因为监督者立刻就可以反馈对或错，所以也被称为'有监督的学习“。
　　（二）增强学习
　　而'增强学习“和'认知学习“最大的不同就在于没有标准答案。对于没有标准答案的问题，就不能轻易地去否定或肯定一个与原来流行的权威理论不同的思想，而是随着不断地探索，会得到一些时而清晰时而模糊的反馈，要经历一个较长的过程才能看出最终的结果是好是坏。当下的每...