第一章 机器学习概述

1. 0.学习指导

各位同学大家好,欢迎大家来到由我和方少群老师共同为大家讲授的这门人工智能。在正式的课程开展之前,我想跟大家来讲一讲如何更好的、更有效的学习这门课程,我是今天的主讲老师丁慧洁。人工智能这门课适合于什么样的同学来学习?我们在开展人工智能这门课程的学习过程当中,每个章节又是有哪些学习的重点?以及最后我们用什么样方法来完成整个人工智能这门课程的考核?我想,可能这些都是同学们目前存在的一些疑问,那么在今天的学习时间当中,我就会为大家来逐一讲解。

人工智能这门课是计算机科学与技术的本科专业的一门重要的专业选修课,他的理论性比较强,涉及的知识面也比较广,所以在大家学习的过程当中会发现他是一门交叉型的学科,涉及到的知识的领域还是比较多的。学习过程当中也会发现技术层面的方法,和涉及到的一些技术配置环节也是比较多的,所以大家会觉得这门课最开始一学习的时候会觉得有一些复杂,但是不要紧,随着我们课程的不断深入,以及我们为大家配备了完善的课程的视频资源和操作的实训资源,大家会觉得这门课学习起来会比较容易。

这门课程不仅仅是适合于计算机与科学技术专业的本科的学历型的同学们的学习,也适合于这种非学历的对人工智能课程感兴趣的计算机,IT行业的从业者来进行学习。在这门课程当中,我们这次的学习内容事涉及到的是54学时3个学分,那么通过人工智能这门课程的学习,我们也可以掌握人工智能的基本概念,基本原理和基本应用,包括我们经常能听到的什么是机器学习。谷歌公司开发的 Tensorflow包括自然语言的文本处理、语音处理、图像处理和大家现在广泛应用的人脸识别,这些比较常见的人工智能的知识点。

在人工智能正式学习之前,我们会有一个绪论部分,在这个部分我们会了解到人工智能的一个定义,其实大家可以看到不同的学习人工智能课程当中,对人工智能的定义还是比较广泛的,所以我们在这里面会给大家逐一根据我们学习的内容和要求的层次,给大家进行人工智能的定义的一个全方位的解读。还包括人工智能的发展,推动人工智能学科的发展,其实是有一些非常重要的人物和非常重要的历史实践决定的,包括我们会跟大家初步的来介绍一下人工智能它到底需要研究哪些内容,以及人工智能领域有一些最新的发展和最新的标志性的事件。

绪论结束之后,我们就会来学习到机器学习。第一章机器学习概述当中,我们要理解人工智能跟机器学习之间到底是什么样的一个关联,经常会听到有人说机器学习和人工智能它有什么关系,有什么不同,有什么区别,包括它们概念上到底是怎么区分,其实没关系,人工智能和机器学习之间的联系,我们都会通过人工智能的概念,包括它的应用场景过渡了解到我们为什么要学习机器学习以及机器学习的分类,还有包括它的经典算法,以及我们知道在人工智能机器学习当中非常卓越的谷歌公司开发的Tensorflow它的一些基本的知识,以及我们会动手教大家,不仅仅是停留在理论层面,会教大家如何在windows的环境下一步一步的装好Tensorflow,帮助后期的学习和配置,以及我们在学习的过程当中,机器学习当中涉及到Tensorflow当中常用的第三方的一些模块。

第二章依旧是Tensorflow的一些基础的内容,包括Tensorflow的一些基础的框架,包括Tensorflow的一些源码的结构,它的核心概念和一些基本的编程的步骤,所以慢慢我们就会从理论过度到实际的一些动手编程的这个环节。第三章我们会把Tensorflow的内容进行一些深入,包括它加载数据的几种方式,存储和加载的模型以及如何评估和优化它的模型都是在第三章的内容当中涉及的。第四章我们会学习到在机器学习人工智能当中非常重要的一个知识点,叫线性模型。我们来理解什么是一元,什么是多元的线性模型,以及理解线性回归和逻辑回归的理论以及应用。第四章之后我们会涉及到我们常常听到的SVM支持向量机,理解支持向量机的算法,理解SVM常用的一些核函数,它相关起到的一些作用,以及拟合线性回归和逻辑回归的一些编程过程,实现SVM的非线性二值分类和多分类的编程过程。

大家听到章节介绍的时候是不是觉得有点害怕?因为有大量的这种数学的运算和编程的过程,这个大家不用担心,在相应的章节当中,我们都会逐步地给大家来讲解,并且有配套我们的整个操作视频。大家只要按照步骤一步一步做,通过理解他的理论部分,和实际部分地动手相结合,那在第五章当中大家会发现也很容易就能够把他解决。

到了第六章就是神经网络,大家可以现在都听到很多,也就是说人工智能其实它就是模拟人的神经的这种发散性的学习方法,所以在人工智能当中我们第一个重要的理解也是它的学科发展当中的一个过程,又包括它的神经网络和神经网络的分类,那么掌握一些全连接网络识别的应用,包括手写数字的开发过程,慢慢我们就会把案例和我们的理论相结合。那么在这个过程当中,也不是枯燥地去理解什么是卷积神经网络的结构和它的各层的工作原理,而是在这个当中我们会通过mnist的数据集的神经网络的识别来掌握它的具体的应用,也包括理解LSTM的神经网络的结构和使用循环神经网络来识别mnist的数据集

通过我们前面的学习,大家会发现说那么机器学习到底他是怎么样学习的?其实在学习的过程它会分成叫做有监督学习,无监督学习和半监督学习,那么在后续的内容当中我们都会讲到,那么在第七章当中,我们重点是学习机器学习当中比较常用的无监督学习,我们要理解无监督学习的概念,理解聚类模型和自编码网络的模型的概念,理解 K均值聚类算法,也理解到自编码网络算法的实现过程。经过第七章的无监督学习之后,我们就会常常涉及到我们自然语言当中,包括对文本,包括对视频、包括对图像、包括对语音,他都是怎么处理的?

在第八章当中,我们就会涉及到自然语言文本处理,理解自然语言文本处理的一些概念,然后也理解在Tensorflow的环境下,文本是怎么样一步一步处理出来的,也会给大家一个小的案例,我们会教大家唐诗它的案例的编程过程是怎么样进行自然语言文本的处理的,所以非常有趣。除此之外,还另外一个就是我们写智能影评,因为大家知道现在我们的编辑都可以用我们的人工智能来代替,还包括影评部分对于自然语言文本地处理当中,它的智能影评分类案例的编程是如何实现的一些步骤都会在第八章学习。

第九章就涉及到了我们常用的语音处理,大家现在其实已经不陌生了,比如说苹果的siri,比如说我们用科大讯飞进行语音识别,所以我们来理解一下语音识别和语音合成它的过程是什么样子的,然后理解它是如何听懂这个数字,如何听懂中文,我们也正在跟大家也有讨论,人工智能现在它能辨认多个语种,包括现在世界上的一些小语种,他都会有相应的语音处理的方法以及语音合成的一些案例,你看到这边大家是不是就充满了期待感?我们第九章学习的内容,都会涉及到语音这一块。

第十章是图像,我们理解图像处理的一些应用场景,包括图像的修复、物体的识别、物体的检测,还包括人脸识别,掌握图像物体的识别,我们平时涉及到的验证码,它是怎么样进行识别的,我们在大量的这种人工智能的学习过程当中,我们会发现为什么我们要输入这个验证码,它是如何识别的?然后在整个过程当中它的编程过程是什么?在第十章都有所涉及到。

第十一章我们会讲到人脸识别,也就是说我们再通过这个机器学习,Tensorflow的过程当中,我们理解到如何进行人脸的识别、人脸的验证来判断性别年龄等等,现在人脸识别大家应该已经非常地不陌生了,我们登机、我们坐高铁、我们平时的出行,甚至包括现在的购物,很多我们都会经常说我们可以刷脸,对不对那么我们可能在未来我们开车的时候根据你的面部表情,根据你注视前方的时间的长短,面部整个在开车过程当中的不同的回复给人工智能的汽车,他会提醒你是不是需要休息,是不是要注意,要集中精神开车等等。这些人脸识别的,从初期的这一些验证过程还会更为精准,对人脸识别的各个环节会更为精准。

那么学习到第十一章,基本上我们这门机器学习的课程就不多结束了,那么人工智能的课程当中,其实它的学习的分支还有非常的多,我们在学习的过程当中,我们这次的课程通过动手,通过程序,通过知识的理解,通过梳理整个人工智能目前最有效的一些实践方法,来让大家学习到人工智能这门课程的部分知识。因为人工智能这门课程相对来说,大家可以看到它的知识比较庞杂,涉及到计算机学、数学,包括控制论,包括我们的信息论,包括神经科学,非常多的内容,所以我们在这个阶段的学习当中,主要是学习以上这些内容。

那么在完成了3个学分54个学时的学习之后,我们怎么样来考试,这是大家比较关心的问题了。首先我们的学习平台,大家现在登录到得我们可以观看视频的Moodle平台,在这个过程当中,我们也是广东开放大学的所有课程的学习平台当中,我们选择的最优秀的一个集视频观看、单元测试、讨论包括作业等等,非常有效帮助大家学习的这样的一个学习平台。在学习的过程当中,我们会分成形成性测试和终结性测试两个重要的考试环节,那么形成性测试是占到50%的分数,终结性的考核是占到另外50%的内容。形成性考核顾名思义,它就是阶段性的学习的过程来形成最后的成绩。在学习内容当中大家可以看到形成性的测试会有两次,然后我们还会在规定的时间内,在规定的时间开始的实时性地讨论也有两次,还有对一些重点的这种这些内容,我们开展可以覆盖整个学期的不限时间的,只要在课程开设的时间当中都可以来回答的这种非实时性的讨论一共有三次。

同学们要注意了,形成性的测试一共是占到50%的比例,两次形成性测试非常的重要,大家一定都要进行网络平台的测试。然后实时性的讨论,我们会给大家具体根据课程要求的时间下发到每一位同学的学校,然后大家会知道在哪一天哪个时间段一定会开始就是在线型的实时性的讨论。那么一般我们都会在选择大家下班后在晚上傍晚7:00~8:00这个时间段来开展,具体到时候大家联络课程的责任老师,我们会把具体考核的实时性的讨论的时间也公布在网上,大家注意在学习的过程当中提前在那两个时间段设置一个备忘录,不要错过,实时性的讨论也是如果过了时间实时性的讨论的跟帖,我们就不能在网上实现,因为是我跟大家互动,所以也希望大家到时候能够积极参与。

非实时性的讨论就没关系了,整个学习时间内,整个学期都可以完成,所以形成性的考核主要就是包括形成性测试两次,实时性讨论两次和非实时性的讨论一共三次,那么最后在期末我们会有一个终结性的考核,考核的题型有单选题、多选题和判断题,满分也是100分的考卷,那么也是在平台上进行完成,大家只要自动答题之后就会自动生成成绩,那么这块终极性的考核也是占到50%的比例。

通过在我们正式开始课程之前给大家的这些介绍,大家应该对我们这门人工智能课程有了一些初步的了解,希望大家接下来能够更好的学习,能够更好的通过考核,好了,马上就进入到我们正式学习当中的绪论部分,我们绪论部分见。