“这就需要实际去试一下,如果预测是两碗饭吃饱,但实际要吃三碗饭才饱,其中一碗的误差就是损失,描述这个损失的函数即[3-N=1],这就是损失函数。”
“机器学习就是通过不断尝试让这个误差达到最小的过程,寻找损失最小值的方法通常是梯度下降,一旦我们找到了最小误差,就会发现当[N=3]的时候误差最小,也就是机器学习找到了真实的规律,就成功解决问题了。”
陈宇再度看向众人道:“所以,机器学习就是在寻找数据的规律,大部分时候,它的本质就是把数据投射到坐标系里,然后用计算机通过数学方法画一条线区分或者模拟这些数据的过程。”
“不同的机器学习方法,就是在使用不同的数学模型来投射数据和画线,从上世纪到现在,不同的流派找到了不同的方法,擅长于解决不同的问题,影响比较巨大的有这么几种:线性回归和逻辑回归、K近邻、决策树、支持向量机、贝叶斯分类以及感知机等。”
方鸿坐在一边旁听默默不言,他也算是计算机科学领域的半个业内人士,更有前世记忆先知先觉的优势,此刻旁听也是毫无压力。
陈宇他们走的显然就是神经网络这个流派,不过也向前推进了一步,进入到了强化深度学习,而神经网络的前身就是感知机。
这三个名词本质上都是在玩同一个东西。
却说此刻,陈宇缓缓地说道:“深度学习最基本的思想就是模拟大脑神经元的活动方式来构造预测函数和损失函数,既然叫神经网络,必然和人的大脑神经元有一定的关系,单个感知机的算法机制其实就是在模拟大脑神经元的运行机制。”
屏幕上呈现一张大脑神经元的结构图。
“这是一个神经元,大家都知道它的结构,这是树突,这是轴突,其它神经元发过来的信号通过树突进入神经元,再通过轴突发射出去,这就是一个神经元的运行机制。”
“现在我们把神经元的树突变成输入值,把轴突变成一个输出值,于是这个神经元就变成了这样的一张图。把它转化为一个数学公式就更简单了,[X1+X2+X3=Y],就是这个公式。”
“没错,就这么简单。最复杂的事物往往是有最简单的事物创造的,简单的0和1就塑造了庞大的计算机世界,四种核苷酸就空置了纷繁复杂的生命现象,一个简单的神经元反射就塑造了我们的大脑。”