• 首页
  • 上一页
  • 目录
  • 下一页
  • 书架

《我的金融科技帝国》

第655章【神经网络深度学习】
经元,大家都知道它的结构,这是树突,这是轴突,其它神经元发过来的信号通过树突进入神经元,再通过轴突发射出去,这就是一个神经元的运行机制。”

    “现在我们把神经元的树突变成输入值,把轴突变成一个输出值,于是这个神经元就变成了这样的一张图。把它转化为一个数学公式就更简单了,[X1+X2+X3=Y],就是这个公式。”

    “没错,就这么简单。最复杂的事物往往是有最简单的事物创造的,简单的0和1就塑造了庞大的计算机世界,四种核苷酸就空置了纷繁复杂的生命现象,一个简单的神经元反射就塑造了我们的大脑。”

    陈宇停顿了一会儿,再度环视众人:“问题的关键不是基本结构有多简单,而是我们如何使用这个基本结构来构建庞大的世界,神经元之所以神奇是因为它有一个激活机制,即所谓的阈值。”

    “神经元的每一个树突不断的接受输入信号,但并不是每一个输入信号都能让轴突输出信号,每一个树突在输入时所占的权重也不一样。”

    “比如你追求一个妹子,你孜孜不倦地采取各种行动,今天送了她一束花,明天请她吃大餐,但你发现这些行动都打动不了她。直到有一天伱陪她逛了一天街,她忽然间就被打动了,答应做你女朋友,这说明什么?”

    “说明并不是所有的输入权重都是一样的,在妹子那里可能逛街的权重最大,其次是效果的积累并非是一个线性渐进的过程,而是量变引起质变。”

    “所有的输入在某一个点之前完全没效果,可一旦达到某个值就突然被激发了,所以,模仿神经元的这种激活特性,那么对刚才的公式做一下改造。”

    “每个输入需要一定的权重,在前面加一个调节权重的系数[W],后面加一个常数方便更好地调整阈值,于是这个函数就变成了这个样子。”

    方鸿也看向了会议大屏幕,是一个新的数学公式。

    【W1X1+W2X2+W3X3+b=Y】

    陈宇看着屏幕里的公式说:“为了实现激活的过程,对输出值再作进一步的处理,增加一个激活函数,比如当X>1时,输出1;当X<1时,输出0,于是就成了这个样子。”

    “不过这个函数看起来不够圆润,不是处处可导,因此不好处理,换成Sigmoid函数,这样一个简单的函数就可以处理分类问题了。”

    “单个的感知机,其实就是画了一条线,把两种不同的东西分开,单个感知机可以解决线性问题,但是对于线性不可分的问题却无能为力了,那意味着连最简单的异或问题都无法处理。”

    异或问题对于在场的所有人包括方鸿都明白,这是计算机的基本运算之一。

    这时,陈宇自我反问道:“异或问题处理不了,那岂不是判死刑的节奏?”

    陈宇旋即自答:“很简单,直接用核函数升维。感知机之所以能变成现在的深度学习,就是因为它从一层变成了多层,深度学习的深度就是指感知机的层数很多,我们通常把隐藏层超过三层的神经网络就叫深度神经网络,感知机是如何通过加层搞定异或问题的?”

    陈宇回头看向屏幕调取下一张幻灯图并说:“计算机有四大基本运算逻辑,与、或、非、异或,这个不用多讲了。如果我们把异或放在一个坐标系来表示就是这样的。”

    “原点位置X是0,Y是0,于是取0;X=1时,Y=0,两者不同取1,通力,这儿也是1,而这个位置X、Y都等于1,所以取0,在这张图上如果我们需要吧0和1分开,一条直线是做不到的。”

    “怎么办?这就要看异或运算的本质了,数学上来说,异或运算其实一种复合运算,它其实可以通过其它的运算来得到,证明过程太复杂这

    -->>(第2/3页)(本章未完,请点击下一页继续阅读)
  • 加入书签
  • 上一页
  • 目录
  • 下一页
Copyright shukugu.com 返回首页
顶部