基于深度学习的人脸识别技术原理

特征向量

每一个实际问题的数据解答都是通过建立并求解一个数学模型,这同样适用于人脸识别。人脸识别就是在寻找一个函数f(x)=y,对于每一张人脸x,它都可以完美找出其人脸特征值y(可以理解为能够反应出这张人脸核心特征的向量,利用这组特征,可以大概率的识别出该人) ,即图像向量映射为人脸特征向量

file

1 一张图片的计算机表示

数字图像是连续的光信号经过传感器的采样在空间域上的表达。一张图像是由一个包含若干个像素点的矩形框组成的,试着把上图在“画图”软件中放大会有更直观的感受,下面是上图放大后的效果。

file

可以看到图像是由很多个小格子组成的,每个小格子都只有一种颜色,这是构成图像的最小单元——像素(pixel)。彩色图像的每个像素的颜色一般由红绿蓝色 (RGB)三原色叠加形成。通常情况下,RGB各有256级亮度,因此 R,G,B各占8bit,则一个像素就一共24bit。

file

2 图像灰度化

当彩色图片RGB中的R=G=B时,就说此图片为灰度图片,注意:灰度图片也是三维的RGB,不是像黑白图的一维。

但是在机器学习中,我们把彩图转成RGB相同的灰色图,因为三个维度一样,我们只取一个维度,这样就简化了运算,但是会丢失一些信息。

黑色到白色之间的灰度值(grayscale),如下图:
file

3 什么是深度学习?

机器学习 约等于 寻找一个数学模型来描述事物。

深度学习和所有机器学习方法一样,是一种用数学模型对真实世界中的特定问题进行建模,以解决该领域内相似问题的过程。 

例如打麻将胡牌在数学上可以看成是 
file

深度学习就是把计算机要学习的东西看成一大堆数据,把这些数据丢进一个复杂的、包含多个层级的数据处理网络(深度神经网络),然后检查经过这个网络处理得到的结果数据是不是符合要求——如果符合,就保留这个网络作为目标模型,如果不符合,就一次次地、锲而不舍地调整网络的参数设置,直到输出满足要求为止。

深度学习是采用神经网络,用于解决线性不可分的问题。深度学习分为三个步骤:      

  • (1)建立网络架构
  • (2)决定学习的目标(如误差小于x。。。)
  • (3)学习,找出“最优”的模型函数

注:本文为转载,原文地址:2019-03-18 基于深度学习的人脸识别技术原理

为者常成,行者常至