人脸识别啥原理?人工智能(二)卷积神经网络(36)

作者: admin 分类: 科学 发布时间: 2021-09-21 22:21

        所以这幅图片在计算机看来啊,就是这么一大堆数字是吧?那么这一堆数字计算机要认说他到底是X呢,还是不是X他怎么去做呢?首先要提取特征。提取特征的方法就是使用一个叫做卷积核的东西来做卷积运算。卷积核啊也是一个矩阵啊,一个方块。这个方块呢一般是3乘3或者5乘5的。比如说啊我们这里有一个卷积核,这个卷积核呢它是3乘3的。

        前呢里面的数字是这样的,这三个数字他是一其他的数字呢它是零。好,这就是我们的一个卷集合了。这个卷积核,我们和左边的这个图像做卷积运算。什么叫卷积运算呢?他的意思就是把这个卷积核放到图片上。某一个3乘3的部位,让他们对应元素相乘。比如说啊你先把它放到左边的这个部位。然后呢哎盖住了盖住了之后他们有对应元素吗?然后对应元素乘起来就1乘0加0乘0加0乘0加0乘0,这么一加加完了之后再。

        再把它写到中间这个位置,我再说一遍,就是啊这个卷积盒放到他这个部位,对应元素相乘乘完了之后相加再放到正中央这个部位。于是就会构成一张新的图,这张新的图就叫做特征图。特征图的第一个元素就是把这个卷积盒和这一块的元素对应相乘,在相加。我们仔细看就会发现这个卷进盒只有这么斜着的三个元素是你,其他全都是零。所以我只要把这里边的这三个数加起来,是不是就应该是第一个结果了,对不对啊,我们把它算出来。这一个是良这边医治一家,结果应该是2,对不对?哎,特征图第一个元素就是2,那特征图。

        第二个元素我们该怎么找呢?那很简单,你只需要把这个卷进和往右边平移一下。找到这样的一个方块,是不是找到这样一个方法,你把这个卷积核和这个方块一叠加,然后对应元素相乘在相加,这叫卷积是不是?事实上,也就是把第二个方块的这三个元素加起来。因为只有这三个数是一,其他都是零吧。那么把他们三个一相加,结果是结结果是零。哎,这就是课程组的第二个元素。你按照这种方法,把所有的元素都写出来啊,我把它写完,这样我们就得到了啊所谓的特征图。好,那咱们来解释一下。你说你干了这件事之后,到底得到了什么呢?我们仔细看就会知道这个卷积盒吧,只有斜着的这三个元素是一。

        所以如果原来那张图上也是觉着这三个元素是一的话,最后他们一做卷积,这个数字就会特别大。不对,也就是说我们提取到了这个特征。你在这张图上找一找,说哪个数字特别大,这个数字特别大,就说明在这个部位啊特别满足这种鞋子的线条的特征。对吧这个数字是三也特别大,这就是说明在这个部分也有一个斜着右下的线条。哎,这个数字也是三,就说明这个部位也有一个斜的线条。

        那么二和二这两个部位就说明他的特征性稍微弱一点。事实上你会发现左上和右下这两个搅拌,他虽然也有一个右下的一和1,但他缺了一个角,对不对啊,缺了一个角,其他地方还有数字小的,比如零和1,就说明这样的部位吧,他没有斜向右下的线条。所以我们这一个卷集合其实就是对应了一个特征。这个特征就是一个斜向右下的线条。而在这个特征图中,那个数字比较大的部位。就说明这些个部位他就满足这个特征,其他的部位数字越小,它就越不满足特征,这不就是用数学方法提取图像特征嘛。

        当然你刚才说的这个卷积核啊,它是右下的三个数字是一,所以就提取在一个往右下方写的一个线段这个特征。那么如果你想提出来一个,比如说往左下写的线段的特征。你应该找什么样卷集合的,那应该是这三个元素是一其他事情,对不对?你说我想要一个竖着的线段,那怎么办?那就是这三个元素是一其他事情呗。你说我想要一个这样的圈怎么办?那就是这几个数字是一,其他是零呗。总而言之,通过不同的卷积核,我们就能够对图像进行不同的处理,得到不同的特征图显示出来这种特征它分布在图像的什么样的位置。

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!