当前位置:大学毕业论文> 毕业论文>材料浏览

关于图像识别论文范文写作 基于人工智能算法的图像识别和生成相关论文写作资料

主题:图像识别论文写作 时间:2024-03-17

基于人工智能算法的图像识别和生成,这是一篇与图像识别论文范文相关的免费优秀学术论文范文资料,为你的论文写作提供参考。

图像识别论文参考文献:

图像识别论文参考文献 参考文献自动生成人工智能的论文论文目录怎么生成论文的目录怎么自动生成

摘 要:本次报告的工作是利用PCA,SVM以及人工神经网络(ANN)实现对人脸的特征提取、分类和预测.然后利用GAN(生成对抗网络)实现对手写数字的生成,并用SVM做预测,验证生成效果.

本次报告采用的数据源自剑桥大学的ORL 人脸数据库,其中包含40个人共400张人脸图像.

关键词:人工智能;图像识别;数据

中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2018)13-0173-02

1 PCA降维

PCA(principal components analysis)即主成分分析,又称主分量分析.旨在利用降维的思想,把多指标转化为少数几个综合指标.

首先我们给出了数据库的平均脸的图像,并利用PCA对人脸降维,通过改变降低到的维度研究了保留维度的多少带来的影响.最后给出了每一个维度的特征脸图像,讨论了每一个维度所能够代表的人脸信息.

1.1 平均脸

首先,我们将数据库中400张人脸按行存储到一个矩阵中,即每一行为一张人脸(10304像素),每张人脸共10304维特征.我们对每一个维度去平均,构成一个新的行向量,这就是平均脸.

平均脸反映了数据库中400张人脸的平均特征,可以看清人脸的轮廓,但无法识别人脸的局部细节.

1.2 降低至不同维度时还原脸的情况

从左到右从上到下依次是同一张脸降低至10,30,50,100,200,250,300,350,400的图像.可以看到,随着保留维数的增多,图像越清晰,与原图的差异越小.

1.3 提取单一维度的特征做还原

为了研究不同维度所代表的人脸的信息,我们把PCA之后的每一个特征向量单独提取出来对人脸做还原,还原的时候不加入平均脸并且做直方图均衡化.

结果如下:

每一张图像下方的数字代表了PCA之后按特征值从大到小排序的顺序,比如第一张图代表PCA之后最大特征值所对应的特征向量还原出的人脸.

特征累积图的纵坐标代表了所保留的特征占总特征的比例.它是这样计算出来的,假设保留k维信息,则纵坐标值为这k个特征值的和除以总的400(400*10304的矩阵,最多有400个非零特征值)个特征值的和.

从图4可以看出,当保留维数为100维时,即能保留人脸90%的信息,而之后随着保留维数的增多,保留信息的增多变缓.

同样的结论也可由提取每个维度所代表的特征获得.从前到后观察实验所得的图像,我们可以发现,人脸变得越来越模糊,到100维以后已经分辨不清人脸了.这就说明前面的维度反映了大众脸的特征,而越往后面的维度则反映不同人脸的细节,比如头发长短等等,以及图片噪声.

2 SVM对人脸分类

SVM(支持向量机)是Corinna Cortes和Vapnik等于1995年首先提出的,在机器学习中,支持向量机是与相关的学习算法有关的监督学习模型,可以分析数据,识别模式,用于分类和回归分析.

2.1 制作多分类器

用PCA对人脸降维以后,我们用SVM将400张人脸进行分类.我们取每个人的前五张照片合并起来共200张作为训练集,每个人后五张照片合并起来共200张作为测试集.40个人即有40个标签,也就是有40类,但SVM只能作二分类器,因此我们利用二分类器生成多分类器,基本思想是制作C(40,2)个一对一分类器(也就是每两个类别一个),每一张照片都分别用所有一对一分类器分类,分类结果存储到矩阵中,分类结果就是矩阵中数字最大的那个.

分类前,我们还需对PCA后的数据进行归一化处理,将图像矩阵的每一个元素映射到(-1,1)之间.

2.2 参数选择及程序结果

1)分类数据:每人取前五张做训练,后五张做测试(不加入自己的人脸)

SVM参数设定:k 等于 75(PCA降至75维)

Sigma 等于 30

c 等于 15

预测准确率: accuracy等于0.8950

2)每人取前五张做训练,后五张做测试(加入自己的人脸)

SVM参数同上,

预测准确率: accuracy等于0.8585

我们发现,当加入自己拍摄的人脸图像后,预测准确率有一定的下降,这可能是由于拍照时的光线,角度等造成的.

3 ANN对人脸分类

人工神经网络(Artificial Neural Networks,简写为ANNs)也简称为神经网络(NNs)或称作连接模型(Connection Model),它是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型.这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的.

为了方便与SVM的结果作比对,ANN的训练集和测试集与SVM相同,并且不加入自己人脸.

3.1 ANN结果及与SVM分类比较

ANN分类结果:

ANN参数设定为:1个隐层,含200个神经元

学习率:1

dropout fraction:0.5

激活函数:sigmoid

L2正则:0.0001

epoch:200

batchsize:50

分类错误率:

即分类准确率(accuracy)为:93.5%

實验过程中可以发现,通过对神经网络多个参数的调节,准确率的变化是很复杂的,最终的93.5%的准确率应该还有上升的空间,参数还待进一步调整.

结论:关于本文可作为图像识别方面的大学硕士与本科毕业论文图像识别论文开题报告范文和职称论文论文写作参考文献下载。

基于Android和SURF算法的图像识别系统
摘要:图像识别技术是计算机视觉和图像处理领域里的重要研究课题之一,在军事及民用领域应用广泛。在目标检测算法中,基于特征的方法具有压缩信息量、执行。

时间序列数据模型人工智能算法
摘 要:时间序列数据模型是当前科研领域当中一种十分重要的构成部分。而在当前很多关于时间序列数据的预测、仿真、建模等方面的研究,在分析过程中大多是。

图像处理和图像识别新技术在智能交通中运用和实践
摘 要:社会的发展以及城市化进程的加快很大程度上促进了交通事业的发展,世界各个国家拥有的车辆数量大幅度上升,道路交通拥堵现象受到人们的广泛关注。。

基于前置摄像头图像识别技术ADAS在UBI保险业领域应用分析
摘 要:随着机器视觉技术的发展,基于摄像头图像解析技术在汽车驾驶安全辅助领域的应用逐渐占据重要地位。基于此类技术的附加应用不断外延,有的企业尝试。

论文大全