用Keras生成面部Python实现

Python013

用Keras生成面部Python实现,第1张

可采用的机器学习数据集:

两者都包含人脸图像。我把这两个组合成一个文件夹。

最常听到的两种图像生成技术是生成对抗网络(GAN)和LSTM网络。

LSTM训练的时候速度非常慢,GAN训练会快得多。实际结果花不到半小时,模糊的面孔就会开始出现。随着时间的推移,图像会更加逼真。

有许多GAN变种。我使用的一种称为深度卷积神经网络(DCGAN)。DCGAN的优点在于它使用了卷积层。卷积神经网络目前是存在的最佳图像分类算法。

生成对抗网络是由一位名叫Ian Goodfellow的研究员发明的,并于2014年引入了GAN。

GAN非常强大。利用正确的数据,网络架构和超参数,您可以生成非常逼真的图像。

将来,一些高级版本的GAN或其他一些内容生成算法可能会让我们做一些很酷的事情:

但GAN是如何运作的呢?

GAN实际上不是一个神经网络,而是两个。其中之一是Generator。它将随机值作为输入并生成图像。

第二是discriminator。它试图确定图像是假的还是真的。

训练GAN就像一场竞赛。Generator试图在愚弄discriminator时变得尽可能好。discriminator试图尽可能地将假图像与真实图像分开。

这将迫使他们两个都改善。理想情况下,这将在某种程度上导致以下情况:

在现实中,您需要确保一切正常(数据、体系结构、超参数)。GAN对超参数值的微小变化非常敏感。

导入库

第一步是导入所有需要的Python库。

FaceGenerator类

这段Python代码初始化了训练所需的一些重要变量。

将训练数据加载到模型中

此函数将文件夹的名称作为输入,并将该文件夹中的所有图像作为numpy数组返回。所有图像的大小都调整为__init__函数中指定的大小。

Shape=(图像的数量,宽度,高度,通道)。

神经网络

这两个函数定义了generator和discriminator。

神经网络模型训练

对于每个epoch:

训练结束后:

此函数可用于在训练后生成新图像。

训练GAN很难,当你成功时,这种感觉会非常有益。

此Python代码可以轻松用于其他图像数据集。请记住,您可能需要编辑网络体系结构和参数,具体取决于您尝试生成的图像。

Windows 8.1上配置OpenCV

入门的时候配置环境总是一个非常麻烦的事情,在Windows上配置OpenCV更是如此。

既然写了这个推广的科普教程,总不能让读者卡在环境配置上吧。

下面用到的文件都可以在 这里 (提取码:b6ec)下载,但是注意,目前OpenCV仅支持Python2.7。

将cv2加入site-packages

将下载下来的 cv2.pyd 文件放入Python安装的文件夹下的 Libsite-packages 目录。

就我的电脑而言,这个目录就是 C:Python27Libsite-packages 。

记得不要直接使用pip安装,将文件拖过去即可。

安装numpy组件

在命令行下进入到下载下来的文件所在的目录(按住Shift右键有在该目录打开命令行的选项)

键入命令:

pipinstallnumpy-1.11.0rc2-cp27-cp27m-win32.whl

如果你的系统或者Python不适配,可以在 这里 下载别的轮子。

测试OpenCV安装

在命令行键入命令:

python -c "import cv2"

如果没有出现错误提示,那么cv2就已经安装好了。

OpenCV的人脸检测应用

人脸检测应用,简而言之就是一个在照片里找到人脸,然后用方框框起来的过程(我们的相机经常做这件事情)

那么具体而言就是这样一个过程:

获取摄像头的图片

在图片中检测到人脸的区域

在人脸的区域周围绘制方框

获取摄像头的图片

这里简单的讲解一下OpenCV的基本操作。

以下操作是打开摄像头的基本操作:

#coding=utf8

importcv2

# 一般笔记本的默认摄像头都是0

capInput = cv2.VideoCapture(0)

# 我们可以用这条命令检测摄像头是否可以读取数据

if not capInput.isOpened(): print('Capture failed because of camera')

那么怎么从摄像头读取数据呢?

# 接上段程序

# 现在摄像头已经打开了,我们可以使用这条命令读取图像

# img就是我们读取到的图像,就和我们使用open('pic.jpg', 'rb').read()读取到的数据是一样的

ret, img = capInput.read()

# 你可以使用open的方式存储,也可以使用cv2提供的方式存储

cv2.imwrite('pic.jpg', img)

# 同样,你可以使用open的方式读取,也可以使用cv2提供的方式读取

img = cv2.imread('pic.jpg')

为了方便显示图片,cv2也提供了显示图片的方法:

# 接上段程序

# 定义一个窗口,当然也可以不定义

imgWindowName = 'ImageCaptured'

imgWindow = cv2.namedWindow(imgWindowName, cv2.WINDOW_NORMAL)

# 在窗口中显示图片

cv2.imshow(imgWindowName, img)

当然在完成所有操作以后需要把摄像头和窗口都做一个释放:

# 接上段程序

# 释放摄像头

capInput.release()

# 释放所有窗口

cv2.destroyAllWindows()

在图片中检测到人脸的区域

OpenCV给我们提供了已经训练好的人脸的xml模板,我们只需要载入然后比对即可。

# 接上段程序

# 载入xml模板

faceCascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')

# 将图形存储的方式进行转换

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# 使用模板匹配图形

faces = faceCascade.detectMultiScale(gray, 1.3, 5)

print(faces)

在人脸的区域周围绘制方框

在上一个步骤中,faces中的四个量分别为左上角的横坐标、纵坐标、宽度、长度。

所以我们根据这四个量很容易的就可以绘制出方框。

# 接上段程序

# 函数的参数分别为:图像,左上角坐标,右下角坐标,颜色,宽度

img = cv2.rectangle(img, (x, y), (x + w, y + h), (255, 0, 0), 2)

成果

根据上面讲述的内容,我们现在已经可以完成一个简单的人脸辨认了:

#coding=utf8

importcv2

print('Press Esc to exit')

faceCascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')

imgWindow = cv2.namedWindow('FaceDetect', cv2.WINDOW_NORMAL)

defdetect_face():

capInput = cv2.VideoCapture(0)

# 避免处理时间过长造成画面卡顿

nextCaptureTime = time.time()

faces = []

if not capInput.isOpened(): print('Capture failed because of camera')

while 1:

ret, img = capInput.read()

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

if nextCaptureTime

使用Face++完成人脸辨识

第一次认识Face++还是因为支付宝的人脸支付,响应速度还是非常让人满意的。

现在只需要免费注册一个账号然后新建一个应用就可以使用了,非常方便。

他的官方网址是 这个 ,注册好之后在 这里 的我的应用中创建应用即可。

创建好应用之后你会获得API Key与API Secret。

Face++的API调用逻辑简单来说是这样的:

上传图片获取读取到的人的face_id

创建Person,获取person_id(Person中的图片可以增加、删除)

比较两个face_id,判断是否是一个人

比较face_id与person_id,判断是否是一个人

上传图片获取face_id

在将图片通过post方法上传到特定的地址后将返回一个json的值。

如果api_key, api_secret没有问题,且在上传的图片中有识别到人脸,那么会存储在json的face键值下。

#coding=utf8

importrequests

# 这里填写你的应用的API Key与API Secret

API_KEY = ''

API_SECRET = ''

# 目前的API网址是这个,你可以在API文档里找到这些

BASE_URL = 'http://apicn.faceplusplus.com/v2'

# 使用Requests上传图片

url = '%s/detection/detect?api_key=%s

创建Person

这个操作没有什么可以讲的内容,可以对照这段程序和官方的API介绍。

官方的API介绍可以见 这里 ,相信看完这一段程序以后你就可以自己完成其余的API了。

# 上接上一段程序

# 读取face_id

if not facesis None: faceIdList = [face['face_id'] for facein faces]

# 使用Requests创建Person

url = '%s/person/create'%BASE_URL

params = {

'api_key': API_KEY,

'api_secret': API_SECRET,

'person_name': 'LittleCoder',

'face_id': ','.join(faceIdList), }

r = requests.get(url, params = params)

# 获取person_id

print r.json.()['person_id']

进度确认

到目前为止,你应该已经可以就给定的两张图片比对是否是同一个人了。

那么让我们来试着写一下这个程序吧,两张图片分别为’pic1.jpg’, ‘pic2.jpg’好了。

下面我给出了我的代码:

defupload_img(fileDir, oneface = True):

url = '%s/detection/detect?api_key=%s

成品

到此,所有的知识介绍都结束了,相比大致如何完成这个项目各位读者也已经有想法了吧。

可以使用OpenCV,OpenCV的人脸检测功能在一般场合还是不错的。而ubuntu正好提供了python-opencv这个包,用它可以方便地实现人脸检测的代码。

写代码之前应该先安装python-opencv:

#!/usr/bin/python

# -*- coding: UTF-8 -*-

 

# face_detect.py

 

# Face Detection using OpenCV. Based on sample code from:

# http://python.pastebin.com/m76db1d6b

 

# Usage: python face_detect.py <image_file>

 

import sys, os

from opencv.cv import *

from opencv.highgui import *

from PIL import Image, ImageDraw

from math import sqrt

 

def detectObjects(image):

    """Converts an image to grayscale and prints the locations of any faces found"""

    grayscale = cvCreateImage(cvSize(image.width, image.height), 8, 1)

    cvCvtColor(image, grayscale, CV_BGR2GRAY)

 

    storage = cvCreateMemStorage(0)

    cvClearMemStorage(storage)

    cvEqualizeHist(grayscale, grayscale)

 

    cascade = cvLoadHaarClassifierCascade(

        '/usr/share/opencv/haarcascades/haarcascade_frontalface_default.xml',

        cvSize(1,1))

    faces = cvHaarDetectObjects(grayscale, cascade, storage, 1.1, 2,

        CV_HAAR_DO_CANNY_PRUNING, cvSize(20,20))

 

    result = []

    for f in faces:

        result.append((f.x, f.y, f.x+f.width, f.y+f.height))

 

    return result

 

def grayscale(r, g, b):

    return int(r * .3 + g * .59 + b * .11)

 

def process(infile, outfile):

 

    image = cvLoadImage(infile)

    if image:

        faces = detectObjects(image)

 

    im = Image.open(infile)

 

    if faces:

        draw = ImageDraw.Draw(im)

        for f in faces:

            draw.rectangle(f, outline=(255, 0, 255))

 

        im.save(outfile, "JPEG", quality=100)

    else:

        print "Error: cannot detect faces on %s" % infile

 

if __name__ == "__main__":

    process('input.jpg', 'output.jpg')