池州学院瑞翼工坊“风格迁移”图像训练
发布时间:2018-10-18

 

数据科学与大数据技术专业在数据的分析挖掘方面,离不开机器学习等算法理论的支撑。随着互联网时代人工智能技术的蓬勃发展,数据中国“百校工程”项目院校池州学院曙光瑞翼大数据学院“瑞翼工坊”团队在导师的带领下,开展了基于tensorflow实现的“风格迁移”图像训练学习项目。


通过此次训练项目练习的过程着重点在于让同学们深入了解深度学习、多层卷积神经网络、VGG网络等算法的理论知识,在实际的动手操作中激发学生对算法的学习兴趣,培养学生对于大数据专业技能的自主探索能力。


54.jpg


“风格迁移”图像训练 理论介绍


24.jpg


风格迁移采用了深度学习中的多层卷积网络,网络的每一层都是由很多单个的人工神经元组成,通过每一个或者几个神经元的组合都可以被用来识别某个特征。多层卷积神经网络具有超强的图像特征提取能力,不同层提取的特征具有不同的含义。卷积神经网络当中最具优势的物体识别网络之一称为VGG网络。VGG是Oxford的Visual Geometry Group的组合提出的,它使用了3个3*3卷积核来代替7*7卷积核,使用2个3*3卷积核来代替5*5卷积核,从而保证在具有相同感知野的条件下,提升网络的深度,也在一定程度上提高了神经网络的训练效果。


此次瑞翼工坊开展“油画风格迁移”图像训练当中,主要运用了两套VGG网络:一套是面向图片主体内容,将生成图片的画面内容与原始图片进行比对训练;另一套是针对图片的风格特色,对训练过程中所生成的图片风格与设定的目标图片风格进行实时的动态比对。基于这两套VGG网络的同步运行,从而完成了对于图像风格迁移完整的训练过程以及效果呈现。


“瑞翼工坊”学生团队 实践笔记


由于“风格迁移”图像训练对电脑CPU的要求较高,在运行过程中耗费的时间也相对较长,所以,为了缩短迭代过程中的用时,在训练前先对原图片进行一个像素大小的处理,将图片的大小控制在合适的大小范围内。权衡了CPU用时和图片的质量,像素通常设置在500—800之间。


25.jpg


为了更好的调试通过调用tensorflow编写的python代码,“风格迁移”的各个参数放在配置文件中,在调试时,只需要对这个配置文件进行对应的修改,即可多次使用这个封装好的“风格迁移”训练代码。其中,对于迭代次数的设定直接影响了图像训练的时间长短,也决定着训练效果的优劣。


26.jpg


实践表明,迭代次数至少要在1500—2000之间为宜,对于一张像素在800左右的图片,所需时间大约为10小时。


“风格迁移”图像训练 团队成果展示


55.jpg


在经过了集中理论知识培训后,学生团队小组在老师的指导下进行了实践操作训练。依托于“瑞翼工坊”所开展的“教育大数据”的数据分析和可视化项目,学生团队小组在此次的“风格迁移”图像训练中,特地采集了具有池州学院特色的校园照片进行训练。


无论是从图片的筛选、像素的高低调整到基于Python运行环境下的tensorflow的安装与配置检测,以及后期VGG网络的程序代码在迭代次数上的设置与调试。每一项工作,团队小组成员都各司其职、有条不紊地进行,最终成功地将多幅校园风景的照片转化为具有“梵高”画作特色的油画风格图片。


56.jpg


此次基于深度学习算法实现的“风格迁移”图像训练项目取得了显著的学习成效。“瑞翼工坊”的多名同学亲身参与到具体的任务分配当中,通过动手操作加强了自己对于深度学习、tensorflow以及VGG网络等科学算法的深入理解,让数据科学与大数据技术专业的学生在课堂学习之余,掌握丰富多彩的专业实践技能。


作为数据中国“百校工程”产教融合创新项目的项目院校之一,池州学院项目部一直秉承着“产教融合”的教育教学理念,除了开展曙光瑞翼大数据学院的日常管理工作外,还在“瑞翼工坊”中组建多个项目化兴趣小组,让学生充分利用自己的课余时间,在学习大数据理论知识的同时,也能够了解到行业应用方面的科研创新成果。通过积极调动学生的学习热情,顺应科研创新精神的时代需求,掌握扎实的专业知识和实践技能,从而培养出具备解决复杂工程问题能力的创新型人才,服务于地方经济和促进社会发展。