人工智能模型是这样构建的！探秘DL4J分布式训练法！科技頭條網

2018-06-22 16:40:19 安勝ANSCEN

人工智能的英文全名为Artificial Intelligence，我们通常简称为AI。广义上讲，AI可以指任何能够从事某种智能活动的计算机程序。

近年来深度学习在AI领域表现尤为突出，在这里我们可以简单的把AI理解为深度学习。

深度学习由深层神经网络算法构成，大量的神经元输入通过不断的迭代更新参数完成模型定型。深度学习的计算强度较高，对于规模非常大的数据集而言，速度很重要。主流的深度学习框架有TensorFlow、Caffe、Keras、Theano等，它们大多在单节点服务器通过GPU加速完成模型训练。随着大数据时代的来临，采用分布式计算极大提高了计算性能。因此将分布式计算与深度学习结合成为必然趋势。 DL4J就是基于这样的思想诞生的，是应用最广泛的JVM开源深度学习框架，它可以利用Spark在多台服务器多个GPU上开展分布式的深度学习模型训练，让模型跑得再快一点。

运用Deeplearning4J高效的训练一个完整神经网络模型包括：神经网络输入数据ETL、配置神经网络结构、设置参数监测可视化界面、模型训练、模型评估、模型保存与加载。本期“安仔课堂”，ISEC实验室的老师为大家详解如何运用DL4J构建AI模型。

一、数据ETL

神经网络所能识别的输入数据是向量，训练中涉及大量的矩阵运算。ND4J是神经网络训练进行必要的线性代数和微积分运算的科学计算库，让Java能够访问所需的原生库，能够使用多个CPU或GPU快速处理矩阵数据。DataVec是基于ND4J之上的一个工具包，通过它可以方便的对数据摄取、清理、联接、缩放、标准化和转换等处理，快速的将图像、视频、声音、文本和时间序列等原始数据转变为特征向量，输入神经网络。示例如下：

图1

二、配置网络结构

MultiLayerConfiguration是用来设定网络的层及其超参数。超参数是决定神经网络学习方式的变量，包括模型的权重更新次数、如何初始化权重、为节点添加哪些激活函数、使用哪些优化算法以及模型的学习速度，通过调用layer添加网络层，指定其在所有层中的先后位置、输入及输出节点数nIn和nOut。网络配置的示例如下：

图2

三、模型训练

DL4J能够依靠Spark来实现数据并行，以并行方式训练模型，对这些模型产生的参数进行迭代式平均化，得到一个中央模型。首先创建一个TrainingMaster实例，指定分布式训练的实际开展方式，然后用网络配置和TrainingMaster对象创建SparkDl4jMultiLayer实例，最后SparkDl4jMultiLayer实例调用fit方法传入数据进行模型训练。