TensorFlow做Sparse Machine Learning

2020-02-05 21:13:29 小石頭的碼瘋窩

TensorFlow Sparse现状及背景

在机器学习这块，Estimator本身的封装能够适应比较多的Dense的场景，而对于Sparse的场景无论是官方demo还是一些业界的大牛都分享的比较少，在很多场景，比如libfm、libffm、Xgboost都支持直接libsvm, field-libsvm的格式中读入数据，训练模型没有原始的实现，没法直接调包使用，得自己在TensorFlow的框架上构造，所幸Estimator本身的框架支持自定义的input_fn，和自定义的model_fn，笔者过去一段时间工作之余研究了下，并实现了基于libsvm的Sparse Logistic Regression和Sparse Factorization Machine的一套比较高效的流程，打通了从数据读取、模型训练、到TensorFlow Serving的部署。

TensorFlow中的sparse_tensor实现

我们读下sparse_tensor的源码，sparse_tensor.py, 很容易看出来sparse_tensor在TensorFlow中是一个高层的封装，主要包括indices, values, shape三个部分，这里很有意思，后面我实践中遇到一个大坑，可以通过这里解决，这里我先卖个关子；

sparse representation的好处

常见的稀疏矩阵的表示有csc，csr，在很多矩阵计算的库当中有使用，比如python中大家使用比较多的scipy，TensorFlow底层计算模块eigen，都是用类似的方式来表示稀疏矩阵，举个例子比如某个商户有500万个商品，而用户产生行为的商品必定远远小于500万，如果都是用dense表示，那么保存单个用户行为的商品数据需要500万个指，而采用稀疏数据表示则保存所需要的空间只需要和你才产生行为的商品数量有关，如下图100个用户的在500w上的行为数据如果用dense表示需要大概3G的空间；

需要保存100*5000000个int，而使用csc_matrix，

<code>row = np.array(range(100))col = np.zeros(100)data = np.ones(100)csc_matrix((data, (row, col)), shape=(100, 5000000))/<code>

我们只需要保存3*NNZ（这里就是100）个int，然后加上一个shape信息，空间占用大大减少；在内存中，我们通常使用csc来表示Sparse Matrix，而在样本保存中，通常使用libsvm格式来保存

以空格为sep，label为1，后续为feature的表示，格式为feature_id: feature_val, 在TensorFlow中我们可以使用TextlineDataset自定义input_fn来解析文本，其他很多相关的技术文章都有提及，但是作为一个程序员总感觉不想走已经走过的路，而且TF官宣tfrecord的读写效率高，考虑到效率问题，我这里使用TFRecordDataset来做数据的读取；

LibSVM To TFRecord

解析LibSVM feature_ids, 和feature_vals，很简单没有啥好说的，直接贴代码，想要深入了解的，可以去看看TF的example.proto, feature.proto, 就大概能了解Example和Feature的逻辑了，不用闷闷地只知道别人是这样写的。

<code>import codecsimport tensorflow as tfimport logginglogger = logging.getLogger("TFRecSYS")sh = logging.StreamHandler(stream=None)logger.setLevel(logging.DEBUG)fmt = "%(asctime)-15s %(levelname)s %(filename)s %(lineno)d %(process)d %(message)s"datefmt = "%a %d %b %Y %H:%M:%S"formatter = logging.Formatter(fmt, datefmt)sh.setFormatter(formatter)logger.addHandler(sh)class LibSVM2TFRecord(object):    def __init__(self, libsvm_filenames, tfrecord_filename, info_interval=10000, tfrecord_large_line_num = 10000000):        self.libsvm_filenames = libsvm_filenames        self.tfrecord_filename = tfrecord_filename        self.info_interval = info_interval        self.tfrecord_large_line_num = tfrecord_large_line_num    def set_transform_files(self, libsvm_filenames, tfrecord_filename):        self.libsvm_filenames = libsvm_filenames        self.tfrecord_filename = tfrecord_filename    def fit(self):        logger.info(self.libsvm_filenames)        writer = tf.python_io.TFRecordWriter(self.tfrecord_filename+".tfrecord")        tfrecord_num = 1        for libsvm_filename in self.libsvm_filenames:            logger.info("Begin to process {0}".format(libsvm_filename))            with codecs.open(libsvm_filename, mode='r', encoding='utf-8') as fread:                line = fread.readline()                line_num = 0                while line:                    line = fread.readline()                    line_num += 1                    if line_num % self.info_interval == 0:                        logger.info("Processing the {0} line sample".format(line_num))                    if line_num % self.tfrecord_large_line_num == 0:                        writer.close()                        tfrecord_file_component = self.tfrecord_filename.split(".")                        self.tfrecord_filename = self.tfrecord_filename.split("_")[0]+"_%05d.tfrecord"%tfrecord_num                        writer = tf.python_io.TFRecordWriter(self.tfrecord_filename)                        tfrecord_num += 1                        logger.info("Change the tfrecord file to {0}".format(self.tfrecord_filename))                    feature_ids = []                    vals = []                    line_components = line.strip().split(" ")                    try:                        label = float(line_components[0])                        features = line_components[1:]                    except IndexError:                        logger.info("Index Error, line: {0}".format(line))                        continue                    for feature in features:                        feature_components = feature.split(":")                        try:                            feature_id = int(feature_components[0])                            val = float(feature_components[1])                                                except IndexError:                            logger.info("Index Error: , feature_components: {0}",format(feature))                            continue                        except ValueError:                            logger.info("Value Error: feature_components[0]: {0}".format(feature_components[0]) )                        feature_ids.append(feature_id)                        vals.append(val)                    tfrecord_feature = {                        "label" : tf.train.Feature(float_list=tf.train.FloatList(value=[label])),                        "feature_ids": tf.train.Feature(int64_list=tf.train.Int64List(value=feature_ids)),                        "feature_vals": tf.train.Feature(float_list=tf.train.FloatList(value=vals))                    }                    example = tf.train.Example(features=tf.train.Features(feature=tfrecord_feature))                    writer.write(example.SerializeToString())                writer.close()            logger.info("libsvm: {0} transform to tfrecord: {1} successfully".format(libsvm_filename, self.tfrecord_filename))if __name__ == "__main__":    libsvm_to_tfrecord = LibSVM2TFRecord(["../../data/kdd2010/kdda.libsvm"], "../../data/kdd2010/kdda")    libsvm_to_tfrecord.fit()/<code>

转成tfrecord文件之后，通常比原始的文件要大一些，具体的格式的说明参考下https://cloud.tencent.com/developer/article/1088751 这篇文章比较详细地介绍了转tfrecord和解析tfrecord的用法，另外关于shuffle的buff size的问题，个人感觉问题并不大，在推荐场景下，数据条数多，其实内存消耗也不大，只是在运行前会有比较长载入解析的时间，另外一个问题是，大家应该都会提问的，为啥tfrecord会比自己写input_fn去接下文本文件最后来的快呢？这里我只能浅层意义上去猜测，这部分代码没有拎出来读过，所以不做回复哈，有读过源码，了解比较深的同学可以解释下

TFRecord的解析

个人读了一些解析tfrecord的几个格式的源码，现在还有点乱，大概现在貌似代码中有支持VarLenFeature, SparseFeature, FixedLenFeature, FixedLenSequenceFeature这几种，但是几个api的说明里面貌似对sparsefeature的支持有点磨砺两可，所以选择使用VarLenFeature上面的方式，不知道这里SparseFeature是怎么玩的，有时间还得仔细看看。

然后，简单写个读取的demo：

大家可以动手跑跑看，仔细研究的话会发现一些比较有意思的东西，比如VarLenFeature出来的是一个SparseTensor：

这里我最开始是打算每次sess.run，然后转换为numpy.array, 然后再喂feed_dict到模型，但是觉得这样会很麻烦，速度会是瓶颈，如果能过直接使用这里的SparseTensor去做模型的计算，直接从tfrecord解析，应该会比较好，但是又会遇到另一个问题，后面再详细说明；这里简单提下，我这边就是直接拿到两个SparseTensor，直接去到模型，所以模型的设计会和常规的算法会有不同；

Sparse Model的高效实现

<code>import tensorflow as tfclass SparseFactorizationMachine(object):    def __init__(self, model_name="sparse_fm"):        self.model_name = model_name    def build(self, features, labels, mode, params):        print("export features {0}".format(features))        print(mode)        if mode == tf.estimator.ModeKeys.PREDICT:            sp_indexes = tf.SparseTensor(indices=features['DeserializeSparse:0'],                         values=features['DeserializeSparse:1'],                         dense_shape=features['DeserializeSparse:2'])            sp_vals = tf.SparseTensor(indices=features['DeserializeSparse_1:0'],                                      values=features['DeserializeSparse_1:1'],                                      dense_shape=features['DeserializeSparse_1:2'])        if mode == tf.estimator.ModeKeys.TRAIN or mode == tf.estimator.ModeKeys.EVAL:            sp_indexes = features['feature_ids']            sp_vals = features['feature_vals']            print("sp: {0}, {1}".format(sp_indexes, sp_vals))        batch_size = params["batch_size"]        feature_max_num = params["feature_max_num"]        optimizer_type = params["optimizer_type"]        factor_vec_size = params["factor_size"]        bias = tf.get_variable(name="b", shape=[1], initializer=tf.glorot_normal_initializer())        w_first_order = tf.get_variable(name='w_first_order', shape=[feature_max_num, 1], initializer=tf.glorot_normal_initializer())        linear_part = tf.nn.embedding_lookup_sparse(w_first_order, sp_indexes, sp_vals, combiner="sum") + bias        w_second_order = tf.get_variable(name='w_second_order', shape=[feature_max_num, factor_vec_size], initializer=tf.glorot_normal_initializer())        embedding = tf.nn.embedding_lookup_sparse(w_second_order, sp_indexes, sp_vals, combiner="sum")        embedding_square = tf.nn.embedding_lookup_sparse(tf.square(w_second_order), sp_indexes, tf.square(sp_vals), combiner="sum")        sum_square = tf.square(embedding)        second_part = 0.5*tf.reduce_sum(tf.subtract(sum_square, embedding_square), 1)        y_hat = linear_part + tf.expand_dims(second_part, -1)        predictions = tf.sigmoid(y_hat)        print "y_hat: {0}, second_part: {1}, linear_part: {2}".format(y_hat, second_part, linear_part)        pred = {"prob": predictions}        export_outputs = {            tf.saved_model.signature_constants.DEFAULT_SERVING_SIGNATURE_DEF_KEY: tf.estimator.export.PredictOutput(predictions)        }        if mode == tf.estimator.ModeKeys.PREDICT:            return tf.estimator.EstimatorSpec(                mode=mode,                 predictions=predictions,                export_outputs=export_outputs)        loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(labels=labels, logits=tf.squeeze(y_hat)))        if optimizer_type == "sgd":            opt = tf.train.GradientDescentOptimizer(learning_rate=params['learning_rate'])        elif optimizer_type == "ftrl":            opt = tf.train.FtrlOptimizer(learning_rate=params['learning_rate'],)        elif optimizer_type == "adam":            opt = tf.train.AdamOptimizer(learning_rate=params['learning_rate'])        elif optimizer_type == "momentum":            opt = tf.train.MomentumOptimizer(learning_rate=params['learning_rate'], momentum=params['momentum'])        train_step = opt.minimize(loss,global_step=tf.train.get_global_step())        eval_metric_ops = {            "auc" : tf.metrics.auc(labels, predictions)        }        if mode == tf.estimator.ModeKeys.TRAIN:            return tf.estimator.EstimatorSpec(mode=mode, predictions=predictions, loss=loss, train_op=train_step)        if mode == tf.estimator.ModeKeys.EVAL:            return tf.estimator.EstimatorSpec(mode=mode, predictions=predictions, loss=loss, eval_metric_ops=eval_metric_ops)/<code>

这里讲个Factorization Machine的实现，会比Sparse Logistic Regression的实现要稍微复杂一点，首先，模型的算法实现，比较简单，随便搜下应该大概都知道Factorization Machine的算法原理，fm主要包括两个部分，一个是LogisticRegression的部分，包括bias和一阶特征，另外一部分是把每一维特征表示为一个指定大小的vector，去从样本中去学习对训练有效的交叉信息：

<code>bias = tf.get_variable(name="b", shape=[1], initializer=tf.glorot_normal_initializer())w_first_order = tf.get_variable(name='w_first_order', shape=[feature_max_num, 1], initializer=tf.glorot_normal_initializer())linear_part = tf.nn.embedding_lookup_sparse(w_first_order, sp_indexes, sp_vals, combiner="sum") + biasw_second_order = tf.get_variable(name='w_second_order', shape=[feature_max_num, factor_vec_size], initializer=tf.glorot_normal_initializer())embedding = tf.nn.embedding_lookup_sparse(w_second_order, sp_indexes, sp_vals, combiner="sum")embedding_square = tf.nn.embedding_lookup_sparse(tf.square(w_second_order), sp_indexes, tf.square(sp_vals), combiner="sum")sum_square = tf.square(embedding)second_part = 0.5*tf.reduce_sum(tf.subtract(sum_square, embedding_square), 1)y_hat = linear_part + tf.expand_dims(second_part, -1)predictions = tf.sigmoid(y_hat)/<code>

这里和普通的fm唯一不同的是，我使用tf.nn.embedding_lookup_sparse 来计算WX，在海量特征维度的前提下，做全部的WX相乘是耗时，且没有必要的，我们只需要取出其中有值的部分来计算即可，比如kdd2010，20216831的特征，但是计算WX其实就会考验系统的瓶颈，但是如果经过一个简单的tf.nn.embedding_lookup_sparse来替代WX，就会先lookup feature_id，对应的embedding的表示，然后乘以相应的weight，最后在每一个样本上进行一个combiner(sum)的操作，其实就是等同于WX，tf.nn.embedding_lookup_sparse(w_first_order, sp_indexes, sp_vals, combiner="sum"), 而在系统方面，由于计算只与NNZ(非零数)有关，性能则完全没有任何压力。二阶的部分可以降低时间复杂度，相信应该了解FM的都知道，和的平方减去平方的和：

<code>embedding_square = tf.nn.embedding_lookup_sparse(tf.square(w_second_order), sp_indexes, tf.square(sp_vals), combiner="sum")sum_square = tf.square(embedding)second_part = 0.5*tf.reduce_sum(tf.subtract(sum_square, embedding_square), 1)/<code>

由上面的实现，我们只需要把特征的sp_indexes, sp_val传出来就可以了，但是因为这两者都是SparseTensor，笔者开始想到的不是上述的实现，而是使用tf.sparse.placeholder，然后喂一个feed_dict，对应SparseTensorValue就可以了，确实是可以的，模型训练没有问题，模型export出来也没有问题(其实是有问题的，我这里重写了Estimator的build_raw_serving_input_receiver_fn使其支持SparseTensor)，但是在部署好TensorFlow Serving之后，我发现在客户端SparseTensorValue貌似不能组成一个TensorProto，tf.make_tensor_proto主要是把请求的值放进一个TensorProto，而TensorProto, https://github.com/tensorflow/tensorflow/blob/master/tensorflow/core/framework/tensor.proto，貌似不能直接支持SparseTensorValue去放进TensorProto，所以就无法在部署好TensorFlow Serving后去请求（部署会在后文详细描述，这里我也想过能不能改他们的代码，但是貌似涉及太底层的东西，有点hold不住），但是也是有办法的，前面文章提到SparseTensor，在TensorFlow中是高阶的api，他其实就是由3个Tensor组成，是否可以把SparseTensor本身的3个Tensor暴露出来，然后请求的时候去组这三个Tensor就可以啦，所以只需要找到TFRecord接下出来的sp_indexes, sp_vals就可以了

从这里很容易看到sp_indexes, sp_vals的TensorName，然后用占位符替代，然后用这些去组成sp_indexes，sp_vals

说明下，这里我使用的kdd2010的数据，特征维度是20216831，样本数量8407752,我是用我15年的macbook pro跑的，使用的sgd，收敛还是比较明显的，大家有兴趣可以试试，按以往经验使用其他优化器如adam，ftrl会在这种特征规模比较大的条件下有比较好的提升，我这里就走通整个流程，另外机器也不忍心折腾；到了这里，就训练出来了一个可用的Sparse FM的模型，接下来要导出模型，这里的导出模型是导出一个暴露了placeholder的模型，可以在TensorFlow Serving被载入，被请求，不是单纯的ckpt；

模型部署

<code>feature_spec = {            'DeserializeSparse:0': tf.placeholder(dtype=tf.int64, name='feature_ids/indices'),            'DeserializeSparse:1': tf.placeholder(dtype=tf.int64, name='feature_ids/values'),            'DeserializeSparse:2': tf.placeholder(dtype=tf.int64, name='feaurte_ids/shape'),            'DeserializeSparse_1:0': tf.placeholder(dtype=tf.int64, name='feature_vals/indices'),            'DeserializeSparse_1:1': tf.placeholder(dtype=tf.float32, name='feature_vals/values'),            'DeserializeSparse_1:2': tf.placeholder(dtype=tf.int64, name='feature_vals/shape')        }serving_input_receiver_fn = tf.estimator.export.build_raw_serving_input_receiver_fn(feature_spec, is_sparse=False)sparse_fm_model.export_savedmodel(servable_model_dir, serving_input_receiver_fn, as_text=True)/<code>

和前面构造模型的时候对应，只需要把DeserializeSparse的部分暴露出来即可

这里会以时间戳创建模型，保存成功后temp-1543117151会变为1543117151，接下来，就是要启动TensorFlow Serving载入模型：docker run -p 8500:8500 --mount type=bind,source=/Users/burness/work/tencent/TFRecSYS/TFRecSYS/runner/save_model,target=/models/ -e MODEL_NAME=sparse_fm -t tensorflow/serving，使用官方提供的docker镜像来部署环境很方便。

会先载入新的模型，然后unload旧模型，从命令行log信息可以看出gRPC接口为8500剩下的，就下一个client，去请求

<code>import grpcimport syssys.path.insert(0, "./")from tensorflow_serving.apis import predict_pb2from tensorflow_serving.apis import prediction_service_pb2_grpcimport tensorflow as tffrom tensorflow.python.framework import dtypesimport timeimport numpy as npfrom sklearn import metricsdef get_sp_component(file_name):    with open(file_name, "r") as fread:        for line in fread.readlines():            fea_ids = []            fea_vals = []            line_components = line.strip().split(" ")            label = float(line_components[0])            for part in line_components[1:]:                part_components = part.split(":")                fea_ids.append(int(part_components[0]))                fea_vals.append(float(part_components[1]))            yield (label, fea_ids, fea_vals)def batch2sparse_component(fea_ids, fea_vals):    feature_id_indices = []    feature_id_values = []    feature_vals_indices = []    feature_vals_values = []    for index, id in enumerate(fea_ids):        feature_id_values += id        for i in range(len(id)):            feature_id_indices.append([index, i])    for index, val in enumerate(fea_vals):        feature_vals_values +=val        for i in range(len(val)):            feature_vals_indices.append([index, i])    return np.array(feature_id_indices, dtype=np.int64), np.array(feature_id_values, dtype=np.int64), np.array(feature_vals_indices, dtype=np.int64), np.array(feature_vals_values, dtype=np.float32)    if __name__ == '__main__':    start_time = time.time()    channel = grpc.insecure_channel("127.0.0.1:8500")    stub = prediction_service_pb2_grpc.PredictionServiceStub(channel)    request = predict_pb2.PredictRequest()    request.model_spec.name = "sparse_fm"    record_genertor = get_sp_component("../../data/kdd2010/kdda_t.libsvm")    batch_size = 1000    predictions = np.array([])    labels = []    while True:        try:            batch_label = []            batch_fea_ids = []            batch_fea_vals = []            max_fea_size = 0            for i in range(batch_size):                label, fea_ids, fea_vals = next(record_genertor)                batch_label.append(label)                batch_fea_ids.append(fea_ids)                batch_fea_vals.append(fea_vals)                if len(batch_fea_ids) > max_fea_size:                    max_fea_size = len(batch_fea_ids)            shape = np.array([batch_size, max_fea_size],dtype=np.int64 )            batch_feature_id_indices, batch_feature_id_values,batch_feature_val_indices, batch_feature_val_values  = batch2sparse_component(batch_fea_ids, batch_fea_vals)            request.inputs["DeserializeSparse:0"].CopyFrom(tf.contrib.util.make_tensor_proto(batch_feature_id_indices))            request.inputs["DeserializeSparse:1"].CopyFrom(tf.contrib.util.make_tensor_proto(batch_feature_id_values))            request.inputs["DeserializeSparse:2"].CopyFrom(tf.contrib.util.make_tensor_proto(shape))            request.inputs["DeserializeSparse_1:0"].CopyFrom(tf.contrib.util.make_tensor_proto(batch_feature_val_indices))            request.inputs["DeserializeSparse_1:1"].CopyFrom(tf.contrib.util.make_tensor_proto(batch_feature_val_values))            request.inputs["DeserializeSparse_1:2"].CopyFrom(tf.contrib.util.make_tensor_proto(shape))            response = stub.Predict(request, 10.0)            results = {}            for key in response.outputs:                tensor_proto = response.outputs[key]                nd_array = tf.contrib.util.make_ndarray(tensor_proto)                results[key] = nd_array            print("cost %ss to predict: " % (time.time() - start_time))            predictions = np.append(predictions, results['output'])            labels += batch_label            print(len(labels), len(predictions))        except StopIteration:            break    fpr, tpr, thresholds = metrics.roc_curve(labels, predictions)    print("auc: {0}",format(metrics.auc(fpr, tpr)))/<code>

开始用一个样本做测试打出pred的值，成功后，我将所有的测试样本去组batch去请求，然后计算下auc，对比下eval的时候的auc,差不多，那说明整体流程没啥问题，另外每1000个样本耗时大概270多ms，整体感觉还可以。

后续

基本到这里就差不多了，现在已经支持单个field的Logistic Regression和Factorization Machine，扩展性比较强，只需要重写算法的类，剩余的大部分都可以复用，接下来计划是支持multi-field的数据接入，会实现更高效的Sparse DeepFM, FNN, DIN, DIEN, 其实已经差不多了，现在正在弄可用性，希望能够通过配置文件直接串起整个流程;另外分布式的也会支持，这个比较简单，Estimator本身就ok，只是资源比较少，有机器的时候我试试，虽然我觉得TensorFlow本身的分布式做的不太让人理解，但是能够简单复用还是比较厉害的;更高维度的支持之后也可以尝试

分享到:

閱讀更多 小石頭的碼瘋窩 的文章

關鍵字: Python 机器学习程序员

TensorFlow 2.0简介

TensorFlow 2.0姿态估计快速入门

为什么Linux系统没有类似Windows上的还原精灵和影子系统？

[tensorflow]如何处理样本不均衡？

Tensorflow 学习笔记（一）TensorFlow入门

「tensorflow」浅谈什么是张量tensor

03.06 「tensorflow」浅谈什么是张量tensor

TensorFlow做Sparse Machine Learning

MacOSX 安装 TensorFlow

01.21 MacOSX 安装 TensorFlow

使用 TensorFlow 来实现一个简单的验证码识别过程

基于 TensorFlow.js 的迁移学习图像分类器

在浏览器中进行深度学习：TensorFlow.js (五）构建一个神经网络

在浏览器中进行深度学习：TensorFlow.js (二）线性回归

TensorFlow v2.0实现逻辑斯谛回归

10.23 TensorFlow v2.0的基本张量操作

使用 TensorFlow 识别简单图像验证码

虚拟机管理器（Virtual Machine Manager）简介

TensorFlow——实现简单的线性回归

人工智能 TensorFlow 必知必会编程概念整理

Machine learning

机器学习中的DCGAN-Tensorflow：用于更稳定的训练

谷歌开源机器学习数据集，可在 TensorFlow 直接调用

Effective TensorFlow Chapter7——理解执行顺序和控制依赖

02.04 TensorFlow Probability 概率编程入门级实操教程

要替代 TensorFlow？谷歌开源机器学习库 JAX

TensorFlow 官方简化版！谷歌开源机器学习库 JAX

TensorFlow 官方简化版，谷歌开源机器学习库 JAX

「译」Effective TensorFlow Chapter1——TensorFlow 基础

Swift for Tensorflow

Docker Machine 详解

TensorFlow Lite极简入门：构建移动应用程序进行图像分类

令人困惑的 TensorFlow！(II)

使用 tf.Transform 对 TensorFlow 管道模式进行预处理

09.09 AI实战圣经《Machine Learning Yearning》第1-52章中英文版分享

tensorflow：多层LSTM代码分析

TensorFlow——多层 LSTM 通俗易懂版

ELK之X-PACK Machine Learning功能应用方法详解

TensorFlow进阶教程（二）:TensorFlow.js 入门指南

从零开始搭建深度学习服务器：TensorFlow + PyTorch + Torch

Tensorflow Graph概述

TensorFlow-实践方法

06.18 Windows10下Keras,Tensorflow,CNTK ,MXNet和PyTorch的GPU

Ubuntu 上安装 TensorFlow

05.16 「关键点」TensorFlow 可以这样区分类与操作？「附例子」

05.08 通过 TensorFlow 构建您的第一个深度学习分类器（以狗为例）！

有限状态机（Finite-state machine, FSM）的C语言实现

04.27 有限状态机（Finite-state machine, FSM）的C语言实现

人工智能开发（一）环境搭建-基于ubuntu16 Python3 tensorflow

第二章 IoC容器和Bean配置

bean是一个对象，它是由Spring

运算里不得不说的python模块—math

Help

Devops度量--DevOps 现状快速检查表

今天主要分享一个DevOps

SOP是什么（解读）

SOP不是单个的，是一个体系，虽然我们可以单独地定义每一个SOP，但真正从企业管理来看，SOP不可能只是单个的，必然是一个整体和体系，也是企业不可或缺的。

还不知道交换机上如何配置DHCP，赶紧过来围观吧，一分钟包你学会

随着终端设备的越来越多，人工干预配置IP地址，不仅工作效率低，而且，还很容易导致IP冲突，影响正常的网络访问。到此已经完成了，DHCP服务的配置了，我们可以在终端验证。

还在手动配置IP地址吗？太Low了，一分钟教会您如何配置DHCP

Python爬虫自学笔记：分析头条文章网页源文件

这两天分析了一下头条文章网页的源文件，现在将分析的结果分享给大家。首先以一篇文章为例，其网址如下：https://www.toutiao.com/i6822245428176617998/如上图网页所示，文章中包含文字和图片。

DNS侦查工具

我们只需要打开浏览器输入例如:www.baidu.com就可以解析到该网站.为了便于记住不需要输入长长的IP地址去访问这就是DNS域名解析.关于域名域名的层次划分用点来分割这时DNS把相对应的域名解析成IP地址高的在右边.例如:www. NS简介访问某网站的时候最低在左边

国人开源的异步 Python ORM：GINO

程序测评：Create React App 3.3中有哪些酷炫新功能？

Create

“明学”的魅力？我只要我觉得：驾驭终端，提高生产力

最后一个要介绍的命令是

（必收藏系列）Linux面试题——命令集

关注，后台私信【Linux】分享Linux入门到进阶电子书、Linux入门到精通视频教程（免费）。文件管理命令cat

五分钟学会如何在 IPFS 上部署网站

原文标题:五分钟学会如何在

「正点原子NANO STM32F103开发板资料连载」第29章内存管理实验

1）实验平台：【正点原子】

小白怎么学Web前端开发如何成为技术达人

Web前端开发工程师已经成为了很多年轻人心中的理想工作，不仅入行门槛低、而且薪资待遇和发展前景都不错，自然吸引了大批人加入行业。

如何开发一个web静态服务器

我们都知道如今的web服务器有很多，比如著名的有apache，有nginx，有tomcat，有resin服务器，有sphere，有iis服务器等等，这些服务器都能提供web服务，并且几乎都能和多种语言进行搭配使用，那么一个web服务器都需要那些功能，开发一个web服务器都需要那些

学Java编程还有前景吗如何才能拿到高薪

需求大、薪资高似乎是Java开发人员的标签，不过学Java编程还有前景吗？它架构在操作系统之上，屏蔽了底层的差异，真正实现了“Writeonce run

Python网络爬虫之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例实现前后分离权限注解+JWT登录认证

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的运行效率太低？几行代码快速提升！

return的就是是你所需要的结果2.3、运行这一步就是最后一步了，只要像下面一样输入上述函数名，赋予参数值，点击运行Run，就能得到你想要的结果arg1=5

python的优点是什么？最新Python400集视频（附教程）

2020，最新Python零基础到精通资料教材，干货分享，新基础Python教材，稳稳找到过万工作，看这里，这里有你想要的所有资源哦，最强笔记，教你怎么入门提升！获取方式：私信小编“

MySQL中OOM故障应如何下手-爱可生

作者：孙祚龙爱可生南区分公司交付服务部成员，实习工程师。负责公司产品问题排查及日常运维工作。本文来源：原创投稿*爱可生开源社区出品，原创内容未经授权不得随意使用，转载请联系小编并注明来源。

像专家一样使用 panic

|go

30种不同的编程语言怎么写“Hello, World”

printfn

percona QAN 介绍

一、背景QAN慢查询日志分析工具是PMM

面试官：你可以用纯CSS判断鼠标进入的方向吗？

虽然没什么软用，但是对付面试官应该是够用了。感谢面试官提出的问题，让我实现了这个功能，对CSS

网络工程师职业生涯中，哪两点是最重要的？

网络工程师最重要的技能是扎实的基础和非常开放的思维，微观知识扎实、宏观能力突出。项目经验也会让网络工程师基础更牢靠，网络工程师是要实战的，要避免纸上谈兵，我认为对基础理论的理解，比你清楚配置更重要。

交换机中相关术语代表什么意思，有必要弄清楚

由浅入深了解以太坊 2.0：最常见问题和最全学习清单

有关以太坊2.0

【Linux简单实用小命令001】CentOS 7、8的防火墙端口开放

yuminstall

吃透这些IPFS硬核知识点，日后抢头矿随时“弯道超车”

今天的你捉住IPFS机遇了吗？我们都知道在Filecoin网络中作为一名存储矿工，信誉对于我们是非常重要的——信誉越高，爆块几率越大。那么信誉系统现在怎么样了呢？

Hive分桶表

fieldsterminated

Spring中资源的加载原来是这么一回事啊！

自己动手搭建邮件系统：怎样让Exchange Server 发出第一封邮件？

编辑Exchange

$【MySQL】RDS物理备份文件(.idb\.frm)恢复到MySQL自建数据库$

【MySQL】RDS物理备份文件(.idb\.frm)恢复到MySQL自建数据库

在阿里云控制台，我们能下载的文件是一个压缩包，解压之后，是.idb和.frm文件，你可能要问了，我可以直接把解压好的问题件覆盖到MySQL的data目录下吗？

NLP算法入门系列：隐含马尔可夫链(HMM)模型的简单介绍

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度学习这样实现人脸的年龄检测

前期的文章我们分享了人脸的识别以及如何进行人脸数据的训练，本期文章我们结合人脸识别的模型进行人脸年龄的检测人脸年龄的检测步骤1、首先需要进行人脸的检测2、把检测到的人脸数据给年龄检测模型去检测3、把检测结果呈现到图片上人脸年龄检测import

嵌入式linux网络编程之——5年程序员给你深度讲解socket套接字

图8-1

深入了解ProcessFunction的状态操作(Flink-1.10)

先反思为何会有上述疑惑上述疑惑产生的原因，应该是受到平时使用HashMap的影响，HashMap获取值就是在调用get方法时指定key，设置值也是在put时指定key，所以看到state.value，看懂了这些，其实也是在了解DataStream/DataSetAPI的设计思路：

Redis内存分析工具--rdr安装与使用

分析Redis

资深架构师教你源码讲解zookeeper实现分布式锁以及集群搭建步骤

//getData发现前一个子节点被删除，抛出异常

一行代码提升迁移性能

论文原址：https://arxiv.org/pdf/2003.12237.pdf开源地址：https://github.com/cuishuhao/BNM在发表在CVPR2020

利用相似几何信息，做可泛化3D形状分割模型

更具体的有以下三种典型的分割方案：FullyConvolutional-Like

这么好用的开源计算器SpeedCrunch，没有不尝试一下的道理

介绍SpeedCrunch是一款高精度科学计算器，具有快速，键盘驱动的用户界面。获取方式在GitHub上搜索SpeedCrunch，就可以去到

分布式缓存，真香

他是前易宝支付架构师、阿里云MVP、腾讯云

特征工程的力量

在本文中，我希望教给您一些有关特征工程的知识，以及如何使用它来对非线性决策边界进行建模。为了说明这一点，假设恢复时间与身高和体重具有以下关系：Y=β₀+β₁+β2+β₃+noise从第三项来看，我们可以看到Y与身高和体重没有线性关系。

java架构：天天写面向接口编程，你考虑过性能吗？大神都是这么写

public

SpringBoot如何优雅的使用RocketMQ

源码编译需要Maven3.2x，JDK8在根目录进行打包:Copymvn-Prelease-all

css代码规范工具stylelint

"mixin"

TensorFlow做Sparse Machine Learning

TensorFlow Sparse现状及背景

TensorFlow中的sparse_tensor实现

TFRecord的解析

模型部署

相關文章:

TensorFlow 2.0简介

TensorFlow 2.0姿态估计快速入门

为什么Linux系统没有类似Windows上的还原精灵和影子系统？

[tensorflow]如何处理样本不均衡？

Tensorflow 学习笔记（一）TensorFlow入门

「tensorflow」浅谈什么是张量tensor

03.06 「tensorflow」浅谈什么是张量tensor

TensorFlow做Sparse Machine Learning

MacOSX 安装 TensorFlow

01.21 MacOSX 安装 TensorFlow

使用 TensorFlow 来实现一个简单的验证码识别过程

基于 TensorFlow.js 的迁移学习图像分类器

在浏览器中进行深度学习：TensorFlow.js (五）构建一个神经网络

在浏览器中进行深度学习：TensorFlow.js (二）线性回归

TensorFlow v2.0实现逻辑斯谛回归

10.23 TensorFlow v2.0的基本张量操作

使用 TensorFlow 识别简单图像验证码

虚拟机管理器（Virtual Machine Manager）简介

TensorFlow——实现简单的线性回归

人工智能 TensorFlow 必知必会编程概念整理

Machine learning

机器学习中的DCGAN-Tensorflow：用于更稳定的训练

谷歌开源机器学习数据集，可在 TensorFlow 直接调用

Effective TensorFlow Chapter7——理解执行顺序和控制依赖

02.04 TensorFlow Probability 概率编程入门级实操教程

要替代 TensorFlow？谷歌开源机器学习库 JAX

TensorFlow 官方简化版！谷歌开源机器学习库 JAX

TensorFlow 官方简化版，谷歌开源机器学习库 JAX

「译」Effective TensorFlow Chapter1——TensorFlow 基础

Swift for Tensorflow

Docker Machine 详解

TensorFlow Lite极简入门：构建移动应用程序进行图像分类

令人困惑的 TensorFlow！(II)

使用 tf.Transform 对 TensorFlow 管道模式进行预处理

09.09 AI实战圣经《Machine Learning Yearning》第1-52章中英文版分享

tensorflow：多层LSTM代码分析

TensorFlow——多层 LSTM 通俗易懂版

ELK之X-PACK Machine Learning功能应用方法详解

TensorFlow进阶教程（二）:TensorFlow.js 入门指南

从零开始搭建深度学习服务器：TensorFlow + PyTorch + Torch

Tensorflow Graph概述

TensorFlow-实践方法

06.18 Windows10下Keras,Tensorflow,CNTK ,MXNet和PyTorch的GPU

Ubuntu 上安装 TensorFlow

05.16 「关键点」TensorFlow 可以这样区分类与操作？「附例子」

05.08 通过 TensorFlow 构建您的第一个深度学习分类器（以狗为例）！

有限状态机（Finite-state machine, FSM）的C语言实现

04.27 有限状态机（Finite-state machine, FSM）的C语言实现

人工智能开发（一）环境搭建-基于ubuntu16 Python3 tensorflow

第二章 IoC容器和Bean配置

运算里不得不说的python模块—math

Devops度量--DevOps 现状快速检查表

SOP是什么（解读）

还不知道交换机上如何配置DHCP，赶紧过来围观吧，一分钟包你学会

还在手动配置IP地址吗？太Low了，一分钟教会您如何配置DHCP

Python爬虫自学笔记：分析头条文章网页源文件

DNS侦查工具

国人开源的异步 Python ORM：GINO

程序测评：Create React App 3.3中有哪些酷炫新功能？

“明学”的魅力？我只要我觉得：驾驭终端，提高生产力

（必收藏系列）Linux面试题——命令集

五分钟学会如何在 IPFS 上部署网站

「正点原子NANO STM32F103开发板资料连载」第29章 内存管理实验

小白怎么学Web前端开发 如何成为技术达人

如何开发一个web静态服务器

学Java编程还有前景吗 如何才能拿到高薪

Python网络爬虫之配置篇（一）

SpringBoot 整合SpringSecurity示例实现前后分离权限注解+JWT登录认证

Python的运行效率太低？几行代码快速提升！

python的优点是什么？最新Python400集视频（附教程）

MySQL中OOM故障应如何下手-爱可生

像专家一样使用 panic

30种不同的编程语言怎么写“Hello, World”

percona QAN 介绍

「正点原子NANO STM32F103开发板资料连载」第29章内存管理实验

小白怎么学Web前端开发如何成为技术达人

学Java编程还有前景吗如何才能拿到高薪