基于 Hive UDF 的机器学习算法工具 Apache Hivemall 荐

Hivemall 是一个可扩展的机器学习算法工具,可在 Apache Hive、Apache Spark 和 Apache Pig 上运行。

Hivemall 基于 Hive UDF,在工业实践应用中非常方便,方便数据科学家快速构建机器学习模型原型。

项目状态:目前为 Apache 孵化项目,支持列表如下:

Binary Classification MetricsMulti-label Classification MetricsRegression MetricsRanking MeasuresData Generation