Hivemall 是一個可擴展的機器學習算法工具,可在 Apache Hive、Apache Spark 和 Apache Pig 上運行。
Hivemall 基於 Hive UDF,在工業實踐應用中非常方便,方便數據科學家快速構建機器學習模型原型。
項目狀態:目前為 Apache 孵化項目,支持列表如下:
- Binary Classification Metrics
- Multi-label Classification Metrics
- Regression Metrics
- Ranking Measures
- Data Generation
閱讀更多 HELLO開源 的文章