一文了解滴滴与蚂蚁金服开源共建的SQLF

导读:SQFlow利用SQL语言构建机器学习和深度学习,致力于“MakeAIassimpleasSQL”,愿景是推进人工智能大众化、普及化,也就是只要懂商业逻辑就能用上人工智能,让懂业务的人能自由地使用人工智能。本文带你快速了解开源的工程化的自助式数据科学平台SQLFlow。

SQLFlow利用SQL语言构建机器学习和深度学习,致力于“MakeAIassimpleasSQL”,愿景是推进人工智能大众化、普及化,也就是只要懂商业逻辑就能用上人工智能,让懂业务的人能自由地使用人工智能。SQLFlow具备三大核心要素,即数据描述商业逻辑、AI赋能深度数据分析和易于使用。

SQLFlow致力于帮助业务提升效能,SQLFLow支持的模型库较为丰富,主要模型包括DNN神经网络预测模型、Shap+XGBoost可解读模型、基于自编码器的无监督聚类模型、基于LSTM的时间序列模型等,更多详细内容可查看SQLFlow官方模型库, 基于iris数据集训练DNN分类器SELECT*FROMiris.trainTOTRAINDNNClassiferWITHhidden_units=[10,10],n_classes=3,EPOCHS=10COLUMNsepal_length,sepal_width,petal_length,petal_widthLABELclassINTOsqlflow_models.my_dnn_model;

SQLFlow解析接收到的SQL命令,其中SELECT语句传递给对应数据引擎获取数据,而TRAIN和WITH语句则分别指定了使用的模型种类、模型结构和训练所需的超参数,COLUMN和LABEL部分分别用于训练的各特征列名称和标签列名称。

SQLFlow将TRAIN和WITH语句中的内容解析为对应的Python程序,整体流程如下图所示。

图SQLFlow工作原理

本文摘编于《数据科学工程实践》,经出版方授权发布。

预览时标签不可点收录于话题#个上一篇下一篇



转载请注明地址:http://www.wawayuz.com/nwfz/536398.html
  • 上一篇文章:
  • 下一篇文章:
  • 热点文章

    • 没有热点文章

    推荐文章

    • 没有推荐文章