机器学习预测农民是否可以得到贷款

本文借助真实的农业贷款业务场景,利用回归算法解决贷款发放业务。 线性回归,是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。本文通过农业贷款的历史发放情况,预测是否给预测集的用户发放他们需要的金额的贷款。

试用机器学习 开通相关产品 开通相关产品
场景概述
查看大图

准备工作

1)用户拥有阿里云账号,并创建好账号AcessKey。

2)开通大数据开发套件/MaxCompute/机器学习产品。

教程任务

1)数据导入MaxCompute及预处理。

2)特征工程。

3)回归及预测。

4)回归模型评估。

使用产品
  • 机器学习(Machine Learning)

    阿里云机器学习是基于阿里云分布式计算引擎的一款机器学习算法平台。

  • 大数据开发套件(Data IDE)

    大数据开发套件提供可视化开发界面、离线任务调度运维、快速数据集成、多人协同工作等功能,为您提供一个高效、安全的离线数据开发环境。

    免费
  • 大数据计算服务(MaxCompute)

    快速的解决用户海量数据计算问题,有效降低企业成本,并保障数据安全。

实现方法

    亲,您的浏览器版本太低,暂时无法加载显示

    请您升级到高版本的浏览器,或者切换成chrome浏览器进行查看

    常见问题
    • Q:在实现农业贷款发放预测过程中,测试任务运行成功,但其中一张表没有数据是为什么?
      A :查看logview找出错因,检查join表是否有数据。
    • Q:算法平台合并列功能,如何确定的那两行的列合并在一起?
      A :若是一张表,要合并其中的列a,列b,可参考左边输出列选择列a,右表输出列选择列b方法即可。
    • Q:pai命令实现GBDT回归与预测模型,做预测时,DsplitCharacteristic参数如何设置?
      A :DsplitCharacteristic参数是对二分类和多分类的一个定义,二分类时,DsplitCharacteristi=1,多分类时,DsplitCharacteristi=2. GBDT回归与排序是一个回归模型,不涉及到分类问题,跑pai命令时默认写成DsplitCharacteristi=2,后台处理时会自动过滤掉。另外,若是直接在web端连接组件跑任务,对应预测组件参数应保持“默认”,不需要勾选“自定义”。
    • Q:模型预测组件报错:DataValue has no double value,为什么?
      A :请检查模型训练输入表与模型预测输入表的字段信息是否一致,若不致,会报上述错误。具体检查方法,在数据开发台用 'desc 表名'语句查看训练表和预测表的字段类型。
    相关场景推荐