全部版块 我的主页
论坛 休闲区 十二区 休闲灌水
534 1
2018-07-30
机器学习应用几个点:

a, 预测
        训练模型,模型给的结果负无穷到正无穷

        算法:

        多元线性回归
        神经网络
b, 分类
        训练模型,模型给的结果是其中某一个类别号

        算法:

        贝叶斯分类,使用场景,文本分类
        朴素贝叶斯,Naive Bayes,其中以相互独立为假设去计算

        拉普拉斯估计,是把取0变成1,当然为了公平,每个特征都加一

        词袋模型,一篇文章打乱等价于一堆词

c, 聚类

d, 推荐

        算法:

        基于物品的协同过滤

e, 关联规则
        支持度 置信度

        算法:
        Apriori
f, 降维


1,机器学习是什么?
数据-->训练,带入算法计算-->模型


2,如何可以使得模型更好?

        a,增加数据

        b,调整算法


3,算法是公式!

4,数据是公式里面的X和Y

5,模型是什么?
        参数!计算机计算模型的过程,说白了就是求解方程组的过程!

        求解模型,就是要找到最优解,误差最小的时候就是最优解!


6,什么是最好的模型?

        尽可能的让误差最小!

        误差定义称为损失函数!


7,多元线性回归
-- 预测

        y = w1*x1 + w2*x2 + wn*xn + w0

        正无穷到负无穷

        线性,Xi,Y变化符合一条直线
回归,回归到平均值


案例:保险的案例
a, age进行了平方?

        是让数据更加适应算法,更加符合线性变化

b, bmi30*smoker?

        是在你更了解业务数据的情况下


8,神经网络 -- 预测

        输入层
        输出层
        隐藏层,可以有多个隐藏层,隐含的推理出来的开始特征的可能性

已有的数据-->算法训练-->生成模型


案例:水泥的强度

a, 增加了隐藏层的隐藏节点的个数
b, 为了避免过拟合,测试集来测模型的效果,多数的数据用于训练,少数的数据用于测试










二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-7-30 15:38:47
谢谢分享
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群