桑树价格 2013年桑树最新报价 江苏沭阳园林苗木基地 当前位置:首页>桑树价格 2013年桑树最新报价 江苏沭阳园林苗木基地>正文

桑树价格 2013年桑树最新报价 江苏沭阳园林苗木基地

发布时间:2019-04-21

原标题:回归决策树

但这让邓国明的心中感到一阵害怕,额间的冷汗浮现而出,双腿有些不自觉的打颤,显然,邓国明有些害怕。只知其声,不见其人,这让邓国明内心的害怕加剧了许多,但是身为一帮之主,邓国明还是按捺着自己体内的恐惧,故做镇静的望着四周,说道:“阁下何人,何必装神弄鬼了?有胆的话,就请明面上说话。”

广西可以种植紫玉兰吗?

“你们逃得了吗?”天帝的声音依旧是震荡九州大地、诸天万界!然而这只晶莹如玉的大手正要去追赶,那紫薇大帝的头上忽然是出现了一道极为明亮的光华,这道光华内中有着一道道的惊雷,其中蕴含着无尽的生灭之力!
“打爆他。”天魁星君隔空一指,一道贯穿千万星域,划破苍穹,打穿恒古的星辰光束从镜面上忌惮而出,打得整个虚无之地都混乱不堪。

“看我的,你只要引开鬼子就行,到时候咱们拿住了这个鬼子头头,就可以脱身了!”韩非很有自信道。

当看过一些简单的机器学习算法或者模型后,对于具体问题该如何评估不同模型对具体问题的效果选择最优模型呢。

1. 经验误差、泛化误差


假如m个样本中有a个样本分类错误

错误率:E = a / m;

精度:  1 - E

训练误差: 又叫经验误差,是指算法/模型在训练样本上的误差

泛化误差:算法/模型在新样本上的误差

显然我们希望得到泛化误差小的机器学习算法。

 

2.欠拟合、 过拟合


欠拟合:欠拟合是指讯息能力低下,本来一些有的特征没有学习到。

解决方法:欠拟合一般比较容易克服,例如在决策树学习中扩展分支在神经网络学习中增加学习轮数就可以。

 

过拟合:模型把训练样本学的“太好”,很可能把训练样本自身的一些特点当做了所有潜在样本都会具有的一般性质,这样就会导致泛化能力下降。

解决方法: 很难克服或者彻底避免。

 

下面这张图对欠拟合/过拟合解析的十分到位:

过拟合

 

3. 评估方法——留出法


     直接将数据集D划分成两个互斥的集合,其中一个作为训练集S,另一个作为测试集T 即: D = S ∪ T , S ∩ T = ∅ . 在S上训练出模型后用T来评估其测试误差,作为泛化误差的评估。

      需要注意的训练/测试集的划分要尽可能的保持数据分布的一致性,避免因数据划分过程引入额外的偏差而对最终结果产生影响。 如果从采样的角度看数据集划分过程,则保留类别比例的采样方式通常称为分层采样

      单层留出法得到的评估结果往往不够稳定可靠,在使用留出法时,一般采用若干次随机划分、重复进行试验评估后取平均值为留出法结果。

     缺点: 若训练集S包含绝大多数样本则训练出的模型可能更接近与用D训练处的模型,但由于T比较小,评估结果可能不够稳定准确。 若令测试机包含多一些样本,则训练集S与D差别更大,被评估的模型与用D训练出的模型相比可能有较大差别,从而降低了评估结果的保真性。   常见的做法是将 2/3 ~ 4/5 的样本用于训练,剩余样本用于测试。

 

4. 评估方法—交叉验证法


交叉验证法

 

 

5 . 评估方法——查准率、查全率


对于二分类问题进行如下统计:

image

查准率:

        P  =  TP / (TP + FP)

查全率:

        R = TP / (TP + FN)

以预测癌症为例,正例为癌症,反例不是癌症。  查准率表示预测为癌症实际发生癌症的概率,而查全率是指预测为癌症的覆盖率(部分预测为反例但实际情况确实正例)。

 

其它机器学习算法:

监督学习——随机梯度下降算法(sgd)和批梯度下降算法(bgd)

监督学习——决策树理论与实践(上):分类决策树

监督学习——决策树理论与实践(下):回归决策树(CART)

监督学习——K邻近算法及数字识别实践

监督学习——朴素贝叶斯分类理论与实践

监督学习——logistic进行二分类(python)

监督学习——AdaBoost元算法提高分类性能

无监督学习——K-均值聚类算法对未标注数据分组

 

参考:

周志华 《机器学习》

《推荐系统实战》

编辑:华海顺平

发布:2019-04-21 00:00:00

当前文章:http://nsmsa.com.cn/content/2019-01/22/content_97085.html

大叶女贞批发去哪里最好? 洒金桃叶珊瑚在北方生长吗? 地径5公分紫藤价格贵吗? 购买小月季苗哪家好? 长度500公分的爬山虎苗哪里有批发的? 紫薇树如何种植养护 紫玉兰基地 正常市面上常用的洒金柏多高?

84958 15572 11501 68085 86644 63944 23868 54820 88437 77741 73276 37625 39109 49056 58545 36425 65828 11674 13654 55053

责任编辑:华邓石