online learning的介绍

el/2024/7/17 3:21:34

什么是Online Learning

准确地说,Online Learning并不是一种模型,而是一种模型的训练方法,Online Learning能够根据线上反馈数据,实时快速地进行模型调整,使得模型及时反映线上的变化,提高线上预测的准确率。Online Learning的流程包括:将模型的预测结果展现给用户,然后收集用户的反馈数据,再用来训练模型,形成闭环的系统。如下图所示:

Online Learning有点像自动控制系统,但又不尽相同,二者的区别是:Online Learning的优化目标是整体的损失函数最小化,而自动控制系统要求最终结果与期望值的偏差最小。

传统的训练方法,模型上线后,更新的周期会比较长(一般是一天,效率高的时候为一小时),这种模型上线后,一般是静态的(一段时间内不会改变),不会与线上的状况有任何互动,假设预测错了,只能在下一次更新的时候完成更正。Online Learning训练方法不同,会根据线上预测的结果动态调整模型。如果模型预测错误,会及时做出修正。因此,Online Learning能够更加及时地反映线上变化。

Online Learning的优化目标

如上图所示,Online Learning训练过程也需要优化一个目标函数(红框标注的),但是和其他的训练方法不同,Online Learning要求快速求出目标函数的最优解,最好是能有解析解。

怎样实现Online Learning

前面说到Online Learning要求快速求出目标函数的最优解。要满足这个要求,一般的做法有两种:Bayesian Online Learning和Follow The Regularized Leader。


http://www.ngui.cc/el/5179170.html

相关文章

TensorFlow的55个经典案例

导语:本文是TensorFlow实现流行机器学习算法的教程汇集,目标是让读者可以轻松通过清晰简明的案例深入了解 TensorFlow。这些案例适合那些想要实现一些 TensorFlow 案例的初学者。本教程包含还包含笔记和带有注解的代码。 第一步:给TF新手的教…

Pandas.DataFrame删除行和列

本文通过一个csv实例文件来展示如何删除Pandas.DataFrame的行和列数据文件名为:example.csv内容为: |date|spring|summer|autumn|winter||----||2000|12.2338809|16.90730113|15.69238313|14.08596223||2001|12.84748057|16.75046873|14.51406637| 13.5037456|2002|13.558175|…

GDBT详解

GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regression Tree),是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终答案。它在被提出之初就和SVM一起被认为是泛化能力&#xff0…

在anaconda中安装tensorflow

本文主要介绍如何在Windows下安装TensorFlow。当然建议还是在linux下安装,在windows下开发不太方便。 相关背景 网上现有的方法都是教如何在windows下安装虚拟机或者安装docker来完成TensorFlow的安装。 得益于google目前已经支持直接在windows直接安装&#xff…

归一化,标准化,正则化的概念和区别

归一化(Normalization) 1.把数据变为(0,1)之间的小数。主要是为了方便数据处理,因为将数据映射到0~1范围之内,可以使处理过程更加便捷、快速。 2.把有量纲表达式变换为无量纲表达式&…

dropout的用法

dropout的作用是增加网络的泛化能力,可以用在卷积层和全连接层。但是在卷积层一般不用dropout, dropout是用来防止过拟合的过多参数才会容易过拟合, 所以卷积层没必要, 但是是可以用的,要小心翼翼

LRN局部相应归一化

本笔记记录学习 LRN(Local Response Normalization),若有错误,欢迎批评指正,学习交流。 1.侧抑制(lateral inhibition) 2.计算公式 Hinton在2012年的Alexnet网络中给出其具体的计算公式如下: …

简要介绍一下目标检测的网络,r-cnn, spp-net, fast-rcnn, faster-rcnn

简要介绍一下目标检测的网络 (1)R-CNN的原理:先用框把物体找出来,然后将找出来的框放入CNN中进行分类,这就是RCNN的简单原理。 (2)SPP-net:直接输入整张图片,所有区域…