Amateur Hour

不只是线性回归(1):稳健回归

machine learning modeling
Intro线性回归(Linear Regression)是机器学习的基本方式,但为了提升其性能,人们发明了无数优化方式。这个“不只是线性回归”系列就是为了记录我在日常的学习中发现的,不只是简单的线性回归的算法、优化方式、数学原理等。 1. 稳健回归(Robust Regression)稳健回 ...
Read more

最大似然估计、最大后验概率与贝叶斯估计

statistics
Intro众所周知,机器学习的过程一般分两个要点,第一是“模型”,第二是“优化”。“模型”这一点很好理解,就是要找到适合用于解决手头上预测问题的模型。机器学习训练过程的核心在于“优化”。而训练(trianing)一般可以分成以下几个步骤: 定义假设空间H:即选择模型,不同的模型对应的就是不 ...
Read more

Pandas分组与聚合

feature engineering feature selection
Pandas分组与聚合初学特征处理的时候被Pandas的groupby折磨了许久,特地汇集了当时整理的网上的材料,比较系统的说明了pandas的分组/聚合功能的常用特性。相比SQL,pandas能利用groupby进行更加复杂的分组运算。 0.分组 (groupby) 分组运算过程:spli ...
Read more

互联网金融产品用户增长模型

growth
Intro最近很集中地系统梳理了互金理财行业在用户增长(Growth)方面的 methodology 与 practice,尝试以文章的形式予以框架性地总结,也算是给自己这段时间的学习做一个沉淀,当然也希望能够帮到其他对互金用户增长有兴趣的同学们。 用户增长,或者以更现(zhuang)代(b ...
Read more
Prev Next