[机器学习

IT技术

更新时间：2023-06-18102

admin管理员组
文章数量:1516870

[机器学习

[机器学习-5]岭回归[L2正则化]及python实现（Ridge Regression）【L2】

- 前言
- 题目
- 岭回归（Ridge Regression）
- k-fold validation
- sklearn ridge
- (1)实现（realization）
- (2)实现
- （3）实现
- 结语

前言

！！实现直接跳转实现
这章本来是为了接前面的过拟合（overfit）的，结果到现在过拟合还没水出来，所以就先写这一篇啦。
首先简单地提一下过拟合，所谓过拟合，可以理解为过度地取悦我们所用的数据，结果就是训练出来的模型，在我们的训练集（training set）上表现完美，结果在泛化上直接拉跨。原因是我们训练集内部可能有一些结构性的特点，而我们在训练的时候把它们考虑进来了。
下面的几个例子都可以很清楚地看到过拟合的现象出现

题目

今天我在做老师的题目的时候，遇到了这道题

简单来说，就是我们要训练一个模型来预测一个城市的犯罪率，我们先看老师给的README文件

我们的训练集中的第一列为犯罪率，后面为各种因素（比如失业率等等）也就是所谓的feature，使用训练集中的数据后，我们要在测试集上测试我们所训练出来的模型

岭回归（Ridge Regression）

众所周知，L1（LASSO）和L2(Ridge)都是我们用来防止出现过拟合的方法.
对于下面这么一个问题，我们怎么解决呢？我们知道我们的目标函数与限制即参数矩阵的二范数，结合起来，我们要求满足条件的最小参数矩阵。

我们可以通过添加惩罚来讲两者联系起来，这样一来，显然参数矩阵的二范数就不能过大了，因为它越大，惩罚越重。参数lambda与C显然存在具体关系（虽然我们不知道），这样我们就将选C,改变成了选lambda了

不同的L2正则化

k-fold validation

既然题目要求，那么我就来提一嘴吧
所谓k-fold validation就是将数据分成K份，分别将第i(i=1,…,K)份作为验证集（validation set），其余作为训练集，训练出来后在验证机上测试performance

最终通过测试选取一个拥有最小MSE的模型。需要注意与测试集的区别

sklearn ridge

这里我用到了sklearn自带的岭回归函数，它有一些自带的属性与方法

(1)实现（realization）

import pandas as pd
import numpy as np
from matplotlib import pyplot
from sklearn import linear_model
import matplotlib.pyplot as plt
import math
from sklearn.metrics import mean_squared_error
from sklearn.base import clone
def E_in(theta,phi,y):result = 0.5*np.linalg.norm(np.dot(theta,phi)-y)return result
def E_aug(lambda_1, y, X, w):result = 0.5*np.linalg.norm(np.dot(w,X)-y)+lambda_1*np.linalg.norm(X)return result
if __name__ == '__main__':df_train = pd.read_table("crime-train.txt")df_test = pd.read_table("crime-test.txt")column = df_train.shape[1] #96row = df_train.shape[0] #1595MSE_SET =[]C_SET = []MSE_min = 0Y_train = df_train['ViolentCrimesPerPop'] # Y (2)buffer_train = df_train.copy(deep = True) # Xfeature_train = buffer_train.drop('ViolentCrimesPerPop',axis = 1) #(2)Y_test = df_test['ViolentCrimesPerPop']#(2)buffer_test = df_test.copy(deep = True)feature_test = buffer_test.drop('ViolentCrimesPerPop',axis = 1) #(2)alpha_set = []coef_set = []index = []reg_clone = linear_model.Ridge()MSE_min = 0for i in range(10):#10-foldalpha_val = math.pow(10,-i)alpha_set.append(alpha_val)index.append(i)for j in range(10):global X,Y#stest_set = df_train.sample(frac = 0.1,axis = 0) # get 0.1 part oftest_set = df_train[159*i:159*(i+1)]train_set = df_train[~df_train.index.isin(test_set.index)]test_buffer = test_set.copy(deep = True)Y_test = test_set['ViolentCrimesPerPop']feature_test = test_buffer.drop('ViolentCrimesPerPop',axis = 1) train_buffer = train_set.copy(deep =True)Y_train = train_set['ViolentCrimesPerPop']feature_train = train_buffer.drop('ViolentCrimesPerPop',axis = 1)reg = linear_model.Ridge(alpha = alpha_val)reg.fit(feature_train,Y_train)predict = reg.predict(feature_test)if i==0:MSE_min = mean_squared_error(Y_test,predict)Y = Y_trainX = feature_trainelse:MSE_buffer = mean_squared_error(Y_test,predict)if(MSE_buffer<MSE_min):MSE_min = MSE_bufferY = Y_trainX = feature_trainMSE_SET.append(MSE_min)   plt.figure(figsize=(8,6))plt.axes(xscale = "log") #plt.axes(yscale = "log") plt.plot(alpha_set,MSE_SET)plt.xlabel('lambda')  plt.ylabel('MSE') plt.show()#and we can recover the best hypothesis from reg_clone using X,Y to fit

先用pd将数据load进来

在划分出训练集，这里我用的是dataframe自带的sample函数，注释掉的部分是均匀选取的，虽然两者都不会重复，但是第一种随机性更强一点。

最后得到两张图（第一张均匀，第二张随机）
在这里插入图片描述

(2)实现

这里我们就不用了这么麻烦了，直接规规矩矩训练出来然后在test set上测试就行了

import pandas as pd
import numpy as np
from matplotlib import pyplot
from sklearn import linear_model
import matplotlib.pyplot as plt
import math
from sklearn.metrics import mean_squared_error
from sklearn.base import clone
def E_in(theta,phi,y):result = 0.5*np.linalg.norm(np.dot(theta,phi)-y)return result
def E_aug(lambda_1, y, X, w):result = 0.5*np.linalg.norm(np.dot(w,X)-y)+lambda_1*np.linalg.norm(X)return result
if __name__ == '__main__':df_train = pd.read_table("crime-train.txt")df_test = pd.read_table("crime-test.txt")column = df_train.shape[1] #96row = df_train.shape[0] #1595MSE_SET =[]C_SET = []MSE_min = 0Y_train = df_train['ViolentCrimesPerPop'] # Y (2)buffer_train = df_train.copy(deep = True) # Xfeature_train = buffer_train.drop('ViolentCrimesPerPop',axis = 1) #(2)Y_test = df_test['ViolentCrimesPerPop']#(2)buffer_test = df_test.copy(deep = True)feature_test = buffer_test.drop('ViolentCrimesPerPop',axis = 1) #(2)alpha_set = []coef_set = []index = []for i in range(10):alpha_val = math.pow(10,-i) #也可以-i+5alpha_set.append(alpha_val)reg = linear_model.Ridge(alpha=alpha_val)reg.fit(feature_train,Y_train)predict = reg.predict(feature_test)MSE = mean_squared_error(predict,Y_test)MSE_SET.append(MSE)plt.figure(figsize=(8,6))plt.axes(xscale = "log") plt.plot(alpha_set,MSE_SET)         plt.xlabel('lambda')  plt.ylabel('MSE') plt.show()

输出

放大（也可以将指数平移），得到拥有最好performance的lambda为10

（3）实现

我们设定一个阈值，数训练出的w内小于阈值的个数

import pandas as pd
import numpy as np
from matplotlib import pyplot
from sklearn import linear_model
import matplotlib.pyplot as plt
import math
from sklearn.metrics import mean_squared_error
from sklearn.base import clone
def E_in(theta,phi,y):result = 0.5*np.linalg.norm(np.dot(theta,phi)-y)return result
def E_aug(lambda_1, y, X, w):result = 0.5*np.linalg.norm(np.dot(w,X)-y)+lambda_1*np.linalg.norm(X)return result
if __name__ == '__main__':df_train = pd.read_table("crime-train.txt")df_test = pd.read_table("crime-test.txt")column = df_train.shape[1] #96row = df_train.shape[0] #1595MSE_SET =[]C_SET = []MSE_min = 0Y_train = df_train['ViolentCrimesPerPop'] # Y (2)buffer_train = df_train.copy(deep = True) # Xfeature_train = buffer_train.drop('ViolentCrimesPerPop',axis = 1) #(2)Y_test = df_test['ViolentCrimesPerPop']#(2)buffer_test = df_test.copy(deep = True)feature_test = buffer_test.drop('ViolentCrimesPerPop',axis = 1) #(2)alpha_set = []coef_set = []index = []threshold = 2e-02num = []for i in range(10):alpha_val = math.pow(10,-i+5)#alpha_val = ialpha_set.append(alpha_val)reg = linear_model.Ridge(alpha=alpha_val)reg.fit(feature_train,Y_train)num = [i for i in reg.coef_ if i<threshold]coef_set.append(len(num)) #(3)plt.figure(figsize=(8,6))  plt.axes(xscale = "log")       plt.plot(alpha_set,coef_set)plt.xlabel('lambda')  plt.ylabel('coef') plt.show()

结语

综上所述，详见sklearn官网，大家多练习

本文标签：机器学习

版权声明：本文标题：[机器学习内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.betaflare.com/web/1687063674a59954.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

编程频道|软件玩家 - 软件改变生活！

[机器学习

[机器学习

[机器学习-5]岭回归[L2正则化]及python实现（Ridge Regression）【L2】

前言

题目

岭回归（Ridge Regression）

k-fold validation

sklearn ridge

(1)实现（realization）

(2)实现

（3）实现

结语

更多相关文章

机器学习

[机器学习

【机器学习

机器学习,以及深度学习产生背景

[机器学习]

python+sklearn,机器学习

【机器学习】

机器学习,过拟合与欠拟合,正则化与交叉验证

想要让机器学习提速？这台电脑你需要了解的硬性标准！

机器学习挑战：选对硬件，让模型训练飞速起来

爱奇艺：机器学习技术在大规模数据中的奇妙实践

发表评论

推荐文章

揭秘路由器WiFi密码的正确设置方式，让你的网络快人一步还更安心

Py编程进阶之路 第9章：PSUTIL实战 - 实时查看您的系统资源，掌握CPU与内存监控技能

Win10系统管理指南：解密pagefile.sys

MBR分区后的纠结：如何让fcitx通过DBUS连接成功

EasyMD5：你的文件MD5校验小能手，简单、高效、便捷！

热门文章

山海情"火爆分析：弹幕里藏匿的观众喜恶密码！

生化危机5出错了？xlive.dll文件丢失？这里有简单步骤帮你恢复游戏体验！

详解中国电信WLAN设置：打造稳定无线网络环境

轻松搞定Win7蓝牙驱动：步骤详细教程

彻底摆脱Xinput1_3.dll困扰，一文教你从基础到进阶的安装技巧！

从Windows盗版阴影中解脱出来——Flash中心解决方案

超实用教程：完美安装Windows7 Ultimate(旗舰版)，一步到位！

Adobe Flash Player：深度探索其加密功能

HarmonyOS初体验：快速安装与入门教程，让你一学就会

理解Android屏幕的HLG亮度配置：为何不是[0]而是[0-12]范围？

最新文章

金融建模中Excel与VBA的超级组合拳

现代计算的新篇章：把FEMCFD求解器封装为PyTorch或JAX函数

突破视觉强化学习训练的‘视觉’障碍，MJX带来高效方案

Excel高手必备：TL431可调电压基准源的求解秘技

高性能物理世界：MuJoCo XLA在Unity中的应用揭秘

Excel宏数量爆炸，开机慢如乌龟？轻松破解攻略！

Open-AutoGLM性能瓶颈大揭秘：破解编译三大障碍

MuJoCo高手之路：从入门到精通的进阶指南

深度学习加速新纪元：张量引擎TBE与深度学习编译器，加速你的训练与推理

MJX秘籍：5倍加速技巧，改写强化学习训练规则！

清华同方超锐L60P 龙芯 3A600032GB1TB集显麒麟统信永久版系统参数报价

清华同方超锐L60P 龙芯 3A600016GB512GB集显KOS麒麟系统试用版参数报价

清华同方超锐L60P 龙芯 3A600032GB1TB集显麒麟统信永久版系统+WPS参数报价

清华同方超锐L60P 龙芯 3A600016GB512GB集显麒麟统信永久版系统参数报价

联想开天X1f G1d 飞腾D3000M16GB1TB集显国防版麒麟统信系统参数报价

Py编程进阶之路第9章：PSUTIL实战 - 实时查看您的系统资源，掌握CPU与内存监控技能