【机器学习】线性回归 多元线性回归

news/2025/2/19 3:30:34

机器学习系列】

多元线性回归

V1.0

多元线性回归

多元线性回归使用多维特征向量来推算回归值,推算方法使用以下公式
y = w 0 + w 1 ∗ x 1 + w 2 ∗ x 2 + . . . + w n ∗ x n y=w_0+w_1*x_1+w_2*x_2+...+w_n*x_n y=w0+w1x1+w2x2+...+wnxn
其中 x i x_i xi是N维特征向量第 i i i 维的数据, w i w_i wi是特征向量第 i i i 维特征的权值, y y y是该特征向量的预测值。
求解多元线性回归模型,即通过N维特征向量及其对应的标签真实值,求解多元线性公式参数, w 0 . . w n w_0..w_n w0..wn的过程。

一元线性回归与多元线性回归

一元线性回归的2个参数 k k k b b b,其中 k k k对应一元特征的权值。
多元线性回归 w 1 w_1 w1- w n w_n wn这N个权重,分别对应特征向量的N个维度的特征值。

多元线性回归模型的误差衡量

对于单个特征向量,其误差为 y r e a l − y p r e d i c t y_{real}-y_{predict} yrealypredict
总体误差,使用各个特征向量投票决定,这里可以使用MSE(Mean Squared Error)方法(其他总体误差计算方法比如RMES,MAE)。
可以认为最优的模型即是将总体误差最小化时的模型,在使用MSE的情况下,即是要求解使得模型总体损失最小时的参数 w 0 . . . w n w_0...w_n w0...wn。可用如下公式表示
arg min ⁡ w 0 . . . w n ∑ i = 1 m ( y r e a l − y p r e d i c t ) 2 \argmin_{w_0...w_n}\sum_{i=1}^{m}(y_{real}-y_{predict})^2 w0...wnargmini=1m(yrealypredict)2
y p r e d i c t y_{predict} ypredict公式代入,公式中就直接包含了模型的参数 w 0 . . . w n w_0...w_n w0...wn
arg min ⁡ w 0 . . . w n ∑ i = 1 m ( y r e a l − ( w 0 + w 1 ∗ x 1 + w 2 ∗ x 2 + . . . + w n ∗ x n ) ) 2 \argmin_{w_0...w_n}\sum_{i=1}^{m}(y_{real}-(w_0+w_1*x_1+w_2*x_2+...+w_n*x_n))^2 w0...wnargmini=1m(yreal(w0+w1x1+w2x2+...+wnxn))2

多元线性回归的最优解

多元线性回归的解析解(标准数学解法)

对于给定的N维训练数据及数据标签,线性回归模型的最优解及参数 w 0 . . . w n w_0...w_n w0...wn ,可以通过以下公式得到多元线性回归的最优参数
W = ( X T X ) − 1 X T Y W=(X^TX)^{-1}X^TY W=(XTX)1XTY

多元线性回归的解析解公式分析

在多元线性回归的解析解公式中, X X X为特征矩阵( M ∗ N M*N MN维), Y Y Y为特征向量的标签值( M ∗ 1 M*1 M1维)。
X T X^T XT的维度 N ∗ M N*M NM
( X T X X^TX XTX)的维度为 N ∗ N N*N NN
( X T X ) − 1 (X^TX)^{-1} (XTX)1)的维度为 N ∗ N N*N NN
( X T X ) − 1 X T (X^TX)^{-1}X^T (XTX)1XT的维度为 N ∗ M N*M NM
( X T X ) − 1 X T Y (X^TX)^{-1}X^TY (XTX)1XTY的维度为 N ∗ 1 N*1 N1

多元线性回归的搜索解法

解析解在特征维度较大时计算较为复杂,计算量大,因此工程上并不经常采用这种方法。
scikit-learn库中对于线性回归问题,使用的是梯度下降的解法。


http://www.niftyadmin.cn/n/5857231.html

相关文章

什么是掉期(Swap)?——金融衍生品的关键工具(中英双语)

什么是掉期(Swap)?——金融衍生品的关键工具 引言 掉期(Swap) 是金融市场中最重要的衍生品之一,它允许两方交换未来的现金流,以优化融资成本、规避利率或汇率风险,甚至进行投机交易…

【含文档+PPT+源码】基于SpringBoot+Vue的个性化健身助手系统

项目介绍 本课程演示的是一款 基于SpringBootVue的个性化健身助手系统,主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的 Java 学习者。 1.包含:项目源码、项目文档、数据库脚本、软件工具等所有资料 2.带你从零开始部署运行本套系统 3…

AI口播数字人系统源码部署全解析!数字人开源码部署

数字人源码开发涉及多领域技术,是一项复杂的工程。以下是其简化流程: 需求分析与规划: 明确数字人的应用场景,如虚拟主播、客服助手等。根据场景确定具体功能,例如语音交互、面部表情驱动和动作生成。同时制定技术方案…

Vue 3最新组件解析与实践指南:提升开发效率的利器

目录 引言 一、Vue 3核心组件特性解析 1. Composition API与组件逻辑复用 2. 内置组件与生命周期优化 3. 新一代UI组件库推荐 二、高级组件开发技巧 1. 插件化架构设计 2. 跨层级组件通信 三、性能优化实战 1. 惰性计算与缓存策略 2. 虚拟滚动与列表优化 3. Tree S…

shell脚本备份PostgreSQL数据库和库下表

注意: 以下为对PostgreSQL13.16版本数据库备份shell脚本参考请确认备份节点上psql和pgdump的版本不至于太低,建议>13.16该脚本目前是对于整库、(默认针对public这个schema,如果有其他schema,请自行添加一层循环&am…

2025年02月17日Github流行趋势

项目名称:OmniParser 项目地址url:https://github.com/microsoft/OmniParser 项目语言:Jupyter Notebook 历史star数:8971 今日star数:969 项目维护者:yadong-lu, ThomasDh-C, aliencaocao, nmstoker, kris…

2011年上半年软件设计师上午题知识点进行分类整理(附真题及答案解析)

根据2011年上半年软件设计师上午题真题,以下是对题目涉及的知识点进行分类整理和详细解释,供学生背诵记忆: 1. 数据结构与算法 二叉树的性质: 二叉树的节点数、深度、叶子节点数之间的关系。完全二叉树的性质:最后一层…

Linux学习笔记之虚拟地址空间

1.示例引入 运行如下代码那么运行结果如下图。 #include<stdio.h> #include<unistd.h>int main() {pid_t id fork();if(id-1){printf("创建进程错误&#xff01;\n");return 1;}int size0;if(id0){//子进程while(1){printf("我是子进程&#xff0c…