线性回归的原理

房价预测

假设 1：影响房价的关键因素是卧室个数，卫生间个数和居住面积，记为 $x_{1}$ , $x_{2}$ , $x_{3}$ .
假设 2：成交价是关键因素的加权和

y = w_{1} x_{1} + w_{2} x_{2} + w_{3} x_{3} + b

线性模型

给定 n 维输入

x = [x_{1}, x_{2}, \dots, x_{n}]^{T}

线性模型有一个 n 维权重和一个标量偏差

w = [w_{1}, w_{2}, \dots, w_{n}]^{T}, b

输出是输入的加权和

y = w_{1} x_{1} + w_{2} x_{2} + \dots + w_{n} x_{n} + b

向量版本：

y =< w, x > + b

可以看成单层神经网络

衡量预估质量

比较真实值和预估值，例如房屋售价和估价
假设 $y$ 是真实值， $\hat{y}$ 是预估值，我们可以比较平方损失：

l (y, \hat{y}) = \frac{1}{2} (y - \hat{y})^{2}

训练数据

采集权重和偏差
假设有 n 个样本，记

X = [x_{1}, x_{2}, \dots, x_{n}]^{T} y = [y_{1}, y_{2}, \dots, y_{n}]^{T}

训练损失：找到 $w_{1}$ 使得这一项最小

l (X, y, w, b) = \frac{1}{2 n} | | y - Xw - b | |^{2}

最小化损失来学习参数

w^{*}, b^{*} = a r g {m i n}_{w, b} l (X, y, w, b)

显示解

基础优化方法

梯度下降

挑选一个初始值 $w_{0}$
重复迭代参数 $t = 1, 2, 3$

W_{t} = W_{t - 1} - η \frac{δ l}{δ W_{t - 1}}

沿梯度方向将增加损失函数值
学习率：步长的超参数

小批量随机梯度下降

随机采样 b 个样本 $i_{1}, i_{2}, \dots, i_{b}$ 来近似损失

\frac{1}{b} \sum_{i \in I_{b}} l (x_{i}, y_{i}, w)

b 是批量大小，另一个重要的超参数

总结

梯度下降通过不断沿着反梯度方向更新参数求解
小批量随机梯度下降时深度学习默认的求解算法
两个重要的超参数是批量大小和学习率

线性回归的从零开始实现

构造人造数据集

w = [2, - 3.4]^{T}, b = 4.2, 和噪声项 δ

python

def synthetic_data(w, b,  num_examples):
	X = torch.normal(0, 1, (num_examples, len(w)))
	y = torch.matmul(X, w) + b
	y += torch.normal(0, 0.01, y.shape)
	return X, y.reshape((-1, 1))

true_w = torch.tensor([2, -3.4])
true_b = 4.2
features, labels = synthetic_data(true_w, true_b, 1000)

定义 `data_iter` 函数

python

线性回归的原理 ​

房价预测 ​

线性模型 ​

衡量预估质量 ​

训练数据 ​

显示解 ​

基础优化方法 ​

梯度下降 ​

小批量随机梯度下降 ​

总结 ​

线性回归的从零开始实现 ​

构造人造数据集 ​

定义 data_iter 函数 ​

线性回归的原理

房价预测

线性模型

衡量预估质量

训练数据

显示解

基础优化方法

梯度下降

小批量随机梯度下降

总结

线性回归的从零开始实现

构造人造数据集

定义 `data_iter` 函数