Deep LearningDeepLearning Notas de estudo de regressão linear múltipla

2024-07-12

Diretório de artigos

- Recursos multidimensionais

Recursos multidimensionais

Variáveis e Termos

Atributo de coluna x_eu	Número de atributos n	$x$ ^(eu)vetor de linha	um determinado valor $vec{x}_j^i$ Para cima e para baixo
significa μ	estandardização	Desvio padrão σ	sigma (σ)

Fórmula

$c$ = [em₁ c₂ c₃ …]
$x$ = [x₁ x₂ x₃ …]

$f_{vec{w},b} (vec{x}) = vec{w} * vec{x} + b = w_1x_1 + w_2x_2 + … + w _nx_n + b$

Regressão linear múltipla

import numpy
f = np.dot(w, x) + b
1
2

Nota: É muito rápido quando n é grande (processamento paralelo)

método de equação normal

Mais de 1000 é ineficiente
Não pode ser generalizado para outros algoritmos, como regressão logística, redes neurais ou outros.
sem iteração

$w_n = w_n - αdfrac{1}{m} somalimits_{i=1}^mf_{vec{w},b}(vec{x}^{(i)}-y^{(i)})x_n^{(i)}$

$α{dfrac{1}{m}}somalimites_{i=1}^m(f_{vec{w},b}(vec{x}^{(i)}-y^{(i)})$

O peso correspondente a uma gama maior de variáveis independentes tende a ser menor, e o peso correspondente a uma gama menor de variáveis independentes tende a ser maior.

Normalização média

Divida pelo valor máximo do intervalo para encontrar o peso versus [0, 1] da variável independente

Abscissa: $x_1 = dfrac{x_1-μ_1}{2000-300}$ Eixo Y: $x_2 = dfrac{x_2 - μ_2}{5-0}$

$x_1le0,82$ $x_2le0,54$

Normalização do escore Z

$x_1le2000$ $x_2le5$

$dfrac{x_1-μ_1}{σ_1}$ $x_1le3,1$

Tente manter os valores de todos os recursos dentro de uma faixa semelhante por meio de escalonamento, para que o impacto de suas alterações nos valores previstos seja próximo de (-3,3)

Se a função de custo J ficar grande, significa que o tamanho do passo (taxa de aprendizagem) é inadequado ou o código está errado.

Insira a descrição da imagem aqui

Nota: O número de iterações varia de máquina para máquina

Além de desenhar curvas para determinar o ponto de iteração, o teste automático de convergência também pode ser usado
Seja ε igual $10^{-3}$ , se a diminuição de J for menor que este pequeno número, é considerado convergido.

Defina uma taxa de aprendizagem apropriada

Ao testar, você pode definir um valor muito pequeno para ver se J diminui.
A taxa de aprendizagem durante a iteração não deve ser muito grande ou muito pequena.
Cada vez *3 durante o teste, escolha uma taxa de aprendizado tão grande quanto possível ou um pouco menor que um valor razoável

Engenharia de recursos

Crie engenharia de recursos por meio de transformação ou combinação para oferecer mais opções

$f_{vec{w},b}(vec{x}) = w_1x_1+w_2x_2+w_3x_3+b$

Nota: A regressão polinomial pode ser usada para ajuste linear e não linear

Compartilhamento de tecnologia