기술나눔

로지스틱 회귀 모델(회귀 문제가 아니라 이진 분류 문제)

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

1. 시그모이드 활성화 기능:

시그모이드 함수는 아래 그림과 같이 로지스틱 회귀 모델을 구축하는 데 중요한 활성화 함수입니다.
여기에 이미지 설명을 삽입하세요.

  • 분류 문제의 목표는 모델의 출력을 [0,1] 범위 내에서 제어하는 ​​것입니다., 모델 출력 결과가 <0.5이면 기본 예측 결과는 0이고, 모델 출력 결과가 >0.5이면 기본 예측 결과는 1입니다.
  • 이진 분류 문제를 해결하는 아이디어는 로지스틱 회귀 모델 f를 구성하여 이진 분류 문제의 입력 x를 시그모이드 함수의 입력 z에 매핑하여 출력 g를 계산한 후 로지스틱 회귀 모델의 결과를 얻는 것입니다. g의 범위(0.5보다 큰지 여부)를 기준으로 합니다(즉, 2분류 문제의 결과).
  • 함수의 영역 ∈ R, 값 범위 ∈ [0,1],z<0을 입력하세요언제, 소그모이드 기능출력 결과 g<0.5,기본값은결과는 0,구성하다이진 분류 문제의 첫 번째 범주 .언제z>0을 입력하세요.언제, 소그모이드 기능출력 결과 g>0.5,기본값은결과는 1,구성하다이진 분류 문제의 두 번째 범주

2. 로지스틱 회귀 소개:

로지스틱 회귀를 사용하여 문제를 해결합니다.두 가지 분류 문제 . 분류 문제의 경우 모델의 출력 결과 수가 제한되어 있습니다(회귀 문제의 경우 무한한 결과가 있음).이진 분류 문제에는 모델의 출력 결과가 두 개뿐입니다.

회귀 문제 "종양 예측 사례"의 전형적인 사례에서는 종양 크기 기능을 사용하여 종양이 악성 종양인지 여부를 예측합니다. 출력 결과는 예(1) 또는 아니오(0)입니다.
여기에 이미지 설명을 삽입하세요.
현재로서는 선형 회귀 모델을 사용하여 훈련 세트를 피팅하는 것이 어렵습니다.(선형 회귀는 회귀 문제를 해결하는 반면, 종양 예측 사례는 분류 문제, 정확하게는 이진 분류 문제입니다), 그래서 로지스틱 회귀라는 아이디어가 제안되었습니다.
여기에 이미지 설명을 삽입하세요.
로지스틱 회귀 모델(분류 문제 해결): 특성 또는 특성 세트 X를 입력하고 0과 1 사이의 숫자를 출력합니다. 여기서 피팅 곡선은 Sogmoid 함수를 통해 구성됩니다. 구체적인 건설 과정은 다음과 같습니다.
여기에 이미지 설명을 삽입하세요.
여기에 이미지 설명을 삽입하세요.

  • 첫 번째 줄은 다음을 설명합니다.로지스틱 회귀 모델 f다음을 통해 동일선형 회귀를 구성합니다.입력 특성 세트 X 및 출력 예측 결과 f, 차이점은f 값 범위∈[0,1]
  • 두 번째, 세 번째 및 네 번째 줄에 대한 설명: 이전에 우리는 Sigmoid 함수의 출력 g가 2분류 문제를 매우 잘 해결할 수 있다는 것을 소개했습니다. 분류 문제.선형 회귀 또는 다항식 회귀를 사용하여 입력 특성 세트 X를 시그모이드 함수의 입력 z에 매핑합니다.시그모이드 함수의 출력 구현그런 다음 시그모이드 함수 출력 결과가 0.5보다 큰지 여부에 따라 로지스틱 회귀 모델의 출력 f(0 또는 1)를 계산합니다., 2분류 문제의 결과를 얻습니다.
  • 다섯 번째 줄 설명: 위의 아이디어를 통합하여 로지스틱 회귀 모델 f를 얻을 수 있습니다. 여기서 모델의 입력은 특성 세트 X이고 출력은 분류 0 또는 1의 예측 결과입니다.
  • 여섯 번째 줄 설명: 로지스틱 회귀 모델의 출력 결과가 0.5 이상이면 예측 값 y^은 1입니다. 이는 위 예에서 출력 결과가 악성 종양임을 의미합니다. 로지스틱 회귀 모델이 0.5 이하이고, 예측값이 0으로 위의 예를 사용하면 종양이 악성이 아니라는 의미입니다.

3. 결정 경계

Sigmoid 함수의 입력 z가 0보다 크거나 같을 때, 즉 특성 세트 X의 z=wx+b가 z보다 크거나 같을 때 위의 내용을 통해 알아내는 것은 어렵지 않습니다. 0이면 모델의 출력 결과는 1입니다. Sigmoid 함수의 입력 z가 0보다 작을 때, 즉 특성 세트 X에서 z로의 매핑 z=wx+b가 0보다 작을 때 출력 결과는 모델의 수는 0입니다.
이것이 의사결정 경계를 생각해 낼 수 있는 개념입니다.모델 입력 X를 시그모이드 함수 입력 z에 0으로 매핑하는 방정식을 결정 경계라고 합니다.

위의 종양 예측 모델을 예로 들면 모델 입력 X에서 시그모이드 함수 입력 z로의 매핑은 z=wx+b이고 결정 경계는 wx+b=0입니다.

결정 경계의 의미를 설명하기 위해 이미지를 사용해 보겠습니다.

  • 예 1:선형 함수에 매핑
    여기에 이미지 설명을 삽입하세요.
    위 그림은 훈련 세트의 특징 x1과 x2가 서로 다른 값을 가질 때 라벨의 실제 값을 보여줍니다. 원은 샘플의 분류 결과를 0으로 나타내고, 십자가는 샘플의 분류 결과를 1로 나타냅니다.

    로지스틱 회귀 모델은 위에 표시된 것과 같습니다. 여기서 모델 입력 X에서 시그모이드 함수 입력 z로의 매핑은 z=w1x1+w2x2+b이고 결정 경계는 w1x1+w2x2+b=0입니다. 모델 훈련 결과가 w1=1, w2=1, b=-3이라면 결정 경계는 x1+x2-3=0이고, 결정 경계의 함수 이미지는 위 그림과 같으며,표본의 특성이 결정 경계의 왼쪽에 위치하면 로지스틱 회귀 예측은 0, 그렇지 않으면 1임을 알 수 있습니다. 이것이 결정 경계의 이미지 의미입니다.

  • 예 2:다항식 함수에 매핑
    여기에 이미지 설명을 삽입하세요.
    모델 입력의 매핑결정 경계에 대한 샘플 특성의 위치에 따라 샘플의 예측 결과가 결정됩니다.

4. 로지스틱 회귀 모델 학습 프로세스:

실제로 훈련할 모델(함수)이 다르다는 점만 제외하면 선형회귀 훈련 과정과 동일하다.

1. 교육 목표:

여기에 이미지 설명을 삽입하세요.

2. 경사하강법 조정 매개변수:

여기에 이미지 설명을 삽입하세요.