技術共有

ロジスティック回帰モデル (回帰問題ではなく、二値分類問題)

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

1. シグモイド活性化関数:

シグモイド関数は、次の図に示すように、ロジスティック回帰モデルを構築するための重要な活性化関数です。
ここに画像の説明を挿入します

  • 分類問題の目標は、モデルの出力を [0,1] の範囲内で制御することです。、モデルの出力結果が <0.5 の場合、デフォルトの予測結果は 0 です。モデルの出力結果が >0.5 の場合、デフォルトの予測結果は 1 です。
  • バイナリ分類問題を解決するアイデアは、ロジスティック回帰モデル f を構築して出力 g を計算し、ロジスティック回帰モデルの結果を取得することにより、バイナリ分類問題の入力 x をシグモイド関数の入力 z にマッピングすることです。 g の範囲 (0.5 より大きいかどうか) に基づきます (つまり、2 分類問題の結果)。
  • 関数の定義域 ∈ R、値の範囲 ∈ [0,1] の場合、z<0 と入力してくださいソグモイド関数の場合出力結果 g<0.5,デフォルトは結果は0です、構成する二値分類問題の最初のカテゴリ 。いつz>0 と入力してくださいソグモイド関数の場合出力結果 g>0.5,デフォルトは結果は 1、構成する二値分類問題の 2 番目のカテゴリ

2. ロジスティック回帰の概要:

ロジスティック回帰を使用して解決します2 分類問題 。分類問題の場合、モデルからの出力結果の数は限られています (回帰問題の場合、出力結果は無限にあります)。二項分類問題では、モデルの出力結果は 2 つだけです。

回帰問題の古典的なケースである「腫瘍予測ケース」では、腫瘍が悪性腫瘍であるかどうかを予測するために腫瘍サイズ特徴が使用されます。出力結果は 2 つだけです: はい (1) またはいいえ (0)。
ここに画像の説明を挿入します
現時点では、線形回帰モデルを使用してトレーニング セットを適合させることは困難です。(線形回帰は回帰問題を解決しますが、腫瘍予測のケースは分類問題、または正確には二項分類問題です), そこでロジスティック回帰という考え方が提案されました。
ここに画像の説明を挿入します
ロジスティック回帰モデル (分類問題を解決): 特徴または特徴セット X を入力し、0 から 1 までの数値を出力します。ここで、フィッティング曲線はソグモイド関数を通じて構築されます。具体的な施工手順は以下の通りです。
ここに画像の説明を挿入します
ここに画像の説明を挿入します

  • 最初の行では次のように説明されています。ロジスティック回帰モデルf次のようにして共線形回帰を構築します。特徴集合 X を入力し、予測結果 f を出力、違いはそれですf値の範囲∈[0,1]
  • 2 行目、3 行目、4 行目の説明: 以前、シグモイド関数の出力 g が 2 分類問題を非常にうまく解決できることを紹介しました。そこで、シグモイド関数を巧みに使用して、2 つの分類問題を解決するためのロジスティック回帰モデル f を構築しました。分類の問題。線形回帰または多項式回帰を使用して、入力特徴セット X をシグモイド関数の入力 z にマッピングします。シグモイド関数の出力を実装する次に、シグモイド関数の出力結果が 0.5 より大きいかどうかに基づいて、ロジスティック回帰モデルの出力 f (0 または 1) を計算します。、2 分類問題の結果を取得します。
  • 5 行目の説明: 上記のアイデアを統合してロジスティック回帰モデル f を取得できます。モデルの入力は特徴セット X で、出力は分類 0 または 1 の予測結果です。
  • 6行目の説明:ロジスティック回帰モデルの出力結果が0.5以上の場合、予測値y^は1となり、上記の例では、腫瘍が悪性腫瘍であることを意味します。ロジスティック回帰モデルは 0.5 以下です。予測値は 0 です。これは、上記の例を使用すると、腫瘍が悪性ではないことを意味します。

3. 意思決定の境界線

上記のことから、シグモイド関数の入力 z が 0 以上であること、つまり、特徴セット X の z へのマッピング z=wx+b が以下であることを理解するのは難しくありません。 0、モデルの出力結果は 1、シグモイド関数の入力 z が 0 より小さい場合、つまり、特徴セット X から z へのマッピング z=wx+b が 0 より小さい場合、出力結果は 1 です。モデルの値は 0 です。
これは、決定の境界を考えるための概念です。モデル入力 X のシグモイド関数入力 z へのマッピングを 0 に等しくする方程式は、決定境界と呼ばれます。

上記の腫瘍予測モデルを例にとると、モデル入力 X からシグモイド関数入力 z へのマッピングは z=wx+b であり、決定境界は wx+b=0 になります。

画像を使用して決定境界の意味を説明してみましょう。

  • 例1:一次関数へのマッピング
    ここに画像の説明を挿入します
    上の図は、トレーニング セット内の特徴 x1 と x2 が異なる値を持つ場合のラベルの真の値を示しています。丸はサンプルの分類結果を 0 として表し、バツはサンプルの分類結果を 1 として表します。

    ロジスティック回帰モデルは上に示したとおりです。モデル入力 X からシグモイド関数入力 z へのマッピングは z=w1x1+w2x2+b で、決定境界は w1x1+w2x2+b=0 です。モデルの学習結果が w1=1、w2=1、b=-3 の場合、決定境界は x1+x2-3=0 となり、決定境界の関数イメージは上図のようになります。サンプルの特性が決定境界の左側に位置する場合、ロジスティック回帰予測は 0 であり、それ以外の場合は 1 であることがわかります。これが決定境界のイメージ的な意味です。

  • 例 2:多項式関数へのマッピング
    ここに画像の説明を挿入します
    モデル入力からのマッピング決定境界に対するサンプルの特性の位置によって、サンプルの予測結果が決まります。

4. ロジスティック回帰モデルのトレーニング プロセス:

実際には、学習するモデル (関数) が異なることを除いて、線形回帰学習プロセスと同じです。

1. トレーニングの目的:

ここに画像の説明を挿入します

2. 勾配降下調整パラメータ:

ここに画像の説明を挿入します