Обмен технологиями

Модель логистической регрессии (не проблема регрессии, а проблема бинарной классификации)

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

1. Функция активации сигмовидной кишки:

Сигмовидная функция — важная функция активации для построения модели логистической регрессии, как показано на рисунке ниже.
Вставьте сюда описание изображения

  • дваЦель задачи классификации — контролировать выходные данные модели в диапазоне [0,1], когда выходной результат модели <0,5, результат прогнозирования по умолчанию равен 0, когда выходной результат модели >0,5, результат прогнозирования по умолчанию равен 1;
  • Идея решения проблемы бинарной классификации состоит в том, чтобы сопоставить входные данные x задачи бинарной классификации с входными данными z сигмоидальной функции путем построения модели логистической регрессии f для расчета выходного сигнала g, а затем получения результата модели логистической регрессии. на основе диапазона g (если он больше 0,5) (то есть результат задачи двух классификаций).
  • Область определения функции € R, диапазон значений € [0,1], когдаВведите г<0Когда функция SogmoidВыходной результат g<0,5,По умолчаниюРезультат 0, представляют собойПервая категория задачи бинарной классификации .когдаВведите z>0Когда функция SogmoidВыходной результат g>0,5,По умолчаниюРезультат: 1, представляют собойВторая категория проблемы бинарной классификации

2. Введение в логистическую регрессию:

Логистическая регрессия используется для решенияДве проблемы классификации . Для задач классификации существует только ограниченное количество выходных результатов модели (для задач регрессии их бесконечно).В задаче бинарной классификации есть только два выходных результата модели.

В классическом случае задачи регрессии «Случай прогнозирования опухоли» признак размера опухоли используется для прогнозирования того, является ли опухоль злокачественной. Существует только два выходных результата: да (1) или нет (0).
Вставьте сюда описание изображения
В настоящее время сложно подобрать обучающий набор с помощью модели линейной регрессии.(Линейная регрессия решает проблему регрессии, в то время как случай прогнозирования опухоли представляет собой проблему классификации или, если быть точным, проблему бинарной классификации), поэтому была предложена идея логистической регрессии.
Вставьте сюда описание изображения
Модель логистической регрессии (решение задач классификации): введите признак или набор признаков X и выведите число от 0 до 1. , где аппроксимационная кривая строится через функцию Согмоида. Конкретный процесс строительства выглядит следующим образом:
Вставьте сюда описание изображения
Вставьте сюда описание изображения

  • Первая строка объясняет:Модель логистической регрессии fПостройте синлинейную регрессию поВходной набор функций X и выходной результат прогнозирования f, разница в том, чтодиапазон значений fε[0,1]
  • Объяснение второй, третьей и четвертой строк: Ранее мы представили, что выходные данные g сигмоидальной функции могут очень хорошо решить проблему двух классификаций, поэтому мы ловко использовали сигмовидную функцию для построения модели логистической регрессии f для решения двух- проблема классификации.Сопоставьте входной набор объектов X с входом z сигмоидальной функции, используя линейную регрессию или полиномиальную регрессию.Реализовать вывод сигмоидальной функцииЗатем вычислите выходной сигнал f (0 или 1) модели логистической регрессии на основе того, превышает ли выходной результат сигмоидальной функции 0,5., получите результат задачи двух классификаций.
  • Пояснение пятой строки: приведенные выше идеи можно объединить для получения модели логистической регрессии f, в которой входными данными модели является набор признаков X, а выходными данными является прогнозируемый результат классификации 0 или 1.
  • Пояснение к шестой строке: Когда выходной результат модели логистической регрессии больше или равен 0,5, прогнозируемое значение y^ равно 1, что означает, что опухоль является злокачественной опухолью в приведенном выше примере, когда выходной результат: модель логистической регрессии меньше или равна 0,5. Прогнозируемое значение равно 0, что означает, что опухоль не является злокачественной, используя приведенный выше пример.

3. Границы принятия решений

Из вышесказанного нетрудно получить, что когда входной сигнал z сигмоидальной функции больше или равен 0, то есть когда отображение z=wx+b набора признаков X в z больше или равно 0, выходной результат модели равен 1; когда входное значение z сигмоидальной функции меньше 0, то есть когда отображение z=wx+b из набора функций X в z меньше 0, выходной результат модели 0.
Это концепция, с помощью которой мы можем определить границы решений:Уравнение, которое делает отображение входа модели X на вход z сигмоидальной функции равным 0, называется границей решения.

Если взять в качестве примера приведенную выше модель прогнозирования опухоли, отображение входных данных модели X на входные данные сигмовидной функции z равно z=wx+b, тогда граница принятия решения равна wx+b=0.

Давайте воспользуемся изображением, чтобы проиллюстрировать значение границы решения:

  • пример 1:преобразовать в линейную функцию
    Вставьте сюда описание изображения
    На рисунке выше показано истинное значение метки, когда признаки x1 и x2 в обучающем наборе имеют разные значения. Круг представляет результат классификации выборки как 0, а крестик представляет результат классификации выборки как 1.

    Модель логистической регрессии показана выше, где отображение входных данных модели X на входные данные сигмовидной функции z равно z=w1x1+w2x2+b, а граница решения равна w1x1+w2x2+b=0. Если результаты обучения модели w1=1, w2=1, b=-3, граница решения равна x1+x2-3=0, а образ функции границы решения такой, как показано на рисунке выше:Видно, что если характеристики выборки расположены с левой стороны границы решения, прогноз логистической регрессии равен 0, в противном случае — 1. Это значение изображения границы решения.

  • Пример 2:Сопоставить полиномиальную функцию
    Вставьте сюда описание изображения
    Сопоставление входных данных моделиПоложение характеристик выборки относительно границы решения определяет результат прогнозирования выборки.

4. Процесс обучения модели логистической регрессии:

По сути, это то же самое, что и процесс обучения линейной регрессии, за исключением того, что обучаемая модель (функция) отличается.

1. Цели обучения:

Вставьте сюда описание изображения

2. Параметры регулировки градиентного спуска:

Вставьте сюда описание изображения