🗎 Сравнение регрессионных моделей

О среде выполнения

Данная расчётно-графическая работа выполняется в программной среде Jupyter Notebook. Если у Вас на компьютере нет установленной вычислительной среды, см. Выполнение расчетно-графических работ онлайн.

В этой работе Вы должны продемонстрировать умение рассчитывать линейные регрессионные модели и сравнивать их между собой.

Задание: представить отчет о сравнении нескольких регрессионных моделей, различающихся по 1-2 условиям.

В качестве уникального для каждого студента источника данных предлагается использовать результаты самотестирования с помощью теста «Баланс внимания».

Поощряется использование данных из собственного научного проекта. При использовании собственных данных необходимо проконсультироваться с преподавателем по поводу соответствия требованиям к работе.

Требования к данным

  1. Две или более подвыборки с количеством значений не менее 15 в каждой.

  2. Наличие независимой переменной, которая приводит к линейному или логарифмическому росту зависимой переменной.

Требования к отчету

В отчете должны быть:

  1. Указание на источник данных с описанием условий получения.

  2. Визуализация линий регрессии двух или более выборок.

  3. Расчет коэффициента детерминации (\(R^2\)).

Все этапы расчетов должны сопровождаться наглядными иллюстрациями и пояснениями.

В качестве шаблона для отчета рекомендуется использовать блокнот из предыдущей самостоятельной работы.

Про коэффициент детерминации

Для расчёта нужно найти дисперсию данных и дисперсию остатков.

\[R^2 = 1 - \frac{\sigma_r^2}{\sigma^2}\]

Поскольку обе дисперсии при рассчете делятся на одно и то же n, то можно поделить сумму квадратов разницы с модельными значениями на сумму квадратов разницы со средним.

\[R^2 = 1 - \frac{sum((y-\hat{y})^2)}{sum((y-\bar{y})^2)} = corrcoef(x, y)^2\]

Побробное описание см. в Википедии и сайте Машинное обучение

В конце отчета по расчётно-графической работе обязательно сделайте вывод.

  1. Основной результат. Прежде всего в выводе должен прозвучать ответ на поставленный вопрос. Что было целью работы, то и должно быть указано в выводе с конкретным числовым результатом.

  2. Ограничения данной работы. Если в ходе работе были выявлены новые обстоятельства, которые привели к изменению хода работы, к ошибкам, к необходимости переосмысления возможности ее выполнения, то эти соображения надо изложить во вторую очередь.

  3. Педагогические и эмоциональные замечания. Поскольку эта работа учебная, то можно поделиться впечатлениями от самого процесса решения задачи. Что было сложным, что особенно понравилось, что оказалось удивительным и неожиданным.