Минимизация рисков банкротства и эксперимент лаборатории BILAB


АПК

Введение

Точное прогнозирование продаж - важный и недорогой способ увеличения прибыли, который также позволяет снижать влияние рисков на основные процессы, происходящие внутри агропромышленных компаний.

Именно это сподвигло лабораторию "Бизнес-Аналитики" BILAB на эксперимент, в результате которого мы сможем определить лучший метод машинного обучения из наиболее распространенных методов для построения прогноза продаж.

Наш эксперимент

Методы прогнозирования, которые используются в наше время на предприятиях, требует больших временных затрат, ведь необходимо проводить рыночное тестирование и анализ спроса, на которые у ответственного за это работника предприятия уходит до одной рабочей недели.

Мы предположили, что использование разработанного нами метода анализа позволит снизить время, затрачиваемое на прогнозирование продаж по сравнению с методами, применяемыми в сельском хозяйстве в настоящий момент, и при этом не потеряв точности прогнозов.

Также мы решили проверить, будет ли нам достаточно для построения прогноза значений трех влияющих факторов (температуры, количества осадков и стоимости).

По результатам построенного прогноза откроется возможность моделирования наиболее благоприятной среды для производства и распространения товаров, а это позволяет увеличить прибыль.

Что такое АПК?

Агропромышленный комплекс (АПК) объединяет все отрасли хозяйства, которые принимают участие в производстве, переработке и доведении до потребителя сельскохозяйственной продукции.

К АПК развитых стран можно отнести крупные товарные хозяйства (плантации, фермы и т. д.), которые в максимальной степени используют современные средства производства от поля до хранения, переработки и расфасовки готовой продукции.

Вид АПК

Это только часть списка доступных источников.

Процессы, протекающие внутри агропромышленных компаний производят большие объемы данных (затраты на закупки, проведение полевых работ, доходы от продаж и многие др.) Эти данные можно использовать для анализа и прогнозирования, которые помогут минимизировать риски банкротства, повысить эффективность бизнес-процессов агропромышленных компаний и снизить расходы на материалы и выполнение полевых работ.

Выбранные методы прогнозирования

Существующие исследования в данной сфере выделяют несколько наиболее эффективных и точных методов. Из них мы выбрали три наиболее распространенных: нейронная сеть, метод линейной регрессии и метод случайных лесов.

Для ознакомления с указанными методами можно перейти по ссылкам и почитать подробнее.

Наши критерии идентификации модели

Для нашего эксперимента мы выбрали 3 критерия:

MAPE — «Mean Absolute Percentage Error» — Средняя абсолютная процентная ошибка: это коэффициент, не имеющий размерности, с очень простой интерпретацией. Его можно измерять в долях или процентах.

ME – «Mean Error» – Средняя ошибка, найденная путем взятия среднего значения положительных и отрицательных ошибок без учета знака.

RMSE –«Root Mean Squared Error» – Корень из средней квадратичной ошибки. Иногда бывает, что в результате использования этого критерия предпочтение отдаётся менее точным моделям, но при этом не допустившим ни одной большой ошибки.

Обучающая выборка

Мы взяли данные продаж подсолнечника за каждый месяц в течении 5 лет (с 2013 по 2017 год). Эта выборка содержит 60 записей, каждая из них содержит следующую информацию:

- стоимость одного килограмма подсолнечника (Cost)

- количество центнеров подсолнечника, полученных с гектара (урожайность, Crop)

- данные о средней месячной температуре (Temp)

- количество осадков (Rain)

- количество осадков (Rain)

В месяцы, когда продажи не производились, значения количества продаж и стоимости одного килограмма продукта будут 0 рублей.

На следующем рисунке можно посмотреть на фрагмент обучающей выборки.

Временной ряд

Специально для проведения нашего эксперимента и прогнозирования продаж посевных культур команда лаборатории "Бизнес-Аналитики" BILAB разработала приложение. На вход оно получает файл с расширением *.csv и указанный метод прогнозирования. На основе этого формируется обучающая и тестовая выборки.

Какой результат мы получили?

Для наглядного сравнения ниже показаны результаты построения прогнозов со всеми доступными влияющими факторами (урожайности, температуры, количества осадков и стоимости) тремя методами, которые мы выбрали ранее.

1) Нейронная сеть

11

2) Метод линейной регрессии

12

3) Метод случайных лесов

13

А далее показаны результаты построения прогнозов с тремя влияющими факторами (температуры, количества осадков и стоимости) теми же тремя методами.

1) Нейронная сеть

14

2) Метод линейной регрессии

15

3) Метод случайных лесов

16

Проанализировав полученные результаты можно отметить, что вероятность ошибки (MAPE) для обоих экспериментов довольно высока, независимо от использованного метода, а среднеквадратичная ошибка (RMSE) в лучшем случае составляет около 50% от среднего значения объема продаж (при построении модели с помощью случайных лесов). Но можно заметить, что тенденции роста и падения продаж модель улавливает достаточно точно.

В результате нашего сравнения, наиболее эффективным оказался метод случайных лесов, его вероятность ошибки составила около 60%. Чуть менее точным оказался метод линейной регрессии. И наименьшей точностью обладает модель, построенная с помощью нейронной сети. Возможно, объема выборки было недостаточно для эффективного использования этого метода.

Заключение

Для того, чтобы узнать, подтвердилась ли наша гипотеза о сокращении времени на прогнозирование продаж без потери точности, на одном из агропромышленных предприятий Волгоградской области с 6500 гектарами посевных площадей был проведен эксперимент по сравнению результатов прогнозов продаж и времени, затраченного на прогнозирование.

Состоятельность нашего предположения полностью подтвердилась экспертным мнением ключевых руководителей агропромышленных предприятий Волгоградской области.

Но мы пришли к выводу, что значений трех влияющих факторов (температуры, количества осадков и стоимости) достаточно для построения прогноза только методом случайных лесов.

Таким образом у нас появилась возможность моделирования наиболее благоприятной среды для производства и распространения товаров, что позволяет увеличить прибыль и помогает минимизировать риски банкротства.