Виды обучения нейронных сетей

Искусственная нейронная сеть (ИНС) — математическая модель, а также её программное или аппаратное воплощение, построенная по принципу организации и функционирования биологических нейронных сетей — сетей нервных клеток живого организма.

Занимаясь оптимизацией бизнес-процессов при помощи нейронных сетей (anti-fraud системы, торговые роботы), мы можем сделать вывод, что интеграция систем с машинным обучением может значительно повысить конкурентные преимущества на рынке.

Особенностью нейронных сетей является тот факт, что они способны обучаться для повышения своей эффективности

Существует огромная масса различных нейронных сетей и видов обучения, но одними из основных подходов обучения являются:

  • Нейронные сети, обучающиеся с учителем;
  • Нейронные сети, обучающиеся без учителя.

Нейронные сети, обучающиеся с учителем

Обучение с учителем (supervised learning) предполагает наличие полного набора размеченных данных для тренировки модели на всех этапах ее построения.

Наличие полностью размеченного датасета означает, что каждому примеру в обучающем наборе соответствует ответ, который алгоритм и должен получить. Таким образом, размеченный датасет из фотографий цветов обучит нейронную сеть, где изображены розы, ромашки или нарциссы. Когда сеть получит новое фото, она сравнит его с примерами из обучающего датасета, чтобы предсказать ответ.

В основном обучение с учителем применяется для решения двух типов задач: классификации и регрессии.

В задачах классификации алгоритм предсказывает дискретные значения, соответствующие номерам классов, к которым принадлежат объекты. В обучающей выборке данных с фотографиями животных каждое изображение будет иметь соответствующую метку, например — «кошка», «коала» или «черепаха». Качество алгоритма оценивается тем, насколько точно он может правильно классифицировать новые фото с коалами и черепахами.

А вот задачи регрессии связаны с непрерывными данными. Один из примеров, линейная регрессия, вычисляет ожидаемое значение переменной y, учитывая конкретные значения x. (Кстати, говоря, методы линейной регрессии активно используются в статистике).

Более утилитарные задачи машинного обучения задействуют большое число переменных. Как пример, нейронная сеть, предсказывающая цену квартиры в городе на основе ее площади, местоположения и доступности общественного транспорта. Алгоритм выполняет работу эксперта (экспертов), который рассчитывает цену квартиры исходя из полученных данных.

Можно сделать вывод, что нейронные сети, обучающиеся с учителем, наиболее эффективны при наличии большой выборки достоверных данных.

Нейронные сети, обучающиеся без помощи учителя

Получить большой набор чистых и достоверных данных порой бывает нелегко. Поэтому перед алгоритмом встает задача найти заранее неизвестные ответы. В данной ситуации мы имеем дело с нейронными сетями, обучающимися без учителя.

В обучении без учителя у модели есть набор данных, и нет явных указаний, что с ним делать. Нейронная сеть пытается самостоятельно найти корреляции в данных, извлекая полезные признаки и анализируя их. (При написании торгового робота для инвестиционного пула проекта Range.Trade, нейронная сеть нашла массу неопознанных специалистами закономерностей между фазами рынка и показаниями пользовательских индикаторов).

Кластеризация данных на основе общих признаков

В зависимости от задачи модель систематизирует данные по-разному.

  • Кластеризация. Алгоритм находит общие признаки в выборке данных и проводит по ним разделение.
  • Обнаружение аномалий. Банки могут обнаружить мошеннические операции, выявляя необычные действия в покупательском поведении клиентов. Например, подозрительно, если одна кредитная карта используется в одном городе и через 5 минут в другом, находящемся за 3000км от первого. Примером такой системы выступают anti-fraud системы, которые мы писали для наших клиентов.
  • Ассоциации. Некоторые характеристики объекта коррелируют с другими признаками. Рассматривая пару ключевых признаков объекта, модель может предсказать другие, с которыми существует связь.
  • Автоэнкодеры. Автоэнкодеры принимают входные данные, кодируют их, а затем пытаются воссоздать начальные данные из полученного кода. Не так много реальных ситуаций, когда используют простой автоэнкодер. Но стоит добавить слои и возможности расширятся: используя зашумленные и исходные версии изображений для обучения, автоэнкодеры могут удалять шум из видеоданных, изображений или медицинских сканов, чтобы повысить качество данных.

В обучении без учителя сложно вычислить точность алгоритма, так как в данных отсутствуют «правильные ответы» или метки. Но размеченные данные часто ненадежные или их слишком дорого получить. В таких случаях, предоставляя модели свободу действий для поиска зависимостей, можно получить хорошие результаты. Мы использовали данных подход при обучении алгоритма поиска кратчайших путей, методом муравьиной оптимизации. Ради развлечения.

Для того, подходит ли данная задача под оптимизацию нейронными сетями, вы можете проконсультироваться с нами, воспользовавшись формой обратной связи.

Поделиться:

Теги:

    Сделаем это вместе -
    У вашего бизнеса есть история

    Заказ обратного звонка

    Мы перезвоним вам в течение часа или в удобное для вас время

    Live Chat
    ×