- Машинное обучение
- Основы машинного обучения
- Цели машинного обучения
- Сфера применения
- Виды машинного обучения
- Классы задач машинного обучения
- Машинное обучение и разработчики
- Бизнес-цель машинного обучения — моделирование жизненного цикла заказчика
- Моделирование оттока заказчиков с помощью машинного обучения
Отличным примером модели, прошедшей обучение, является нейронная сеть Deep Q от Google. Это побеждало людей во многих старых видеоиграх. После длительного обучения модель обучается соответствующим стратегиям поведения, которые приводят к победе.
Машинное обучение
Машинное обучение — что это такое? Машинное обучение относится к приложениям искусственного интеллекта. Это TN, которая может автоматически учиться и совершенствоваться на основе опыта без явного планирования. Машинное обучение приводит к расширению анализа полученных данных. Таким образом, основной алгоритм остается неизменным, но внутренний код, используемый для выбора конкретных ответов, изменился.
Специалисты по исследованию данных называют алгоритмом технологию, используемую для реализации машинного обучения. Алгоритм — это шаг-действие, обычно в виде серии вычислительных шагов, который решает определенную проблему за конечное число шагов. В машинном обучении алгоритм решает проблему путем обучения на основе поступающих данных с помощью серии конечных шагов.
Основы машинного обучения
Часто бывает трудно найти точное значение термина «обучение». Это связано с тем, что существуют различные способы извлечения информации из данных, в зависимости от того, как составлен алгоритм машинного обучения. Как правило, процесс обучения требует огромного количества данных для получения ожидаемого ответа при определенном входе. Каждая пара «вход-ответ» представляет собой пример, и дополнительные примеры облегчают работу алгоритма. Они могут быть сопоставлены со строками, кластерами или другими статистическими представлениями, определяющими нужное поле.
Машинное обучение основано на принципе оптимизации модели, которая представляет собой математически общее представление самих данных для предсказания соответствующего ответа. Даже если ТН получает данные, которые он раньше не видел. Чем точнее модель может дать правильный ответ, тем лучше она учится на представленных исходных данных. Алгоритм адаптирует модель к данным, и этот процесс называется обучением.
Возьмем простой график, который имитирует то, что происходит в машинном обучении. В данном случае, начиная со значений входа 1, 4, 5, 8 и 10 и сопоставляя их с соответствующими значениями выхода 7, 13, 15, 21 и 25, алгоритм машинного обучения решает, что это лучший путь вперед. Представление взаимосвязи между входами и выходами определяется одним типом. Исходя из данных, это 2x + 5 — каждая пара вписывается в него. Так, например, 4×2 + 5 = 13, 5×2 + 5 = 15 и т.д.
Этот тип используется для определения модели (новой или невидимой), которая используется для обработки всех входных данных и расчета соответствующих выходных значений. Эта модель использует шаблон, сгенерированный алгоритмом, так что новый ввод числа 3 дает предполагаемый результат 11 = 2×3 + 5.
Большинство сценариев механического обучения гораздо сложнее, чем этот, но этот пример дает общее представление о происходящем. Вместо того чтобы отдельно планировать ответы для входа 3, TN может рассчитать правильный ответ на основе уже выученных пар входных ответов.
Цели машинного обучения
Основная цель машинного обучения заключается в том, что алгоритмы могут представлять реальность с помощью математических функций, которые не известны априори, но всегда могут быть определены в виде пар вход-выход после изучения данных. Другими словами, каждый алгоритм машинного обучения основан на математической функции, которую можно изменять. Функция может быть изменена — в результате искусственный интеллект может адаптировать ее к конкретной информации, которую он получает из данных. Эта концепция является основной идеей, лежащей в основе всех типов алгоритмов машинного обучения.
Машинное обучение является чисто математическим по своей природе и предполагает связывание конкретных входных данных с конкретными выходными данными. Оно не имеет ничего общего с обучением в том смысле, в котором его воспринимают люди. Этот процесс часто называют обучением. Это происходит потому, что алгоритм обучен выбирать правильный ответ (выход) для каждого предложенного вопроса, т.е. входных данных.
Несмотря на отсутствие осознанного понимания и тот факт, что машинное обучение — это математический процесс, оно может быть полезно для решения многих задач. Искусственный интеллект позволяет многим приложениям и программам имитировать логическое мышление в конкретном контексте, в котором происходит обучение, используя соответствующие данные.
Этот гибкий подход требует наличия подходящих стратегий машинного обучения и больших объемов данных о готовности клиентов платить установленную цену в той или иной ситуации. Разработать модели динамического ценообразования непросто, но авиакомпании и транспортные службы успешно используют их для повышения своей прибыли.
Сфера применения
Мы рассмотрели машинное обучение — что оно означает. Затем мы рассмотрели, почему МО используются в бизнесе и в жизни.
Спросите любого, кто увлекается робототехникой, о масштабах машинного обучения. Вы услышите много замечательных историй. Например, роботов можно обучить выполнять человеческие задачи. Для добычи полезных ископаемых из недр Земли, разработки нефтяных скважин и источников природного газа, исследования морского дна, тушения пожаров и т.д. Разработчикам не нужно создавать громоздкие, сложные программы, боясь ошибиться в коде. Роботы, благодаря МО, учатся действовать в конкретных ситуациях на основе анализа данных.
Великолепно, но пока отлично. В будущем, даже в не слишком отдаленном будущем, это станет реальностью.
Что сейчас могут сделать искусственный интеллект и машинное обучение? Сегодня технологии все чаще используются в маркетинговых целях. Например, Google и Яндекс используют искусственный интеллект для показа релевантных объявлений пользователям. Замечали ли вы когда-нибудь, что после поиска в интернете интересующего вас товара, похожие предложения появляются в течение нескольких часов или дней?
Смарт-ленты в социальных сетях основаны на том же принципе. Аналитические системы на FB, VK, Instagram и Twitter изучают ваши интересы. То есть, к каким постам вы часто обращаетесь, на какие клики вы нажимаете, к каким группам и аудиториям обращаетесь и т.д. Чем чаще вы активны в социальных сетях, тем более персонализированным становится ваш поток новостей. Это может быть как хорошо, так и плохо. С одной стороны, камера выхватывает ряд безразличной (по ее мнению) информации, а с другой — ограничивает ваш кругозор. Маркетинг — это не личное!
Машинное обучение используется в структурах безопасности. Примером может служить система распознавания лиц в метро. Камеры сканируют лица людей, входящих и выходящих из метро. Анализирующая камера сравнивает изображения с разыскиваемыми лицами. Если сходство высокое, система подает сигнал. Полицейский отправляется на опознание конкретного человека.
Искусственный интеллект уже применяется в медицинских учреждениях. Примеры включают обработку данных о пациенте, предварительную диагностику и даже подбор индивидуального лечения на основе информации о болезни человека.
Виды машинного обучения
Методы машинного обучения — это ряд задач, направленных на проверку гипотез и использование искусственного интеллекта для поиска наилучшего решения. Существует три области
- Обучение с учителем (supervised learning). В этом случае в аналитическую систему загружается массив данных по конкретной задаче и задается направление – цель анализа. Как правило, нужно предсказать что-либо или проверить какую-либо гипотезу.Например, у нас есть данные о доходах интернет-магазина за полгода работы. Мы знаем, сколько продано товаров, сколько потрачено денег на привлечение клиентов, ROI, средний чек, количество кликов, отказов и другие метрики. Задача машины проанализировать весь массив данных и выдать прогноз дохода на предстоящий период – месяц, квартал, полгода или год. Это регрессивный метод решения задач. Другой пример. На основе массива данных, критериев выборки нужно определить является ли текст письма на электронную почту спамом. Или, имея данные успеваемости школьников по предметам, зная их IQ по тестам, пол и возраст, нужно помочь выпускникам определиться с профориентацией. Аналитическая машина выискивает и проверяет общие черты, сравнивает и классифицирует результаты тестов, оценки по школьной программе, склад ума. На основе данных делает прогноз. Это задачи классификации.
- Обучение без учителя (unsupervised learning). Обучение строится на том, что человеку и программе неизвестны правильные ответы заранее, имеется только некий массив данных. Аналитическая машина, обрабатывая информацию, сама ищет взаимосвязи. Зачастую на выходе имеем неочевидные решения.Например, мы знаем данные о весе, росте и типе телосложения 10 000 потенциальных покупателей джемперов определенного фасона. Загружаем информацию в машину, чтобы разбить клиентов по кластерам в соответствии с имеющимися данными. В результате мы получим несколько категорий людей со схожими характеристиками, чтобы для них выпустить джемпер нужного фасона. Это задачи кластеризации. Другой пример. Чтобы описать какое-либо явление приходится задействовать 200-300 характеристик. Соответственно визуализировать такие данные крайне сложно, а разобраться в них просто невозможно. Аналитическая система получает задание обработать массив характеристик и выбрать схожие, то есть сжать данные до 2-5-10 характеристик. Это задачи уменьшения размерности.
- Глубокое обучение (Deep learning). Глубокое машинное обучение – это обязательно анализ «Больших данных» – Big Data. То есть одним компьютером, одной программой переработать столько информации просто невозможно. Поэтому используются нейронные сети. Суть такого обучения в том, что огромное поле информации разделяется на небольшие сегменты данных, обработка которых делегируется другим устройствам. Например, один процессор только собирает информацию по задаче и передает дальше, четыре других процессора анализируют собранные данные и передают результаты дальше. Следующие в цепочке процессоры ищут решения.Например, система распознавания объектов работает по принципу нейросети. Сначала фотографируется объект целиком (получение графической информации), потом система разбивает данные на точки, находит линии из этих точек, строит из линий простые фигуры, а из них – сложные двумерные и далее 3D-объекты.
Классы задач машинного обучения
Обобщение задач искусственного интеллекта:.
- Регрессия. На основании массива признаков или характеристик предсказать вещественный результат. То есть машина должна выдать конкретную цифру. Например, предсказать стоимость акций на бирже, количество запросов по ключевому слову, бюджет контекстной рекламы и другое.
- Классификация. Задача определить по количеству и качеству признаков, характеристик категорию объекта. Например, распознать по снимку конкретного человека в розыске, имея только описания на словах, определить спам, выявить болезнь у пациента.
- Кластеризация. Данные разбиваются на похожие категории. Например, космические объекты относят в конкретные категории по схожим признакам (удаленность, размер, планета или звезда и другие).
- Уменьшение размерности. Сжатие массива характеристик объекта до меньшего количества признаков для дальнейшей визуализации или использования в работе. Например, сжатие массива данных в архивы для передачи по сети.
«Умная» камера на базе микрокомпьютера Raspberry Pi 3B + научилась распознавать улыбку, делать фото в этот момент и выполнять голосовые команды с помощью каркаса TensorFlow Light.
Машинное обучение и разработчики
Приступая к машинному обучению, разработчики полагаются на свои знания статистики, теории вероятности и математического анализа, чтобы успешно создавать модели, которые могут обучаться с течением времени. Если разработчики обладают необходимыми навыками в этих областях, они без проблем освоят инструменты, которые многие другие программисты используют для обучения современных алгоритмов ML. Разработчики также могут решить, нужно ли следить за алгоритмами. Разработчик может принимать решения по проекту, предварительно конфигурировать модель, а затем позволить модели обучаться без участия разработчика.
Часто бывает трудно провести границу между программистами и специалистами по анализу данных. Разработчики могут синтезировать данные на основе моделей машинного обучения, а специалисты по исследованию данных могут заниматься разработкой решений для конечных пользователей. Сотрудничество между этими двумя дисциплинами может повысить ценность и полезность проектов машинного обучения.
Бизнес-цель машинного обучения — моделирование жизненного цикла заказчика
Моделирование стоимости цикла обслуживания клиентов имеет решающее значение не только для компаний, занимающихся онлайн-продажами, но и для организаций других отраслей. В этом сценарии применения машинное обучение используется для поиска, обучения и удержания наиболее ценных клиентов. Модель ценности дает возможность анализировать большие объемы данных о потребителях и выявлять клиентов, которые являются наиболее прибыльными и наиболее активными приверженцами бренда, объединяя эти две функции.
Модели стоимости цикла обслуживания клиентов особенно эффективны при прогнозировании будущей прибыли, которую отдельные клиенты будут получать в течение определенного периода времени в будущем. Эта информация помогает сосредоточить маркетинговые усилия на наиболее ценных клиентах и побуждает их чаще взаимодействовать с брендом. Модель ценности цикла обслуживания клиентов также повышает эффективность таргетинга и, соответственно, привлечения новых ценных клиентов.
Моделирование оттока заказчиков с помощью машинного обучения
Привлечение новых клиентов обходится дороже и требует больше времени, чем поддержание удовлетворенности и лояльности существующих клиентов. Моделирование может помочь определить клиентов, которые могут уйти, и причины их ухода.
Эффективное моделирование использует алгоритмы машинного обучения для оценки и классификации всех факторов, от индивидуальных показателей риска клиента до причин ухода. Полученные данные играют важную роль в разработке стратегий сохранения природы.
Детальный анализ причин удаления клиентов может помочь в разработке скидок, кампаний по электронной почте и других маркетинговых мероприятий для удержания ценных клиентов.
Современные потребители имеют доступ к беспрецедентному ассортименту товаров и услуг и специальным инструментам, позволяющим мгновенно сравнивать цены. Динамическое ценообразование или, как его еще называют, ценообразование по спросу, помогает вам реагировать на тенденции рынка. Это позволяет взимать плату за продукты в соответствии с уровнем интереса аудитории, спросом в точке покупки и спросом на участие клиентов в маркетинговых кампаниях.
Этот гибкий подход требует наличия подходящих стратегий машинного обучения и больших объемов данных о готовности клиентов платить установленную цену в той или иной ситуации. Разработать модели динамического ценообразования непросто, но авиакомпании и транспортные службы успешно используют их для повышения своей прибыли.