Руководитель проектов в нашей компании Евгений Щеклин написал колонку для IT-world о интересных кейсах внедрении data science-решений в России и мире. Евгений рассказал о ключевых изменениях в сфере, проанализировал тенденции рынка и отметил отрасли, в которых такие технологии получили широкое применение.
Ниже приводим текст оригинальной публикации.
Data Science является одной из самых перспективных и быстрорастущих отраслей не только в России, но и в мире. Если в 2020 объем мирового рынка больших данных составлял $194 млрд, то сегодня цифра составляет около $220 млрд, продолжая расти на 10% ежегодно. В настоящее время многие компании уже активно используют или внедряют такие системы, поскольку неструктурированные данные могут содержать критически важную информацию. Грамотно организуя внутренние процессы и применяя современные инструменты, организации снижают бизнес-риски, повышают эффективность, облегчают нагрузки и отстраиваются от конкурентов. В этом материале рассмотрим, какие отрасли активно используют технологии data science и как оптимизируют свою работу.
Начнем с важных цифр: уже в этом году рынок больших данных в США достигнет $55 млрд. По прогнозу на 2026 год, сфера Big Data будет оцениваться в $236,4 млрд. При этом американская экономика каждый год теряет до $3,1 трлн из-за низкого качества анализа информации. Многие компании рассматривают технологии, связанные с большими данными, как одни из более перспективных. Так, каждая десятая организация, использующая алгоритмы ИИ, к 2025 году получит в три раза большую прибыль, чем конкуренты. Кроме этого, до трети предприятий будут использовать искусственный интеллект при принятии стратегических решений.
Технологии, связанные с ИИ, пользуются спросом и в России. По мнению специалистов, искусственный интеллект может дополнительно сформировать около 1% ВВП страны. Для развития ИИ-проектов правительство уже запустило Национальный центр развития искусственного интеллекта и утраивает финансовую поддержку разработчиков интеллектуальных систем. Однако инициативы, касающиеся ИИ, поддерживают не только на государственном, но и на частном уровне. Вот несколько удачных примеров реализации подобных проектов.
Решения на базе ИИ активно распространяются в логистической сфере. К примеру, оборудование поездов Union Pacific Railroad специальными датчиками и использование предиктивной аналитики снизило частоту схождения вагонов с рельс на 75%.
Также благодаря цифровым инструментам логистические компании тратят меньше времени на работу с сопроводительной документацией. Например, с 2023 года в России на платформе «Сберкоруса» появится сервис ЭТрН, который поможет оформлять транспортные накладные и любые перевозочные документы в электронном формате. Оно ускорит обмен документацией в цепочке поставок, исключит внесение некорректных данных, сократит расходы на бумагу.
Британский стартап Babylon Health предлагает новый подход к здравоохранению. Решение компании использует не только алгоритмы ИИ для анализа состояния пациента, но опыт и рекомендации реальных врачей. Это помогает выбрать оптимальный подход к диагностике проблем и заботе о здоровье. Сервис ориентирован на выявление потенциальных рисков, с которыми может столкнуться пациент. Миссия компании — сделать медицину доступной для широкого круга населения. Приложение от Babylon агрегирует данные с различных устройств, которые уже использует человек. Кроме того, при возникновении проблем у пользователя всегда есть опция созвониться с доктором по видеосвязи.
Одна из российских телемедицинских разработок — проект «Цельс». Платформа производит анализ флюорографии, томографии и КТ при помощи алгоритмов ИИ. «Цельс» помогает увеличить показатели выявляемости онкологических заболеваний и снизить стоимость затрат на медицинские услуги. Точность диагностики — 93–95%, к сегодняшнему дню компанией проведено и обработано более 1,9 млн исследований. Решение успешно прошло все клинические испытания — в настоящий момент система активно используется в медицинской практике. Кроме того, сервис уже получил сертификат качества Европейского союза.
Операторы связи модернизируют оборудование и применяют новый подход при работе с данными. К примеру, Tele2, как и многие международные компании, использует кластер Hadoop. В этом году компания увеличила емкость платформы на 40% и разделила пространство на два отдельных сегмента. В одном из них реализуются проекты, связанные с обработкой данных, в другом — Data Science. Благодаря подобной конфигурации увеличивается вычислительная мощность системы, что позволяет решать высоконагруженные задачи.
Не отстает от своих конкурентов и МТС — в 2022 году компания в 3 раза увеличила пропускную способность транспортной сети в Московском регионе. Это нововведение сокращает задержки при передаче больших данных, а также создает высокоскоростные каналы представления информации для центров обработки данных в столичной агломерации.
Один из лидеров рынка быстрого питания компания McDonald’s тоже использует аналитику больших данных в своей работе. Так, меню ресторанов постоянно меняется, исходя из разных факторов. На состав заказа может влиять даже погода за окном: в жаркий день покупателю предложат холодный напиток, а в зимний сезон — кофе и другие согревающие напитки.
Российская «Додо Пицца» использует алгоритмы ИИ не только для создания рецептов пицц и подбора ингредиентов, но и для управления внутренней работой компании и сокращения издержек. Для оптимизации объема закупок и прогнозирования расхода сырья «Додо Пицца» применяет предиктивную аналитику. ИИ изучает тренды, учитывает уровень продаж в праздники и выходные дни, анализирует маркетинговую активность — на основе этих данных составляется план закупки ингредиентов, что помогает исключить перезакупку или нехватку продуктов. Экономию от внедрения этого решения компания ежегодно оценивает в 54 млн рублей.
Активно внедрять алгоритмы ИИ продолжает и американский Netflix.
В настоящий момент на основе истории просмотров потребитель получает не только список рекомендуемых фильмов и сериалов, но и возможность посмотреть персонализированные трейлеры, а также воспользоваться вариантами с индивидуальным оформлением.
«Яндекс» применяет технологии искусственного интеллекта для формирования персональной ленты каждого пользователя в «Яндекс.Дзен». С помощью технологий обработки естественного языка и компьютерного зрения система может определить смысл текста или картинки для распределения материалов по темам. Все данные обрабатываются с помощью технологии на основе машинного обучения Диско, которая предлагает каждому индивидуальные новости и статьи.
Цифровая трансформация — одно из главных направлений развития банковского сектора. Здесь уже давно используют современные технологии, обрабатывают огромные массивы данных, внедряют инновации и предлагают пользователям индивидуальные предложения. Например, Сингапурский банк UOB активно применяет алгоритмы ИИ для создания более персонализированного сервиса. Искусственный интеллект анализирует расходы клиента и на основе полученной информации формирует уникальные предложения для клиентов. В развитие данного направления банк инвестировал около $500 млн, причем только за первую половину 2022 года клиенты UOB получили около 27,3 персонализированных рекомендаций.
«Тинькофф» работает с огромным массивом данных, которые нужно постоянно обрабатывать — информация необходима для предиктивного анализа и принятия управленческих решений. Для этих целей банк использует платформу Informatica Big Data Management. Независимо от объема данных, количества источников информации и аналитической модели система предлагает универсальный инструмент, который детально исследует целевую аудиторию. Благодаря внедрению решения в экосистему банка в 10 раз повысилась конверсия маркетинговых компаний, снизились риски работы с потенциальным клиентом за счет более комплексного изучения кредитного профиля заемщика. Кроме того, в 5 раз сократилось время получения данных — бизнес-подразделения теперь имеют быстрый доступ к графическому представлению информации, это повышает качество работы с аналитикой.
Как мы видим, российские компании являются активными игроками в сфере решений Data Science, однако сейчас отрасль претерпевает изменения, поэтому организации, разрабатывающие интеллектуальные системы, столкнулись с рядом новых вопросов и задач:
Дефицит оборудования. Ограничение поставок процессоров и видеокарт — серьезная проблема для ИТ-компаний. Импортозамещение в этой сфере пока невозможно, поэтому самый оптимальный вариант получения иностранного железа — перестройка логистических цепочек и использование новых каналов поставок из других стран.
Хранение данных. Начиная с февраля 2022 года крупные зарубежные компании, предоставляющие сервисы в аренду, стали отказываться от сотрудничества с организациями из России. Реальная альтернатива здесь — перенос данных в российские Data-центры. В настоящий момент многие эксперты говорят о строительстве региональной сети ЦОД — эти технологические хабы станут самой подходящей заменой иностранным провайдерам.
Датасеты. В текущих условиях закупка баз данных у зарубежных компаний также существенно ограничена. Полноценными источниками датасетов в таком случае могут стать крупные организации, развивающие свои экосистемы. В будущем возможно и появление единых операторов данных, создание которых будет инициировано со стороны государства.
● Рынок Data Science продолжает расти. По прогнозам экспертов, объем рынка вырастет до $322,9 млрд в 2026 году при совокупном годовом темпе роста до 27,7%.
● Отрасли, где сегодня активно внедряется искусственный интеллект, — банковский сектор, телеком, логистика, медицина, пищевая промышленность, ритейл.
● Работа с большими данными позволяет лучше изучить потенциальную аудиторию, повысить лояльность текущих клиентов.
● Благодаря аналитике данных продукты компаний становятся более персонализированными, что позволяет увеличить вовлеченность и повысить продажи.
● Решения на базе ИИ не только повышают эффективность работы организации, но и сокращают издержки.
● Россия — активный участник рынка Data Science. В ближайшее время мы увидим результаты импортозамещения и взрывной рост ИИ-проектов.
В ближайшее время наш менеджер свяжется с Вами.