Data Science: определение и как мы применяем ее в Интернет маркетинге

Итак, для начала, давайте разберем, что такое вообще Data Science и с чем её едят 🙂

На русский язык Data Science дословно переводится как «Наука о данных». Казалось бы, при чем тут наука? Но суть на самом деле как раз в том, что серьёзный анализ данных и работа с ними практически невозможны без хорошего знания математики и математической статистики. По крайней мере, так и было до недавнего времени.

Буквально на наших глазах, за счет сильно возросших вычислительных мощностей настольных компьютеров и совершенствования программного инструментария для статистического анализа данных, появилась новая отрасль человеческой деятельности, которая получила название Data Science. А люди, которые в ней работают, называются, соответственно, никак иначе, как Data Scientist-ы — учёные по работе с данными 🙂

Вот небольшая иллюстрация для понимания того, на стыке каких дисциплин появилась наука о данных:

1

Довольно наглядно, на мой взгляд.

Действительно, используя современные программные продукты (прежде всего, это, конечно, язык R, бесплатный аналог знаменитого языка S), любой человек, понимающий математику, может делать то, чем раньше занимались целые научно-исследовательские институты 🙂

При этом как само исследование, так и получаемые выводы получаются статистически значимыми.

Перечислю кратко типичные задачи Data Science:

  • Кластеризация данных. Например, если у вас есть большой массив данных о ваших клиентах (или, скажем, об избирателях 😉 ), вы можете с помощью разных (и уже отработанных и проверенных) алгоритмов кластеризации автоматически разбить их на группы, чтобы затем было проще работать не с каждым индивидуумом, а с группами. Так, например, делалась предвыборная кампания Дональда Трампа 🙂
    При этом есть алгоритмы, которые сами могут определить даже наиболее оптимальное количество этих кластеров-групп
  • Аппроксимация экспериментальных данных с помощью математических функций для построения описательной или прогностической модели процесса или явления. При этом саму функцию можно подбирать сколь угодно точно. Было бы только достаточно самих данных.
  • Автоматизация процессов принятия решений и предсказания последствий с помощью регрессий, так называемых деревьев решений (или даже лесов решений — Decision Forest), а также самых что ни на есть нейронных сетей (да-да, куда же сегодня без них 😉 ).
  • Деление объектов (тех же самых потенциальных клиентов, например) на перспективных или нет, а также оценка степени их перспективности на основе математического моделирования, в том числе в многомерных пространствах.
  • Анализ с использованием современного математического и статистического аппарата в том числе не только цифровых, но и так называемых факторных данных. Факторными данными в Data Science называются параметры объектов, которые представляют собой не число, а некое описательное значение: пол, интересы, образование и т.д. и т.п.
    Да-да, каждого из нас вполне можно полностью оцифровать и проанализировать с помощью Data Science 😉
  • Углубленный научный и статистический анализ данных, когда не хватает возможностей стандартных систем аналитики.
  • Построение и обучение нейронных сетей различного уровня сложности для решения практических прикладных задач бизнеса.

 

А теперь несколько слов о том, как мы применяем Data Science в интернет маркетинге.

На самом деле, сфер применения достаточно много. Там, где есть данные, которые можно анализировать, можно и нужно применять в том числе и инструменты Data Science. А учитывая наличие диплома МФТИ по математической статистике, нам это делать несколько проще, чем кому бы то ни было 😉

На самом деле, бывают ситуации, когда из Google Analitics или Метрики невозможно понять, что происходит в маркетинге, или что происходит с сайтом, или почему вдруг упала эффективность рекламы.

Кроме того, такие процессы, как, например, отбор ссылочных доноров для SEO продвижения, в настоящее время уже практически невозможны без привлечения серьезной аналитики или даже нейронных сетей.

Подбор аудиторий для таргетированной рекламы, равно как и последующий анализ результатов, также лучше и гораздо эффективнее делать с привлечением инструментария Data Science.

Очень часто простая визуализация данных сама по себе уже дает очень существенный результат, помогая выдвигать гипотезы и принимать взвешенные решения. Вот примеры нескольких наших визуализаций из реальной практики:

H100
Diff
Ex2
ex3

Вот как-то так получается 🙂

Обращайтесь, как всегда за качественной рекламой или за Data Science 😉

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте как обрабатываются ваши данные комментариев.