Регулярное выражение – удобный инструмент поиска, который упрощает работу с Google Analytics и помогает настраивать события в Google Tag Manager. С помощью регулярного выражения можно объяснить сервису, что вы хотите найти сразу две кампании или искать по всем словам, даже если они написаны с ошибкой. Как это сделать – на примерах рассказывает Михаил Быков, веб-аналитик агентства комплексного интернет-маркетинга Adindex.

Обучение в онлайн-университете: курс “Веб-аналитика

Что означают символы в регулярных выражениях и как их использовать

Вертикальная линия |

Означает “или”. Символ можно использовать, например, когда нужно искать сразу по двум рекламным кампаниям. Допустим, они называются Share promo и Apparel. Чтобы найти информацию в Share или Apparel, нужно написать:

Share promo|Apparel

Точка .

Означает один любой символ. Если вам нужно найти слова “тлен”, “клен”, “плен”, пишите так:

.лен

Звездочка *

Означает повторение предыдущего символа ноль или больше раз. Например, если вам нужно найти gogle, google, gooogle, goooogle, пишите так:

goo*gle

Чаще всего звездочку используют в паре с точкой или в составе других регулярных выражений.

Знак плюс +

Похож на звездочку, но соответствует одному или более предыдущим символам. Если вам нужно найти gggoogle, ggoogle, google, пишите так:

g+oogle

Точка звездочка .*

Выражение соответствует нулю или большему количеству случайных символов. Если проще – любой комбинации символов или отсутствию символов. Регулярное выражение можно использовать в Google Analytics, например, чтобы настроить сегменты пользователей с User ID.

Каретка ^

Помогает найти текст, который начинается с определенной фразы или слова. Например, у вас запущено несколько рекламных кампаний с похожими названиями: Fantastic campaign end, Our Fantastic campaign, The best Fantastic campaign, Test Fantastic campaign. И нужно найти именно Fantastic campaign end. В таком случае пишем:

^Fantastic campaign

Символ доллар $

Работает наоборот и помогает найти название, которое заканчивается на определенный символ или слово. Рассмотрим тот же пример с кампаниями Fantastic campaign end, Our Fantastic campaign, The best Fantastic campaign, Test Fantastic campaign. Чтобы найти первую, нужно написать:

campaign end$

Вопросительный знак ?

Означает, что символ перед ним не обязательный. Например, вам нужно найти все кампании, связанные с фирмой Kerrigan и ее брендом rainnor. Но вы не уверены, что названия правильно пишутся с двумя rr и двумя nn. В этом случае ищите так:



Kerr?igan|rainn?or


Вы получите все кампании, со словами Kerrigan, Kerigan, rainnor и rainor

Скобки ()

Круглые скобки отделяют одну часть выражения от другой. Допустим, у вас есть три разных страницы – мужская, женская и детская обувь, и вы хотите получить данные о них одним запросом.

Адреса страниц выглядят так:

  • /products/men/shoes/
  • /products/women/shoes/
  • /products/kids/shoes/

Нужно найти страницы, которые начинаются с /products, заканчиваются на shoes/, а между этими словами содержат men или women или kids. Для решения задачи используйте регулярно выражение:

^/products/(men|women|kids)/shoes/$

Квадратные скобки []

Квадратные скобки помогают создать список. Например, у вас есть три слова baker341, baker342, baker343. Чтобы найти их все за раз, напишите:

baker34[123]

Аналогично можно искать слова на кириллице. Чтобы найти сон, тон и фон, пишем [стф]он.

Дефис –

Помогает создать продвинутый список, его лучше использовать вместе с квадратными скобками:

  • [a-z] соответствует всем строчным буквам;
  • [A-Z] соответствует всем заглавным буквам;
  • [0-9] соответствует всем числам;
  • [a-zA-Z0-9] соответствует всем буквам и цифрам.

Допустим, вам нужно вывести все ourCampaign, в названии которых есть даты с 2013 по 2019 год. Пишем так:

ourCampaign201[3-9]

Фигурные скобки { }

Указывают, сколько раз нужно повторить предыдущий символ или выражение.

  • {1,2} – нужно повторить последний “пункт” не менее 1 раза и не более 2 раз.
  • {2} – нужно повторить последний “пункт” 2 раза.

Например, нужно выбрать список IP адресов определенного диапазона с 77.120.120.0 по 77.120.120.99. Если вводить их вручную, придется писать 100 разных адресов. С помощью регулярного выражения можно обойтись одной строкой:

^77.120.120.[0-9]{1,2}$

Обратная косая черта

Существует много символов регулярных выражений, которые встречаются и в простом тексте – точка, знак вопроса, дефис и другие. С помощью обратной косой черты можно указать, что эти символы часть текста, а не регулярного выражения.

Допустим, нужно отфильтровать все строки запроса в Google Analytics, которые начинаются с / search /? s = (URL поиска на сайте). Регулярное выражение будет выглядеть так:

search / ? s =

Регулярные выражения для решения задач сложнее

Рассмотрим, как использовать регулярные выражения при создании фильтров в Google Analytics.

Поиск страниц в определенном каталоге

Допустим, вам нужно просмотреть на сайте категорию /movies/, но только в третьем подкаталоге. В этом случае пишем такое выражение:

^/.*/.*/movies/.*

Расшифровать можно так: мы задаем путь к странице, которая начинается ^ с /, затем следуют любые символы . *, потом снова / и любые символы . *, а в конце – /movies.

Исключение трафика по IP-диапазону

Допустим, у компании есть определенный диапазон IP-адресов и при анализе трафика на сайте нужно исключить тот трафик, который генерируют сотрудники компании. Для этого используем фильтр:


Регулярное выражение описывает диапазон IP адресов от 66.110.110.0 до 66.110.110.99

Важно. Фильтры, которые изменяют способ сбора данных, в том числе фильтр исключения IP-адресов, нельзя отменить. Если вы ошибочно исключите IP-адреса, то потеряете данные Google Analytics и не сможете вернуть их даже после удаления фильтра.
Это не касается фильтров поиска в отчетах: после их применения данные не пропадут, их можно посмотреть снова.

Создание пользовательских отчетов

Допустим, вам нужно отфильтровать пользователей, которые посетили страницы movies или musik с планшетов table или смартфонов mobile. Решить задачу поможет следующее регулярное выражение:

Резюмируем

  • Регулярные выражения – это шаблоны поиска, с помощью которых удобно объяснять программе, что именно вы хотите найти.
  • Регулярные выражения могут состоять из одного-двух или комбинации символов, в зависимости от того, что они описывают.
  • Их можно использовать в Google Analytics и Google Tag Manager, чтобы настраивать фильтры, цели, сегменты, аудитории, группы контента.

Читать еще: “25 ресурсов о маркетинг-аналитике


Мнение автора и редакции может не совпадать. Хотите написать колонку для “Нетологии”? Читайте наши условия публикации. Чтобы быть в курсе всех новостей и читать новые статьи, присоединяйтесь к Телеграм-каналу Нетологии.

©