МТС ищет Lead SRE Engineer (DataOps Platform, Big Data)
Big Data — один из ключевых юнитов МТС. Сегодня Big Data — это: 20 петабайт данных, 5 000 метрик на профиль и 450 увлеченных профессионалов в команде.
Команда центра Big Data находится в поиске Lead SRE engineer в DataOps Platform. Продукт направлен на высококачественный онбординг, а также отвечает за быстрое и эффективное подключение и поддержку новых клиентов платформы.
Наша цель — сделать все, чтобы наши клиенты могли получать технологии для организации непрерывного потока данных от загрузки до потребления. Продукт представляет из себя набор хранилищ и инструментов для обработки данных, bi tools. Подключившись к работе с продуктом от запуска будет возможность поработать с разными командами и пощупать разные стеки технологий, которыми обладает Big Data МТС.
Что нужно делать
Выстраивать единые методологии управления надежностью для Экосистемы МТС
Определять классы критичности систем и сервисов на основе влияния их простоя на бизнес-процессы Экосистемы
Оценивать экономически-обоснованных значений RTO и RPO
Формировать системы продуктовых метрик в части обеспечения надежности
Выстраивать процессы управления уровнем сервиса на основе SLA/SLO/SLI
Обеспечивать непрерывности и доступности критичных для экосистемы систем и сервисов
Управлять критическими событиями в продуктивной среде
Кого мы ищем
Опыт работы в ИТ от 4 лет
Наличие управленческого опыта
Опыт работы на позиции лидера практики SRE в крупных технологических компаниях
Опыт разработки SLA/SLI/SLO и знание принципов их формирования
Практический опыт локализации проблем и устранения инцидентов в больших и сложных системах
Опыт внедрения практик и инструментов SRE и DevOps
Опыт построения отказоустойчивых распределенных хранилищ на базе Cassandra, Mongo, Postgres, Ignite, Elastic
Опыт встраивания процессов / процедур обеспечения надежности в типовые процессы экплуатационных приложений
Знание принципов работы SCM систем и современных средств мониторинга и автоматизации управления инфраструктурой
Практический опыт внедрения практик и инструментов Capacity Management, Availability Management, Business Continuity Management
Опыт организации построения или управления инфраструктурой отказоустойчивых систем, работающих в режиме 24x7x365 и требующих минимального участия человека
Знание принципов и методов обеспечения качества и надёжности ИТ сервисов
Что предлагаем
График работы: плавающее начало рабочего дня, гибридный график (или возможность работать из дома)
ДМС с 1 месяца работы, куда включены: стоматология, страхование жизни и страховка при поездках за рубеж
Десятки курсов и тренингов в Корпоративном университете МТС и Собственная виртуальная библиотека
Корпоративный психолог и карьерный коуч
Спорт: спортзал в офисе, компенсация фитнес-абонемента, бассейна, скидка в «Alex fitness», «Spirit fitness», «World class» и др.
Well-being: бесплатный фреш-бар, массажный кабинет, массажные кресла и массаж на рабочем месте
Бесплатная сотовая связь, выгодные тарифы для ваших близких, промокод на онлайн-кинотеатр KION и бесплатная подписка на МТС Premium
Программа «Invite IT» (реферальная программа поощрения за рекомендацию ИТ-специалиста)