Разгадываем кроссворд с помощью нейросети, наслаждаемся визуализацией 100 лет аниме, изучаем события эпохи Возрождения и постигаем вселенскую мудрость вместе с мемным ботом — об этом и не только в нашем июньском дайджесте.

Data Science-дайджест: что почитать, посмотреть и попробовать в июне 2022

Дарья Тихомирова

Автор-фрилансер. 
Собрала июньскую подборку

Что почитать

«Новая языковая модель Google с 540 млрд параметров способна объяснять шутки и писать код», Habr

С чувством юмора у ИИ всегда было неважно: в редких случаях технологии удавалось отличить шутку от сарказма или ответить на неё. Разработчики Google AI Research представили новую языковую модель Pathways Language Model (PaLM), которая научилась понимать и объяснять некоторые шутки. О пользе такого открытия рассказывает редакция Habr.

«Искусственный интеллект впервые разгадал кроссворд быстрее человека», НОЖ

Berkeley Crossword Solver — алгоритм, который впервые обошёл человека в турнире по разгадыванию кроссворда. Он понимает игру слов и подбирает все возможные варианты ответов, а затем отсеивает их в порядке вероятности. Подробнее о технологии — в заметке Марины Климовой.

Data Science-дайджест: что почитать, посмотреть и попробовать в июне 2022
Berkeley Crossword Solver обошёл всех участников Американского турнира по разгадыванию кроссвордов в 2021 году. Примерно такую головоломку ему пришлось решить, попробуете тоже?

«Нейросеть создала собственный язык, который учёные не могут расшифровать», IXBT

В апреле мы рассказывали про DALL·E 2 — алгоритм, который генерирует картинки по словесному описанию. Оказывается, если попросить его изобразить «двух китов, которые разговаривают о еде», животные на картинке действительно буду вести диалог, но на бессмысленном языке. Учёные заподозрили, что нейросеть придумала собственный язык, чтобы было проще генерировать изображения.

«Generating Long Videos of Dynamic Scenes», Тимоти Брукс

NVIDIA анонсировала модель для генерации динамичных видео, основанную на архитектуре StyleGAN. Она воспроизводит плавное движение объекта, изменения в обзоре камеры и новый контент, который появляется в кадре. Код, датасет и предобученную модель выпустят в конце лета. Примеры можно посмотреть уже сейчас в статье Тима Брукса — одного из авторов проекта.


Что посмотреть

Life Cycle

Немецкий дизайнер Хаген Райлинг сравнил среднюю продолжительность жизни человека — 80 лет — с периодами существования 34 животных и растений. Оказалось, дольше нас живут лишь немногие из этих видов.

Ролик показывает, сколько особей каждого вида в среднем умирает или выживает за 80 лет человеческой жизни. Сам человек — в центре инфографики

Histography

Перед вами — таймлайн, который охватывает 14 млрд лет истории: от Большого взрыва до информационной эры. Разработчик и дизайнер Матан Штаубер создал интерактивную карту событий: каждое из них ведёт на соответствующую статью в «Википедии» или показывает связанные события.

Data Science-дайджест: что почитать, посмотреть и попробовать в июне 2022
На таймлайне можно выбрать определённый исторический отрезок, например, эпоху Возрождения. Здесь и открытие Америки, и расцвет Британской империи, и изобретение часов

Can’t speak any foreign language

Исследователи сайта Landgeist создали карту, которая показывает процент европейцев, не говорящих на иностранных языках. За основу взяли данные «Евростата» о людях 25–64 лет. Спойлер: монолингвов больше, чем кажется.

Data Science-дайджест: что почитать, посмотреть и попробовать в июне 2022


Больше всего людей не говорят на иностранных языках в Великобритании, меньше всего — в Швеции

Anime Data Visualization

Разработчики Александр Чау, Педро Торрес да Кунья и Иоаким Данант визуализировали 100 лет аниме с 1917 по 2018 годы. Выглядит внушительно!

Data Science-дайджест: что почитать, посмотреть и попробовать в июне 2022
Посвящается всем фанатам «Покемонов» ?

Dream dog

Принято думать, что все ретриверы — дружелюбные, а чихуахуа — злые и норовят укусить в любой момент. На самом деле порода определяет характер животного только на 9%. Визуализация от команды Darwin’s Dogs показывает результаты опроса владельцев собак и реальное соотношение качеств с породами.

«Искусственный интеллект: создайте свою первую нейросеть» — узнаете, как устроены нейросети, в каких сферах они применяются и самостоятельно обучите математическую модель

«Визуализация данных: от скучных графиков к интерактивным дашбордам» — попробуете себя в роли аналитика в крупной ритейл-компании и поможете принять взвешенные решения об открытии новых точек продаж

«Аналитика данных с нуля до middle» — станете универсальным аналитиком и начнёте работать по специальности уже через 6 месяцев обучения

Что попробовать

Мудрый Клык

Когда-то в Telegram жил «Сутулый Акела» — бот, который присылал сгенерированные нейросетью изображения волков с весёлыми цитатами. Он давно перестал работать, но один из разработчиков решил его реинкарнировать и запустили бота «Мудрый Клык». В нём подписи к фото генерирует GPT-3, обученная на пацанских цитатах.

Data Science-дайджест: что почитать, посмотреть и попробовать в июне 2022
Мудрость дня: 

Bionic Reading

Представьте, что перед вами большая статья. Вы решительно всматриваетесь в первую страницу, кликаете на следующую и… уже размышляете о планах на выходные. Знакомо? Сервис Bionic Reading помогает читать длинные тексты и фокусироваться на них с помощью особого шрифта: в нём первые буквы каждого слова выделены полужирным. Исходный код есть на GitHub.

Data Science-дайджест: что почитать, посмотреть и попробовать в июне 2022
По словам авторов проекта, выделенные буквы в начале слов помогают фокусироваться и читать текст быстрее

Imagen

Команда Google Research анонсировала Imagen — нейросеть для генерации изображений. Она похожа на DALL·E 2, но выдаёт более качественные изображения размером 1024 х 1024 пикселей.

Data Science-дайджест: что почитать, посмотреть и попробовать в июне 2022
Дано: персидский кот в ковбойской шляпе и кожаном пиджаке едет на скейтборде по саду. Результат:

Рерайтер

SberDevices представил сервис, который переписывает текст другими словами, сохраняя смысл. Модель обучили на текстах разной длины и отличных по стилю: от новостных сводок и отзывов до художественной литературы.

Data Science-дайджест: что почитать, посмотреть и попробовать в июне 2022
Особенно хорош вариант: «Я так хочу на свою работу, мне её не хватает»! ?

Суммаризатор

Ещё одна модель от SberDevices — «Суммаризатор». Он сокращает текст, оставляя только важные мысли. Полезно, если список литературы растёт, а времени на чтение не прибавляется.


Что посетить

День открытых дверей «Как начать карьеру в аналитике и Data Science»

Формат: онлайн

Когда: 14 июня, 19:00 мск

Компаниям нужны специалисты, которые умеют работать с данными и принимать решения на основе их анализа. Выпускники и продюсеры Нетологии расскажут о направлениях аналитики, перспективах развития и поделятся советами для старта карьеры.


Мнение автора и редакции может не совпадать. Хотите написать колонку для Нетологии? Читайте наши условия публикации. Чтобы быть в курсе всех новостей и читать новые статьи, присоединяйтесь к Телеграм-каналу Нетологии.

Data Science-дайджест: что почитать, посмотреть и попробовать в июне 2022

Дарья Тихомирова

Автор-фрилансер. Собрала июньскую подборку

The post Data Science-дайджест: что почитать, посмотреть и попробовать в июне 2022 first appeared on Медиа Нетологии.

Источник: блог образовательного портала Нетология. Узнать об обучении >>

©