Транскрипция голосовых заметок в iOS 18

Позже в этом году Apple надеется сделать транскрипцию и обобщение аудио в реальном времени доступными для всей системы на многих своих устройствах, поскольку производитель iPhone надеется использовать возможности искусственного интеллекта для повышения эффективности некоторых своих основных приложений, как стало известно AppleInsider.

Люди, знакомые с этим вопросом, рассказали нам, что Apple работает над обобщением на основе искусственного интеллекта и значительно улучшенной транскрипцией звука для нескольких своих операционных систем следующего поколения. Ожидается, что новые функции позволят значительно повысить эффективность работы пользователей основных приложений «Заметки», «Диктофонные заметки» и других приложений.

В настоящее время Apple тестирует эти возможности в качестве дополнений к нескольким обновлениям приложений, которые должны появиться с выпуском iOS 18 позже в 2024 году. Ожидается, что они также появятся в соответствующих приложениях в macOS 15 и iPadOS 18.

Приложение Voice Memos по умолчанию, которое Apple включает в свой портфель устройств, будет одним из первых, кто получит обновленные возможности. Ранние версии приложения предоставляют текущую расшифровку каждой аудиозаписи, работая аналогично недавней функции Live Voicemail компании.

Транскрипции занимают центральную часть окна приложения, заменяя более крупное графическое представление записанного звука, которое имеется в существующей версии приложения.

Транскрипция также будет включена в следующую версию Notes. По словам тех, кто знаком с программным обеспечением, предварительные версии обоих приложений имеют специальную кнопку транскрипции в виде речевого пузыря. При нажатии на новый речевой пузырь отобразится транскрипция звука, записанного в приложении.

Снимок экрана приложения для записи голоса со звуковым сигналом, элементами управления воспроизведением и текстом «Это тестовая запись».

Воспроизведение транскрипции голосовых заметок в «Заметках» в iOS 18

Инструмент транскрипции будет идти рука об руку с будущими функциями аудиозаписи в Notes и обеспечивать новый контекст для них, о которых впервые подробно рассказал в апреле. В частности, в обновлении будет добавлена ​​возможность обобщения записанного звука, генерируемого искусственным интеллектом, которая мгновенно предоставляет базовое текстовое резюме ключевых моментов и действий.

Ожидается, что функция обобщения AI в сочетании с новой аудиозаписью в приложении и опциями транскрипции в реальном времени сделает встроенное приложение Apple «Заметки» настоящим мощным инструментом. Три функции будут полезны для широкого спектра практических приложений, взяв на себя тяжелую работу по обработке больших объемов данных вплоть до ключевых точек. Все это обеспечивает удобство и ясность для пользователей.

Студенты смогут легко записывать лекции и занятия, не полагаясь на сторонние инструменты. При записи из нового приложения «Заметки» есть возможность включить в заметку транскрипцию и краткое содержание наряду с другими носителями, такими как изображения, ссылки и структуры данных, такие как таблицы.

Эти функции также принесут дивиденды профессионалам, которые регулярно посещают телеконференции, виртуальные деловые встречи или семинары в рамках своей работы. На таких мероприятиях часто раскрываются большие объемы информации, различные статистические данные, подробные бизнес-планы, даты и графики, которые технология искусственного интеллекта Apple анализирует и реорганизует в правильно структурированные краткие сводки.

То же самое относится к занятиям или лекциям на более продвинутых уровнях, которые часто включают в себя разнообразную информацию, такую ​​​​как определения, объяснения сложных идей или теоретических принципов, иллюстративные примеры и многое другое.

Между тем, журналисты получат чрезвычайно эффективный способ расшифровки и обобщения длинных интервью. Такие творческие люди, как авторы и сценаристы, могут легко записывать ключевые идеи и просматривать их позже, без необходимости воспроизводить и прослушивать большую часть записей просто для того, чтобы выделить ключевые точки данных.

Хотя Apple приложила немало усилий, чтобы гарантировать, что ее функции транскрипции и обобщения дают точные результаты, ошибки неизбежны. Таким образом, сохранение исходного аудио вместе с расшифровкой и резюме, созданным искусственным интеллектом, гарантирует, что ни одна исходная информация не будет потеряна в процессе транскрипции или обобщения.

Подведение итогов — это лишь часть более масштабных усилий Apple в области искусственного интеллекта.

Новые функции транскрипции и обобщения станут частью более широкого проекта Apple в области искусственного интеллекта в этом году. Ожидается, что аналогичные функции обобщения появятся в Safari 18 через интеллектуальный просмотр и во встроенном приложении «Сообщения» — благодаря интеграции с программным обеспечением Apple для искусственного интеллекта на устройстве.

Варианты использования и общая цель функций обобщения на основе искусственного интеллекта в Safari и «Сообщениях» совершенно разные. В то время как Notes предоставит пользователям возможность подводить итоги встреч, конференц-звонков и лекций, Safari позволит обобщать веб-страницы, а «Сообщения» будут предлагать сокращенную версию содержимого сообщений.

Программное обеспечение Apple для искусственного интеллекта также может служить для защиты конфиденциальности пользователей, поскольку ожидается, что некоторые функции искусственного интеллекта будут работать полностью на устройстве. Однако в случае транскрипции аудио и расширенного обобщения ИИ на данный момент может потребоваться обработка на стороне сервера.

Включив обобщение и транскрипцию аудио в свои системные приложения, компания стремится продемонстрировать некоторые из лучших преимуществ использования ИИ для решения реальных сценариев. Цель усилий Apple в области искусственного интеллекта — предоставить разработчикам функции, которые обещают дать клиентам возможность более эффективно и успешно выполнять свои повседневные задачи.

В то же время компания надеется лучше позиционировать себя против распространения конкурирующих сторонних приложений, которые теперь используют технологию искусственного интеллекта, некоторые из которых демонстрируют высокие темпы внедрения, поскольку потребители вплетают их в свою цифровую жизнь.

Приложение Otter, например, является еще одним лауреатом премии «Выбор редакции» Apple. Он предлагает функциональность, аналогичную функциям, обсуждаемым в этой статье. С его помощью пользователи могут записывать, расшифровывать и обобщать встречи с помощью генеративного искусственного интеллекта — и все это в одном приложении.

Microsoft OneNote также предлагает поддержку аудиозаписи в виде голосовых заметок, что является еще одним потенциальным конкурентом приложений Apple Notes и Voice Memos.

Однако стоит подчеркнуть, что не все функции программного обеспечения, которые Apple тестирует в предварительных сборках программного обеспечения, попадают в существующий цикл выпуска. Известно, что Apple отменяет проекты или откладывает функции для последующих выпусков операционной системы и приложений в последнюю минуту, поэтому в конечном итоге нет никаких гарантий относительно сроков и доступности.

Тем не менее, новые функции ИИ-обобщения и транскрипции в реальном времени, похоже, все еще находятся на пути к ожидаемому представлению вместе с операционными системами Apple следующего поколения на Всемирной конференции разработчиков (WWDC) компании в июне. Ожидается, что к ним, среди прочего, присоединятся улучшенные приложения «Календарь» и «Калькулятор».

Скоро появятся инструменты искусственного интеллекта для обобщения аудиозаписей

©