Транскрипция голоса в реальном времени на телефонах Pixel: вот как работает офлайн-магия Google

  • Транскрипция голоса на Pixel работает в режиме реального времени и офлайн, что сокращает задержку и повышает конфиденциальность.
  • Функции интегрированы во всю систему: Gboard, автоматические субтитры, мгновенная транскрипция, диктофон и звонки.
  • Локальные модели ИИ, такие как RNN Transducer, позволяют распознавать голос, обнаруживать контекстные звуки и предлагать ключевые слова.
  • Google постепенно расширяет список поддерживаемых языков и устройств, а экосистема Pixel играет ведущую роль в этих новых разработках.

Транскрипция голоса в реальном времени на телефонах Pixel

До сих пор вы уже могли транскрибировать в текст то, что диктовали своим голосом, с помощью Gboard с голосовой диктовкой, но теперь для пользователей телефонов Pixel все изменилось. Google вывела голосовую транскрипцию на новый уровень С расширенными функциями, которые работают в режиме реального времени и непосредственно на устройстве. Как именно? В чём заключаются изменения? Внимательно прочтите.

Пока для расшифровать текст Нужно было подключение к интернету, и хотя скорость была неплохой, она была не такой высокой, как хотелось бы. Но теперь на телефонах Pixel функция транскрипции будет встроена прямо в устройство… И это открывает двери таким функциям, как автоматические субтитры, перевод в реальном времени и интеллектуальные диктофоны. которые не зависят от облака.

Транскрипция на устройстве. Что это мне дает?

Функции транскрипции на Google Pixel

Априори может показаться, что это не очень важно, но это не так. Для начала, и если вы немного поумнели, вы уже заметили, нам не понадобится Интернет, чтобы иметь возможность использовать транскрипцию голоса, поэтому, если мы находимся на автономном сайте, но хотим быстро написать заметку или что-то подобное, мы можем сделать это без проблем.

Более того, функция транскрипции голоса Pixel в реальном времени не ограничивается диктовкой текста в Gboard. Google интегрирует эти возможности в различные части системы.От приложения «Телефон» с переводом звонков до автоматических субтитров для любого мультимедийного контента или приложения «Мгновенная транскрипция» для обеспечения доступности.

Но на этом улучшения не заканчиваются, это еще и Скорость транскрипции будет вышеДо сих пор подключение к Интернету означало задержку при отправке текста на серверы Google и обратно. Теперь, с интеграцией этой функции в устройство, скорость увеличится в геометрической прогрессии, и вы будете получать текст практически с той же скоростью, с которой говорите.

Еще одним ключевым преимуществом является конфиденциальность. Когда распознавание и транскрипция выполняются непосредственно на телефонеДля преобразования звука в текст не нужно покидать устройство, что особенно важно при конфиденциальных разговорах, деловых звонках или работе с рабочими документами.

Кроме того, вес этого улучшения был значительно улучшен, он весит 85 МБ, что, хотя это может показаться довольно большим для вашего телефона Android, предыдущие версии весили 450 МБ и даже 2 ГБ. Меньший размер позволяет загружать голосовые модели, не занимая много места.сохраняя при этом хорошую точность и поддержку нескольких языков.

В чем причина этого улучшения?

Автоматические субтитры и транскрипции в Pixel

Эта новая функция появилась благодаря тому, о чём все говорят в последнее время: искусственному интеллекту. Всё верно, ИИ сделал эту функцию доступной офлайн. И хотя поначалу могло показаться, что это не сильно улучшит возможности мобильных телефонов, очевидно, что Развитие мобильной телефонии будет направлено на внедрение локальных моделей искусственного интеллекта. способен понимать голос, текст и контекст, не полагаясь на облако.

Например, модель машинного обучения диктофона Pixel основана на системе распознавания голоса, которую Google внедрила в Gboard. Эта система использует технологию RNN-преобразователя.что позволяет вам перенести весь искусственный интеллект на устройство и запускать его локально символ за символом, подобно тому, как вы печатаете на клавиатуре.

Эти модели Они индексируют разговоры по словам.Это позволяет пользователю нажать на любое слово в расшифровке и услышать точную часть записи, где оно было произнесено. Одновременно система может распознавать контекстные звуки, такие как аплодисменты, смех или музыка, визуально отмечая их в записи, чтобы легко найти эти моменты.

Хотя на данный момент мы действительно надеемся, что Эта новая функция скоро станет доступна на всех телефонах Android.Поскольку теперь он доступен, как мы уже говорили, только для телефонов Pixel и некоторых определенных устройств Android с последними версиями системы.

Итак, если у вас есть Google Pixel, Google Pixel 2 или Google Pixel 3 (или, конечно, их соответствующие версии XL), вы можете теперь перейти к параметрам вашего Gboard, перейдите по ссылке Голосовой набор> Более быстрый голосовой набор. В более новых моделях вы также найдете специальные настройки доступности и мгновенного перевода, которые используют те же модели искусственного интеллекта для предоставления субтитров, перевода звонков и многого другого, всегда отдавая приоритет этому обработка выполняется на устройстве.

Ну, не уходи так быстро, пока Доступно только для американского английского.Если на вашем телефоне настроен этот язык, всё готово, но если выбран испанский или другой язык, опять же, придётся подождать. Google постепенно добавляет новые языки для диктовки, офлайн-транскрипции и функций специальных возможностей, поэтому рекомендуется регулярно проверять языковые настройки и обновления системы.

¿Вы выиграли пока не прибудет?

Gboard: клавиатура Google
Gboard: клавиатура Google
Застройщик: Google LLC
Цена: Бесплатный доступ

Развитие этих функций также заметно в таких инструментах, как прямая транскрипция и автоматические субтитры. С помощью прямой транскрипции вы можете для захвата голосов и звуков и отображения их в виде текста на экранеА на некоторых моделях Pixel можно даже загружать языки для использования офлайн. Вы можете управлять историей транскрипции, копировать отдельные фрагменты, искать слова в разговоре, скрывать невербальные звуки или приостанавливать транскрипцию для более комфортного чтения.

С другой стороны, функция автоматических субтитров на телефонах Pixel позволяет вам Смотрите в тексте то, что говорится в видео, подкастах, звонках, видеозвонках или аудиосообщениях.Вы можете включить эту функцию в разделе «Настройки» > «Универсальный доступ» или непосредственно с помощью регуляторов громкости. Эта опция особенно полезна, когда вы находитесь в местах, где нет возможности увеличить громкость, когда аудиоряд звучит на другом языке или у вас есть проблемы со слухом.

Интеграция голосовых функций и искусственного интеллекта в телефонах Pixel распространяется и на звонки. Такие функции, как голосовой перевод в режиме реального времени и сервисы, такие как «Принять сообщение», предлагают… Прямой перевод того, что говорит другой человек, или транскрипция сообщений, которые он оставляет в режиме реального времени, когда вы не можете ответитьВсе это делается непосредственно на телефоне, поэтому разговоры не отправляются на серверы Google и остаются конфиденциальными.

Нечто подобное происходит и с регистратором Pixel, чей Загрузите APK-файл Google Recorder Он позволяет установить модель машинного обучения для расшифровки записей и обнаружения аудиособытий. Эта модель объединяет сверточные нейронные сети с обширной базой данных аудиозаписей AudioSet, содержащей тысячи часов примеров, размеченных по сотням категорий. Благодаря этому он может различать голос, музыку, аплодисменты и другие звуки. и даже предлагать репрезентативные ключевые слова для заголовков ваших записей.

Весь этот набор функций демонстрирует, что голосовая транскрипция в реальном времени на телефонах Pixel — это не просто ускоренная диктовка текста. Это целая экосистема Инструменты для понимания, перевода и более эффективного использования аудио в повседневной жизниот создания заметок без помощи рук до прослушивания лекции, перевода телефонного разговора или просмотра важного сообщения без необходимости его прослушивания.

Теме статьи:
Загрузите APK-файл Google Recorder с Pixel 4 и установите его на любое устройство Android.