Top.Mail.Ru

Приложения Google для распознавания речи

Компания Google активно внедряет распознавания речи, во многие собственные
приложения и инструменты. Вообще, распознавание речи — это сравнительно
недавняя функция. Она стала возможной в связи из-за быстрого развития
технологий искусственного интеллекта.
Когда-то распознавание голоса — это было что-то невообразимое и фантастичное.
Если помните, был даже фантастический фильм 90-х годов, когда героиня-
писательница произносила фразы в микрофон, а они тут же транслировались на
экране компьютера. А сейчас, кто удивиться таким действиям? Практически никто,
потому что в каждом современном смартфоне, есть такая возможность,
представленная в каком-либо приложении или инструменте. Найти такие
приложения в Google Play вообще не составляет труда.

Google и распознавание речи

Компания Google активно участвует в новейших технологических разработках. Она
одна из первых, кто создал беспилотный автомобиль. Также ее постоянно можно
заметить во многих технологических инновационных разработках. Распознавание
речи — это не исключение, поэтому Гугл создал специализированный сервис по
распознаванию голоса — Google Speech API.

Google Speech API

Это сервис, который дает возможность применять распознавание речи от компании
Гугл в ваших собственных целях. Использование Google Api дает возможность
заменить даже живого оператора на телефонной линии, где в основном ведется
однообразный разговор, к примеру при бронировании билетов на какой-нибудь
транспорт и др.
Уже сейчас система распознавания голоса от Goggle применяется во многих
сервисах жизнедеятельности человека:

  • в качестве первоначального оператора, которому нужно определить, к какому специалисту переориентировать клиента;
  • когда нужно уточнить или распознать адрес доставки;
  • если нужно аутентифицировать по голосу своих клиентов, когда они осуществляют запрос каких-нибудь конфиденциальных сведений;
  • когда нужно предоставлять по телефону большой объем однообразной справочной информации своим клиентам;
  • в сферах голосового самообслуживания клиентов
  • и др.

Чтобы подключить Google Speech Api, нужно выполнить следующие действия:

  1. Скачать GoogleSpeechAPI.zip. В архиве будут находиться 2 сценария
    действий. Один предполагает проводить запись голосовых сообщений как
    эталон использования сервиса. Второй — это отправка записанных сообщений
    на сервера Гугл, для распознавания этих сообщений.
  2. Распаковав архив, вам будет доступен модуль «Администрирование». Там
    нужно будет найти вкладку «Внутренние номера», куда нужно добавить
    внутренний номер и указать по какому сценарию должны развиваться диалоги.
  3. Позвоните на указанный внутренний номер и проговорите какой-нибудь текст.
    Потом нажмите на «звездочку» и через короткое время у вас появится текст,
    который вы проговорили. Это даст возможность проанализировать как
    работает сервис. Правильно ли он распознает голос. Можно провести
    собственный анализ и при необходимости подкорректировать работу Google
    Speech API.

Использование Google Speech API дает множество преимуществ вашему бизнесу.
Однако нужно понимать, что любые передаваемые данные «оседают» на серверах
Гугл. Поэтому, когда речь идет о конфиденциальности, то тут нужно хорошо все
обдумать. Потому что Гугл и «конфиденциальность» или «приватность» – это далеко
не синонимы.

Google распознавание речи в приложениях

Приведем несколько примеров, где реально используется распознавание голоса от
Google. Возможно, это не так масштабно, как можно реализовать при помощи Google
Speech API, но это дает понимание как вообще это работает и где можно применять
эту технологию, если вы не являетесь владельцем крупного бизнеса.
Пять популярных приложений, где используют распознавание голоса Гугл:

  1. Gboard. Хорошо известная фирменная клавиатура Google, которая
    установлена по умолчанию на многих Андроид-гаджетах. С одной стороны,
    клавиатура нужна для ввода текста «руками», но с другой стороны
    распознавание речи на ней работает очень отлично, так как в этом
    задействованы все наработки компании Google.
  2. Evernote. Это очень популярное приложение для создания заметок. Помимо
    стандартного ввода текста, оно поддерживает и распознавание речи, что
    существенно ускоряет запись заметок.
  3. Speechnotes. В своей работе использует распознавание речи от Google.
    Основная его функция — это перевод голоса в текст. Идеально подходит тем,
    кому нужно очень много печатать.
  4. Speechtexter. Также использует технологии Гугл для распознавания голоса. В
    его собственный словарь можно добавить слова-сокращения, которые часто
    используете в тексте. Это приложение и будет распознавать — это его
    особенность и главное отличие от подобных ему приложений.
  5. T2S. Данное приложение очень качественно задействовало распознавание
    речи от Google. Оно призвано преобразовывать речь в текст, однако может
    также воспроизводить выделенный текст и экспортировать аудио заметку в
    аудио файл.

Заключение

Как видно, распознавание речи от Google можно использовать для больших и мелких
целей. То есть, можно задействовать эту технологию, для модернизации
собственного бизнеса, в качестве замены операторов на телефоне. Но также, эту
технологию можно использовать в более мелких целях — при создании приложений
на Android.

Возможно вам будет интересно почитать статью “Все возможности Facebook для разработчиков”

То что распознавание голоса работает хорошо — уже никто не может подвергнуть
сомнению. Но технологии шагают вперед семимильными шагами и распознавание
голоса тоже. Поэтому заметна постоянная тенденция к улучшению и расширению
функциональности распознавания. К чему это приведет? Время покажет, а пока
нужно использовать эти возможности на полную.

Text.ru - 100.00%
Поделись статьей с друзьями!

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *