Технологии распознавания и синтеза речи позволяют создавать программы, которые могут вести диалог на уровне реального собеседника. Подобных роботов можно использовать для совершения автоматических звонков.
Распознавание речи — это раздел компьютерной лингвистики, отвечающий за разработку методов и технологий, которые позволяют использовать компьютер для распознавания и перевода разговорного языка в текст. Также известно как автоматическое распознавание речи (ASR), компьютерное распознавание речи или Speech to Text (STT). Этот раздел включает в себя знания и исследования в области лингвистики, информатики и электротехники.
CallerBot использует эти знания для распознавания речи клиентов. Это помогает им управлять интерактивным меню или сообщать необходимую информацию.
Синтез речи — это искусственное создание речи, понятной человеку. Компьютерная система, используемая для этого, называется речевым компьютером или синтезатором речи. Она может быть реализована в виде программных или аппаратных продуктов. Система преобразования текста в речь (TTS) преобразует простой текст в речь. Другие системы переводят символические представления языка, такие как фонетическая транскрипция, в речь.
Наш сервис использует подобную систему для создания аудиороликов из текста не прибегая к зачитыванию с помощью дикторов, а так же для того чтобы сообщать клиентам связанную с ними информацию, тем самым улучшая уровень взаимодействия.
Основной речевой технологией, используемой в CallerBot, является SpeechKit от компании Яндекс. С помощью этого сервиса вы можете распознать или произнести любой текст на нескольких языках. Сервисная инфраструктура рассчитана на высокие нагрузки для обеспечения доступности и бесперебойной работы системы даже при большом количестве одновременных вызовов. Алиса, голосовая помощница Яндекса, работает на основе SpeechKit.
Узнать о том как применить распознавание и синтез речи в своих обзвонах вы можете в разделе «Руководство пользователя».