Тон, интонация и скорость: Искусство настройки голосовых роботов для идеальной коммуникации
Голосовые технологии на основе искусственного интеллекта помогают людям решать бытовые задачи, а компаниям — общаться с клиентами. Разработчики голосовых роботов стремятся сделать речь естественной и максимально приближенной к человеческой. Для этого недостаточно продумать сценарии и загрузить определенный голос. Ведь речь — это не только слова, но и тон, интонация и скорость, с которой говорит робот.

Разговоры между людьми можно разделить на два типа:
социальный обмен — приветствие, шутки и светские беседы;

передача информации — когда людям важно донести смысл сообщения и обменяться знаниями.
В зависимости от цели общения голос звучит по-разному: меняется интонация и тон голоса, скорость речи, добавляются паузы между словами. Эти элементы голоса дополняют вербальное сообщение и помогают нам эффективнее понимать друг друга. Например, по интонации мы понимаем, говорит человек серьезно или иронизирует над ситуацией. Чтобы придать голосу роботов естественность, нужно научить робота распознавать интонации людей и подстраивать под них темп и тон голоса.
По какому номеру
мы можем назначить встречу?
Нажимая кнопку, вы соглашаетесь с политикой обработки персональных данных
Влияние тона голоса
Тон голоса — это эмоциональная окраска голоса, по которой люди считывают настроение и черты характера говорящего. По тону мы понимаем, что человек сейчас улыбается или, наоборот, подавлен, даже если мы разговариваем по телефону и не видим собеседника. Именно по тону голоса люди отличают речь других людей от синтезированной речи роботов: если собеседник говорит монотонно, человек понимает, что разговаривает с роботом. Тон голоса может быть официальным, дружеским, насмешливым, сдержанным, веселым.
Послушайте, как звучит голос робота на 01:07 в видео. По тону слышно, что фраза произнесена шутитливо
Звонкий высокий голос ассоциируется с молодостью и активностью, передает оптимизм. Такой голос часто используют в рекламе товаров для подростков, развлекательных мероприятий, путешествий, активного отдыха, спортивных товаров. При этом очень высокий, пронзительный голос скорее вызывает тревогу и создает ощущение неуверенности.

Более низкий тон голоса без резких скачков в высоте звука передает спокойствие, уверенность, надежность. Таким голосом рекламируют банковские и юридические услуги, товары для здоровья, продукты премиум-сегмента. Однако даже такой голос должен иметь эмоциональную окраску, чтобы не звучать искусственно и монотонно.
Послушайте, как меняется тон голоса робота, когда он шутит в ответ на вопрос «Молодой человек, вы, случайно, не робот?» Этот отрывок диалога начинается с 01:13
Человек повышает тон голоса, когда он в приподнятом настроении или хочет привлечь внимание, а когда нужно выразить сочувствие или успокоить, наоборот, понижает. Когда мы злимся, начинаем говорить громче, с более четким акцентом на определенные слова и звуки. По всем этим параметрам другие люди считывают эмоции и достраивают сообщение.
Значение интонации
Интонация — изменение тона голоса на протяжении всей фразы. В отличие от тона интонация передает не эмоциональную окраску, а общий смысл фразы и помогает понять контекст диалога. Основные типы интонаций:
вопросительная,

повествовательная,

восклицательная,

повелительная,

перечислительная,

звательная.

Например, если человек повышает голос к концу фразы, мы понимаем, что он задает вопрос. А если интонация к концу понижается, мы воспринимаем это как утвердительное предложение. Важно, чтобы голосовой робот умел определять и передавать интонацию в репликах. Ниже — пример разговора робота Томору с клиентом. Обратите внимание, как робот повышает интонацию в конце предложений, когда задает вопрос.
По тону голоса можно отличить, когда робот задает вопрос, а когда говорит с повествовательной интонацией
Если человек общается с роботом и голосовой помощник произносит вопрос с ровной интонацией без повышения к концу фразы, человек не понимает, как на это реагировать. А в некоторых случаях вопрос с повествовательной интонацией может быть воспринят даже как угроза или давление, например если робот произносит «Вам удобно сейчас говорить» с интонационной точкой вместо вопроса.

С помощью интонаций голосовой робот может поддержать собеседника, проявить интерес или порадоваться. Всё это влияет на то, как человек реагирует на робота и общается с ним.

Например, человек звонит в банк, чтобы решить проблему с кредитной картой. В конце диалога, когда с ситуацией разобрались, бот может сказать одну из двух вещей:
Я рад, что мы разобрались! Вижу, что вы постоянно пользуетесь кредитной картой. Хотите обсудить повышение кредитного лимита?
или
Спасибо, что обратились. Еще могу предложить увеличить вам кредитный лимит.
В первом случае робот интонирует — сначала произносит восклицательную фразу, в конце реплики задает вопрос. А во втором случае все произносится без эмоций и с одной интонацией. Скорее всего, в первом случае у человека останется более позитивное впечатление от диалога, потому что речь робота звучит более естественно.
Восприятие темпа речи
Скорость речи, паузы, замедление и ускорение на определенных фразах помогают людям лучше доносить сообщение и понимать друг друга. Если человек говорит слишком медленно и с долгими паузами, собеседник теряет интерес, и ему сложно дослушать сообщение до конца. Если речь слишком быстрая, то человеку может быть сложно разобрать отдельные слова и понять, о чем идет речь. Быстрый темп речи в сочетании с четкой дикцией придает динамику сообщению. А спокойный темп помогает объяснять и доносить новую информацию. Для робота лучше всего настраивать средний темп речи. При таком темпе речь звучит естественно, и человек понимает сообщение на слух.

При подборе темпа робота учитывают информацию, которую нужно донести. Чем сложнее сообщение, тем медленнее ее нужно объяснять, чтобы человек успевал ее понять и усвоить. На служебных фразах, которые заполняют речь и связывают фразы друг с другом, скорость можно увеличивать.

Например, когда рассказываем клиенту условия акции, свойства продукта или инструкцию по настройкам платформы, важную информацию робот должен произносить в среднем темпе и с достаточными паузами между предложениями. При этом робот может уточнять, понятна ли информация. Для естественного звучания фразы-уточнения лучше произносить чуть быстрее. Например, клиент позвонил в техподдержку, чтобы ему помогли с настройками. Робот рассказывает, что нужно сделать, и его интонации меняются в зависимости от контекста:
«Для начала нужно зайти в настройки и выбрать пункт „Доступ и безопасность“. После этого нажать „Назначить администратора“. Появится окно, где нужно ввести имя и почту сотрудника»
 — эти фразы робот произносит медленно и разборчиво.
«Получилось? Отлично! Теперь введите информацию о сотруднике и скажите, как будет готово»
 — а здесь голосовой помощник говорит чуть быстрее, чем раньше.
Кроме скорости речи, важны паузы между фразами. Долгая пауза создает ощущение, что собеседник думает. А еще паузы нужны, когда голосовой помощник имитирует действие человека: поиск информации в базе, отправку письма или сообщения.
В диалоге с клиентом цветочного салона робот замедляет темп речи и делает паузу, когда отправляет промокод в ватсап. В видео этот отрывок начинается в 00:50
Если паузу слишком затянуть, человек решит, что реплика закончилась и начнет отвечать на нее. Проблема с паузами может встречаться у роботов, когда система тормозит и долго обрабатывает информацию от клиента: темп речи робота замедляется, а паузы между фразами — становятся больше. В паузе человек начинает отвечать роботу, и вдруг бот начинает говорить, заканчивая предыдущую мысль, потому что до этого он завис и подбирал реплику. Такая ситуация приведет к путанице в диалоге, а клиент может положить трубку. Поэтому важно обучать роботов отслеживать паузы в диалоге, замечать, когда человек начинает говорить, и подстраивать темп речи под собеседника.
Настройка голосовых роботов
Интонация, тон голоса и темп речи робота влияют на то, как клиенты общаются с голосовым роботом. При настройке цифрового помощника важно думать о том, кто наш клиент и какие задачи он решает с помощью голосового робота.

Пользовательский опыт клиента влияет на то, как он воспринимает голос робота. Чтобы понять этот опыт и настроить голосового робота, нужно пообщаться с пользователями: попросить рассказать, что они чувствуют, когда взаимодействуют с голосовым помощником. Поэтому важно собирать отзывы клиентов и проводить тестирование голосового робота.

Один из способов тестирования — создать прототип и посмотреть, как люди взаимодействует с ним: какие вопросы задают, как реагируют на разные реплики в зависимости от характеристик голоса, в каких ситуациях просят повторить информацию. В таком тесте нужно наблюдать за людьми без вмешательства и подсказок, а после теста — опрашивать о впечатлениях.

Например, вы замечаете: когда бот рассказывает о продукте, люди часто недослушивают и начинают перебивать. Тогда можно поэкспериментировать с темпом речи или разделить монолог бота на несколько частей, добавить интонационные вопросы с паузами, чтобы человек дал обратную связь. Это поможет удерживать внимание и строить диалог, максимально похожий на общение двух людей.

Кроме интонаций голоса самого робота, при настройке нужно уделить внимание реакциям робота на интонации и темп речи человека, с которым он общается. Так, робот в Томору может понять по интонации, что клиент произнес с иронией замечание: «Прикольный бот!»
Робот отреагировал шуткой на замечание клиента и поблагодарил за комплимент в отрывке диалога с 00:51
Робот должен уметь распознавать паузы в речи собеседника, различать вопросительную и повествовательную интонацию, понимать по голосу клиента, когда тот рассержен или расстроен.
Использование цифровых помощников
Голосовые роботы помогают компаниям продавать, заменяют сотрудников техподдержки, напоминают клиентам об акциях и скидках. Чтобы коммуникации с клиентами были эффективными, голос робота должен вызывать доверие и располагать.

Голос цифрового помощника нужно настраивать исходя из целей. Если робот продает услуги, он должен уметь реагировать на возражения и располагать, чтобы человек не положил трубку. А если нужно помочь клиенту разобраться с настройками сервиса или решить проблему, голос робота должен звучать четко и уверенно, чтобы донести нужную информацию.

С помощью параметров голоса робота мы управляем беседой и возвращаем ее к нужной теме. Для этого нужно предусмотреть ситуации, когда человек пошутил, у него возникли проблемы со связью или он понял, что говорит с роботом. Например, если робот слышит, что человек не понял фразу, он меняет голос и произносит фразу медленнее и громче, а в ответ на шутку реагирует с ироничной интонацией, как реальный человек.

При составлении скрипта под любую задачу нужно проработать и протестировать, как клиенты воспринимают его в зависимости от темпа речи, высоты голоса и интонаций.
Персонализация голосовых помощников
Чтобы общение клиентов с роботом было более естественным, компании стараются придать голосу роботов черты и характеристики реальных людей. Например, в Томору для настройки ботов используют записи настоящего голоса, а не синтезированного. Такой голос сохраняет тон владельца и звучит более эмоционально.

Правильно настроенные тон, интонации и темп голоса помогают цифровым ассистентам звучать естественно. Чтобы подобрать характеристики голоса, нужно продумать личность голосового помощника. Например, при разработке голосового помощника Алисы создатели настроили ее голос так, чтобы он звучал игриво, а иногда даже дерзко.

При настройке цифровых помощников важно сохранять баланс в эмоциональности голоса. Клиент может негативно воспринять информацию, если услышит в голосе робота излишнее сочувствие или насмешку. По данным исследований, люди больше доверяют роботам, которые проявляют средний уровень эмоциональности. Если голосовой робот излишне эмоционален, доверие снижается.

Чтобы голосовой робот помогал решать задачи бизнеса, нужно проектировать его с учетом потребностей клиентов конкретного бренда. Это помогает компаниям улучшить пользовательский опыт и повысить лояльность. У каждой компании есть стиль общения с клиентами, и голосовой помощник должен в него вписываться. Если компания хочет создать образ надежного партнера, а робот говорит высоким заигрывающим тоном, то он вызывает недоверие у потенциальных клиентов и не согласуется с имиджем компании. Зато такая тональность подходит роботу бренда спортивных товаров или компании, которая организует экстремальные путешествия.

Ещё больше статей

деньги
инструменты
роботы
Сложно, дорого, потом: клиенты возражают — мы отвечаем
Что такое смарт-цель и как ее ставить
Обновляем личный кабинет: все роботы в одном месте

Остались вопросы?
Свяжитесь с экспертом

Эксперт Tomoru по запуску роботов изучит вашу задачу и предложит решение
Полина Бережных
Эксперт Tomoru