Машинный язык: откуда Siri берёт свой голос?

Машинный язык: откуда Siri берёт свой голос?О, это просто замечательно, что компании так серьезно подходят к разработке голосовых сервисов! Я сам не раз удивлялся тому, насколько природно звучат их искусственные голоса. Вот представьте себе, какой сюрприз может случиться, если утром, просыпаясь, вы услышите, что компьютерная программа, как человек, жалуется на то, что её вчера забыли выключить, или просит кофе после всей ночи работы.

Я думаю, что вся проблема со звучанием искусственного голоса сводится к тому, чтобы он звучал как можно более естественно.

И вот здесь важнейшую роль играют актеры, записывающие голоса для программ. Представляю себе, как студия, в которой происходит запись, наполнена различными звуками и эмоциями. Актер может словно настоящий артист пережить каждое предложение, подчеркнуть его, подобрать лучший тон и интонацию. Главное, чтобы компьютер потом не решил заикаться или, наоборот, проговорить всё слишком быстро, как неотъемлемая черта его характера.

Наверное, для актера иногда задача записи речи для Siri или других голосовых сервисов может быть немного странной, ведь ему нужно создавать тон и интонацию не для общения с живым человеком, а с программой.

Но в конечном итоге это тот же акт творчества, просто с новыми особенностями и возможностями.

А вот для компьютера сам процесс обучения речи должен быть как самообучение человека. Он ведь тоже хочет быть по-человечески понятным, вежливым и дружелюбным.

Мне кажется, что компьютеры обучаются речи так же, как дети учатся говорить. Вначале они просто повторяют за большими и усваивают новые слова и фразы, стараясь сделать это максимально точно и правильно. Интересно, а может быть, в один прекрасный день компьютер начнет ходить в школу, чтобы улучшать свои речевые навыки, общаться со своими сверстниками-программами и совершенствовать себя в своем обучении.

А вот еще одна вещь, которая мне интересна — какой голос у голосовых сервисов самый популярный?

Есть ли у них свои предпочтения? Возможно, у некоторых пользователей Siri голос должен быть с серьезным и строгим тоном, а у других — более дружелюбным и улыбчивым. Может быть, как разработчики голосовых сервисов сделают возможность смены голоса, чтобы каждый мог выбрать идеальный для себя вариант. Было бы забавно, если бы голосовой помощник мог менять образы, как нам нравится менять шапки на себе.

И, конечно, не забудем о том, что это всё же искусство передачи речи.

На заключительный аккорд хочу предложить вам небольшую зарисовку из жизни Siri. Скоро в какой-нибудь параллельной вселенной Siri спрашивает пользователя: «Скажите, а почему бэкап делается на винчестере, а не на винипуке? Вы же не хотите, чтобы все ваши данные стерлись в артексе?»