Несмотря на слегка пугающую формулировку, на самом деле разработчики проекта VocaliD предлагают любому человеку выступить в качестве донора и оказать помощь для создания звукового суррогата тем людям, которые из-за болезни потеряли возможность разговаривать. Данная идея пришла в голову группе специалистов из штатов Делавэр и Бостон. В основу проекта легли достаточно несложные принципы: здоровой человек должен записать всю гамму разнообразных звуков, чтобы после компьютерной обработки с сохранением максимальной точности передачи тембра и интонации пациент мог воспользоваться уникальным синтетическим голосом. Сортирование записываемых голосов добровольцев происходит исходя из их пола, возраста, критерия физической формы. Поэтому люди, лишённые речевой функциональности, смогут найти себе искусственный голос по своему образу и подобию с наиболее точной и подходящей вокальной идентичностью. По предварительным данным, десятки миллионов людей во всём мире сосуществуют в социуме благодаря синтетической генерации речи. Лишь в одних Штатах это количество примерно равняется 2,5 млн. Очень часто люди, лишившиеся возможности разговаривать (а причиной потери способности к коммуникации во многих случаях является паралич), по-прежнему хотят оставаться полноценными членами общества и не терять свою индивидуальность. К тому же некоторые из них вовсе не рождались с данным дефектом, потому всё ещё помнят свой уникальный голос и хотели бы получить второй шанс на его возвращение. Преимущественно основными пациентами, нуждающимися в «чужом голосе», являются страдающие болезнью Паркинсона или церебральным параличом. Самым известным и ярким примером для подражания всем людям с подобным недугом может стать известный учёный Стивен Хокинг (Stephen Hawking). Разработчики предлагают «голосовым донорам» построить весь процесс записи исходников следующим образом: любой желающий зачитывает несколько тысяч слов и короткие предложения, в которых используется максимальный спектр произносимого звукового ряда. Весь процесс должен занять у донора и специалистов не более 2–3 часов. Примерно по аналогичному принципу был разработан популярный голосовой помощник Siri. Ну а далее дело остаётся за программистами, которые обрабатывают весь записанный материал и выделяют звуковые единицы из речи — гласные и согласные. Хотя и существует вероятность использования донором и пациентом идентичного синтетического голоса, однако создатели VocaliD уверяют, что финальный набор букв-звуков будет представлять собой совокупность нескольких соединённых в единое целое голосовых записей. Материалы по теме: - Распознавание эмоционального состояния для телефонных сервисов
- Подробности о голосовом помощнике Microsoft Cortana
- Видеодемонстрация персонального помощника Microsoft Cortana
- Голосовой помощник WP 8.1, возможно, будет поддерживать русский язык на момент запуска
Источник:
|