В фильме 2008 года «Железный человек» есть сцена, которая дает представление о будущих взаимодействиях между людьми и помощниками c искусственнsv интеллектjv. В нем виртуальный помощник Тони Старка ДЖАРВИС с сарказмом и юмором отвечает на команды Старка.
Современные голосовые помощники, такие как Siri и Alexa, еще не предлагают такой естественной и детализированной беседы в социальных сетях. С этой целью наша команда исследователей информатики из Университета Британской Колумбии исследовала , что могло быть упущено.
Мы обнаружили, что дизайнеры голосовых интерфейсов столкнулись с интересной дилеммой: ,баланс между предложением социального общения и выполнением задач.
Дружелюбный или эффективный?
Лингвисты подразделяют человеческие разговоры на две категории : социальная беседа, такая как приветствия, юмор и светская беседа для выражения социальных отношений и личного отношения, и «транзакционная беседа», которая передает фактическую или предположительную информацию.
Люди могут легко объединить эти два типа разговоров в естественной манере. Однако это волшебное смешение происходит несколько подсознательно. Разработчики голоса часто не могут найти идеальное сочетание, потому что два типа разговоров дополняют друг друга, но также противоречат друг другу.
Проблема становится очевидной, когда дизайнеры создают голосовых помощников, которые помогают пользователям выполнять такие задачи, как проверка погоды или бронирование столика в ресторане. Дизайнеры стараются обогатить диалоги своих голосовых агентов любезностями, такими как сочувственные ответы или болтовня, чтобы сделать их более естественными .
Наше исследование также показало, что дизайнеры сталкиваются с трудностями при поиске подходящего компромисса между дизайном для эффективного помощника и приветливого компаньона. Один участник подчеркнул, что чем больше индивидуальности добавлено, тем длиннее становится диалог, что приводит либо к чрезмерно болтливости, либо к холодным и роботизированным голосовым агентам.
В решении этой проблемы может помочь поддержка инструментов и рекомендаций по проектированию для голосовых дизайнеров. Надлежащий инструмент сценария для разработки диалогов голосового помощника должен помочь дизайнерам найти компромисс. Например, расширенный инструмент создания диалоговых окон может предложить дизайнерам добавить дружеские замечания к сценарию или также выдать предупреждение, если социальная болтовня будет слишком продолжительной.
Кроме того, рекомендации по дизайну должны содержать предписывающие инструкции о том, как сочетать эти два типа разговоров в разных ситуациях. Например, голосовые помощники должны использовать остроумный сарказм только в том случае, если тон голоса пользователя определяется как хорошее настроение.
Собираем наши эмоции
Чтобы обеспечить естественный опыт общения с голосовыми агентами, технологическим гигантам, таким как Apple, Amazon и Google, потребуется собрать большой объем информации о контекстах общения пользователей , например, где они находятся, что они делают, что они хотят и даже как они себя чувствуют. . Действительно, ученые Amazon пытаются понять наши эмоции на основе наших высказываний
Подслушивая разговоры, корпорации могут много узнать о здоровье, финансах и социальной жизни пользователей. Готовы ли пользователи предоставлять этим технологическим гигантам обширные данные для более естественного общения с голосовыми помощниками? Что нужно для более этичного и желанного будущего с голосовыми помощниками?
Благодаря естественному общению с голосовыми помощниками мы сможем легко разблокировать передовые технологии искусственного интеллекта без утомительного процесса обучения, который часто возникает с графическими пользовательскими интерфейсами. Последние технологические достижения, такие как разработка моделей генерации языков почти на человеческом уровне и синтез речи, обещают появление действительно естественных голосовых агентов.
Достижение баланса между доброжелательным помощником и дружелюбным собеседником в пределах досягаемости, но потребуются дополнительные исследования, чтобы создать значительно лучшую поддержку инструментов для разработчиков голосовых интерфейсов, а также потребует, чтобы пользователи делились своими данными.
Будьте в курсе в удобном формате, присоединяйтесь: TG-канал и ВК