Сверточные нейронные сети, работающие на квантовых компьютерах, вызвали много шума из-за своего потенциала для анализа квантовых данных лучше, чем это могут делать классические компьютеры. Хотя фундаментальная проблема разрешимости, известная как «бесплодные плато», ограничила применение этих нейронных сетей для больших наборов данных, новое исследование преодолевает эту ахиллесову пяту с помощью строгого доказательства, гарантирующего масштабируемость.
«То, как вы создаете квантовую нейронную сеть, может привести к бесплодному плато — или нет», — сказал Марко Сересо, соавтор статьи под названием «Отсутствие бесплодных плато в квантовых сверточных нейронных сетях», опубликованной сегодня в Los Alamos National Лаборатория команды в Physical Review X . Сересо — физик, специализирующийся на квантовых вычислениях , квантовом машинном обучении и квантовой информации в Лос-Аламосе. «Мы доказали отсутствие бесплодных плато для особого типа квантовой нейронной сети. Наша работа обеспечивает гарантии обучаемости для этой архитектуры, что означает, что можно в общем обучать ее параметры».
В качестве методологии искусственного интеллекта (ИИ) квантовые сверточные нейронные сети вдохновлены зрительной корой головного мозга. По сути, они включают серию сверточных слоев или фильтров, чередующихся со слоями объединения, которые уменьшают размерность данных, сохраняя при этом важные особенности набора данных.
Эти нейронные сети могут использоваться для решения ряда задач, от распознавания изображений до обнаружения материалов. Преодоление бесплодных плато является ключом к раскрытию всего потенциала квантовых компьютеров в приложениях искусственного интеллекта и демонстрации их превосходства над классическими компьютерами.
По словам Сересо, до сих пор исследователи квантового машинного обучения анализировали, как смягчить последствия бесплодных плато, но у них не было теоретической основы, чтобы полностью избежать этого. Работа в Лос-Аламосе показывает, что некоторые квантовые нейронные сети на самом деле невосприимчивы к бесплодным плато.
Коулз считает, что появится гораздо больше приложений для квантовых алгоритмов ИИ, поскольку исследователи будут чаще использовать квантовые компьютеры в ближайшем будущем и генерировать все больше и больше данных — все программы машинного обучения требуют данных.
Как избежать исчезающего градиента
Суть проблемы — это «исчезающий градиент» в области оптимизации. Ландшафт условно состоит из холмов и долин, и цель состоит в том, чтобы обучить параметры модели, и найти решение, исследуя географию ландшафта. Решение обычно лежит на дне самой нижней долины, так сказать. Но на плоском ландшафте нельзя тренировать параметры, потому что сложно определить, в каком направлении двигаться.
Эта проблема становится особенно актуальной, когда количество функций данных увеличивается. Фактически, ландшафт становится экспоненциально плоским с увеличением размера объекта. Следовательно, при наличии бесплодного плато квантовая нейронная сеть не может быть увеличена.
Команда Лос-Аламоса разработала новый графический подход для анализа масштабирования в квантовой нейронной сети и доказательства ее обучаемости.
Более 40 лет физики считали, что квантовые компьютеры могут оказаться полезными при моделировании и понимании квантовых систем частиц, которые подавляют обычные классические компьютеры. Ожидается, что тип квантовой сверточной нейронной сети, надежность которой доказали исследования в Лос-Аламосе, найдет полезные применения при анализе данных квантового моделирования.
«Область квантового машинного обучения еще молода», — сказал Коулз. «Есть известная цитата о лазерах, когда они были впервые обнаружены, в которой говорится, что они являются решением в поисках проблемы. Теперь лазеры используются повсюду. Точно так же многие из нас подозревают, что квантовые данные станут доступными, а затем квантовые. машинное обучение наберет обороты «.
Например, по словам Коулза, исследования сосредоточены на керамических материалах как высокотемпературных сверхпроводниках, которые могут улучшить транспортировку без трения, такую как поезда на магнитной подушке. Но анализ данных о большом количестве фаз материала, на которые влияют температура, давление и примеси в этих материалах, и классификация фаз — это огромная задача, выходящая за рамки возможностей классических компьютеров.
Используя масштабируемую квантовую нейронную сеть, квантовый компьютер мог бы просеивать обширный набор данных о различных состояниях данного материала и соотносить эти состояния с фазами, чтобы определить оптимальное состояние для высокотемпературного сверхпроводника.
Дополнительная информация: Артур Песах и др., Отсутствие бесплодных плато в квантовых сверточных нейронных сетях, Physical Review X (2021). DOI: 10.1103 / PhysRevX.11.041011
Иллюстрация: Национальная лаборатория Лос-Аламоса
Будьте в курсе в удобном формате, присоединяйтесь: TG-канал и ВК