Искусственный интеллект представляет собой серьезную проблему для традиционной вычислительной архитектуры. В стандартных моделях хранение в памяти и вычисления происходят в разных частях машины, и данные должны перемещаться из своей области хранения в центральный или графический процессор для обработки.
Проблема с этим дизайном в том, что движение требует времени. Слишком много времени. У вас может быть самый мощный процессор на рынке, но его производительность будет ограничена, так как он простаивает в ожидании данных — проблема, известная как «стена памяти» или «узкое место».
Когда вычисления опережают передачу памяти, задержка неизбежна. Эти задержки становятся серьезными проблемами при работе с огромными объемами данных, необходимых для машинного обучения и приложений ИИ.
По мере того, как программное обеспечение для искусственного интеллекта продолжает усложняться, а развитие Интернета вещей с большим количеством датчиков создает все большие и большие наборы данных, исследователи сосредоточились на модернизации оборудования, чтобы обеспечить необходимые улучшения в скорости, гибкости и энергопотреблении.
Группа исследователей из Школы инженерии и прикладных наук Пенсильванского университета в сотрудничестве с учеными из Sandia National Laboratories и Brookhaven National Laboratories представила вычислительную архитектуру , идеально подходящую для ИИ.
Под руководством Дипа Джаривала, доцента кафедры электротехники и системотехники (ESE), Троя Олссона, доцента ESE, и Сивен Лю, доктора философии. кандидата в Лабораторию исследования и разработки устройств Джаравалы, исследовательская группа полагалась на подход, известный как вычисления в памяти (CIM).
В архитектурах CIM обработка и хранение происходят в одном месте, что сокращает время передачи и минимизирует потребление энергии. Новый дизайн CIM, являющийся предметом недавнего исследования, опубликованного в Nano Letters , примечателен тем, что полностью лишен транзисторов. Этот дизайн уникальным образом соответствует тому, как приложения для работы с большими данными изменили природу вычислений.
«Даже при использовании в архитектуре вычислений в памяти транзисторы снижают время доступа к данным, — говорит Джаривала. «Они требуют большого количества проводов в общей схеме чипа и, таким образом, используют время, пространство и энергию сверх того, что мы хотели бы для приложений ИИ. Прелесть нашей конструкции без транзисторов заключается в том, что она проста, мала и быстра. и требует очень мало энергии».
Прогресс заключается не только в дизайне на уровне схемы. Эта новая вычислительная архитектура основана на более ранней работе группы в области материаловедения, посвященной полупроводнику, известному как нитрид алюминия, легированный скандием (AlScN). AlScN допускает сегнетоэлектрическое переключение, физика которого быстрее и энергоэффективнее, чем у альтернативных элементов энергонезависимой памяти.
«Одним из ключевых свойств этого материала является то, что его можно наносить при достаточно низких температурах, чтобы его можно было использовать в литейных цехах по производству кремния», — говорит Олссон. «Большинство сегнетоэлектрических материалов требуют гораздо более высоких температур. Особые свойства AlScN означают, что продемонстрированные нами устройства памяти могут размещаться поверх слоя кремния в вертикальном гетероинтегрированном стеке. Подумайте о разнице между многоэтажной парковкой на сто автомобилей и сотни отдельных парковочных мест, разбросанных по одному участку. Что более эффективно с точки зрения пространства? То же самое в случае с информацией и устройствами в очень миниатюрном чипе, таком как наш. Эта эффективность так же важна для приложений, которые требуют ограничений ресурсов, таких как как мобильные или носимые устройства, так и для приложений, которые чрезвычайно энергоемки,
В 2021 году команда доказала жизнеспособность AlScN как мощного центра вычислений в памяти . Его способность к миниатюризации, низкая стоимость, эффективность использования ресурсов, простота производства и коммерческая осуществимость продемонстрировали серьезные успехи в глазах исследователей и промышленности.
В самом последнем исследовании, посвященном безтранзисторной конструкции, команда отметила, что их ферродиод CIM может работать в 100 раз быстрее, чем обычная вычислительная архитектура.
Другие исследования в этой области успешно использовали архитектуры вычислений в памяти для повышения производительности приложений ИИ. Однако эти решения были ограниченными, неспособными преодолеть противоречивый компромисс между производительностью и гибкостью. Вычислительная архитектура с использованием массивов мемристорных перекладин, дизайн, который имитирует структуру человеческого мозга для обеспечения высокой производительности в операциях нейронной сети, также продемонстрировал замечательную скорость.
Тем не менее, операции нейронной сети, которые используют слои алгоритмов для интерпретации данных и распознавания закономерностей, являются лишь одной из нескольких ключевых категорий задач обработки данных, необходимых для функционального ИИ. Дизайн недостаточно адаптируется, чтобы обеспечить адекватную производительность при любых других операциях с данными ИИ.
Конструкция ферродиодов, разработанная командой, обеспечивает революционную гибкость, которой нет у других архитектур вычислений в памяти. Это обеспечивает превосходную точность, одинаково хорошо выполняя не одну, а три основные операции с данными, которые составляют основу эффективных приложений ИИ — поддерживает встроенное хранилище или способность хранить огромные объемы данных, необходимые для глубокого обучения, параллельного поиска, функции, которая обеспечивает точную фильтрацию и анализ данных, а также ускорение матричного умножения, основного процесса вычислений в нейронных сетях.
Выгода от чипа CIM, который может адаптироваться к нескольким операциям с данными, очевидна: когда команда запустила симуляцию задачи машинного обучения через свой чип, она работала со степенью точности, сравнимой с программным обеспечением на основе ИИ, работающим на обычном ЦП.
«Это исследование очень важно, поскольку оно доказывает, что мы можем полагаться на технологию памяти для разработки чипов, которые интегрируют несколько приложений данных ИИ таким образом, который действительно бросает вызов традиционным вычислительным технологиям», — говорит Лю, первый автор исследования.
Дополнительная информация: Сивен Лю и др., Реконфигурируемые вычисления в памяти на программируемых полем ферроэлектрических диодах, Nano Letters (2022). DOI: 10.1021/acs.nanolett.2c03169
Будьте в курсе в удобном формате, присоединяйтесь: TG-канал и ВК
Бесплатная служба распространения новостей для научных организаций и стартапов
hello@technovery.com