TensorFlow, PyTorch и Keras: эти три фреймворка для глубокого обучения годами доминировали в ИИ, даже несмотря на то, что новые участники набирают обороты. Но один фреймворк, о котором вы мало слышали на Западе, — это китайский PaddlePaddle , самый популярный китайский фреймворк в самой густонаселенной стране мира.
Это простая в использовании, эффективная, гибкая и масштабируемая платформа глубокого обучения, изначально разработанная Baidu, китайским гигантом в области искусственного интеллекта, для применения глубокого обучения ко многим собственных продуктах. Сегодня платформу используют более 4,77 миллиона разработчиков и 180 000 предприятий по всему миру.
Baidu недавно объявила о новых обновлениях PaddlePaddle, а также о 10 больших моделях глубокого обучения, которые охватывают обработку естественного языка, зрение и вычислительную биологию. Среди моделей — модель обработки естественного языка (NLP) с сотней миллиардов параметров под названием ERNIE 3.0 Zeus, предварительно обученная модель для географии и языка под названием ERNIE-GeoL и предварительно обученная модель для обучения составным представлениям под названием HELIX-GEM.
Компания также создала три новых крупных отраслевых модели — одну для электроэнергетики, одну для банковского дела и еще одну для аэрокосмической отрасли — путем точной настройки модели ERNIE 3.0 Titan компании с отраслевыми данными и экспертными знаниями в задачах обучения без учителя . .
Платформы программного обеспечения представляют собой пакеты связанных вспомогательных программ, компиляторов, библиотек кода, наборов инструментов и интерфейсов прикладного программирования (API), позволяющих разрабатывать проект или систему. Фреймворки глубокого обучения объединяют все необходимое для проектирования, обучения и проверки глубоких нейронных сетей с помощью высокоуровневого интерфейса программирования. Без этих инструментов реализация алгоритмов глубокого обучения заняла бы много времени, потому что в противном случае повторно используемые фрагменты кода пришлось бы писать с нуля.
Baidu начала разрабатывать такие инструменты еще в 2012 году, через несколько месяцев после прорыва Джеффри Хинтона в области глубокого обучения на конкурсе ImageNet.
В 2013 году докторант Калифорнийского университета в Беркли создал фреймворк под названием Caffe, поддерживающий сверточные нейронные сети, используемые в исследованиях компьютерного зрения. Baidu использовала Caffe для разработки PaddlePaddle, которая поддерживала рекуррентные нейронные сети в дополнение к сверточным нейронным сетям, что давало ей преимущество.
Название PaddlePaddle происходит от PArallel Distributed Deep Learning, ссылки на способность платформы обучать модели на нескольких графических процессорах.
TensorFlow с открытым исходным кодом от Google в 2015 году и Baidu с открытым исходным кодом PaddlePaddle в следующем году. Когда Эрик Шмидт представил TensorFlow в Китае в 2017 году, оказалось, что Китай его опередил.
В то время как TensorFlow и PyTorch от Meta (организация, запрещенная в России), остаются популярными в Китае, PaddlePaddle больше ориентирован на промышленных пользователей.
«Мы приложили много усилий, чтобы снизить входные барьеры для частных лиц и компаний», — сказал Ма Янцзюнь , генеральный менеджер экосистемы технологий искусственного интеллекта в Baidu.
PyTorch и TensorFlow требуют от пользователей большего опыта глубокого обучения по сравнению с PaddlePaddle, наборы инструментов которого предназначены для неспециалистов в производственных средах.
«В Китае многие разработчики пытаются использовать ИИ в своей работе, но у них нет большого опыта в области ИИ», — пояснил Ма. «Поэтому, чтобы расширить использование ИИ в различных отраслях промышленности, мы предоставили PaddlePaddle множество наборов инструментов с низким порогом, которые проще в использовании, чтобы их могло использовать более широкое сообщество».
Инженеры по ИИ обычно мало знают об отраслевых секторах, а отраслевые эксперты мало что знают об ИИ. Но простой для понимания код PaddlePaddle поставляется с множеством учебных материалов и инструментов, которые помогут пользователям. Он легко масштабируется и имеет полный набор API для удовлетворения различных потребностей.
Он поддерживает крупномасштабное обучение данных и может параллельно обучать сотни машин. Он предоставляет нейронно-машинную систему перевода, рекомендательные системы, классификацию изображений, анализ настроений и маркировку семантических ролей.
По словам Ма, наборы инструментов и библиотеки — сильная сторона PaddlePaddle. Например, PaddleSeg можно использовать для сегментации изображений. PaddleDetection можно использовать для обнаружения объектов. «Мы охватываем весь конвейер разработки ИИ от обработки данных до обучения, сжатия моделей, адаптации к различному оборудованию, — сказал Ма, — а затем как развернуть их в разных системах, например, в Windows или в Linux. операционной системы или на чипе Intel или на чипе Nvidia».
На платформе также размещены наборы инструментов для передовых исследовательских целей, такие как Paddle Quantum для моделей квантовых вычислений и Paddle Graph Learning для моделей обучения на основе графов.
«Вот почему PaddlePaddle сейчас очень популярен в Китае», — сказал он. «Разработчики используют такие наборы инструментов, а не только сам инструмент».
Поскольку исходный код был открытым, PaddlePaddle быстро развивалась, чтобы иметь лучшую производительность и удобство для пользователей в различных отраслях промышленности за пределами Baidu, а также в странах за пределами Китая благодаря обширной документации на английском языке. В настоящее время PaddlePaddle предлагает более 500 алгоритмов и предварительно обученных моделей для быстрой разработки промышленных приложений. Baidu работала над уменьшением размера моделей, чтобы их можно было развернуть в реальных приложениях. Некоторые из моделей очень маленькие и быстрые, и их можно развернуть на камере или мобильном телефоне.
Промышленное применение PaddlePaddle
Транспортные компании используют PaddlePaddle для развертывания моделей ИИ, которые контролируют светофоры и повышают эффективность дорожного движения.
Компании-производители используют PaddlePaddle для повышения производительности и снижения затрат.
Перерабатывающие компании используют PaddlePaddle для разработки моделей обнаружения объектов, которые могут идентифицировать различные типы мусора для робота, сортирующего мусор .
Округ Шоугуан в провинции Шаньдун внедряет искусственный интеллект для мониторинга роста различных овощей, предлагая фермерам лучшее время для их сбора и упаковки.
В Юго-Восточной Азии PaddlePaddle использовался для управления лесными дронами с искусственным интеллектом для предотвращения пожаров.
PaddlePaddle использует технологию сервера параметров для обучения разреженных моделей, которые можно использовать в рекомендательных системах и поиске в реальном времени. Но система также объединила модели в еще более крупные системы, которые используются для сценариев, не требующих результатов в реальном времени, таких как генерация текста или генерация изображений.
Baidu рассматривает большие плотные модели как еще один способ уменьшить барьер для внедрения ИИ, поскольку так называемые базовые модели можно адаптировать к конкретным сценариям. Без базовой модели вам нужно разрабатывать все с нуля.
Ма сказал, что области исследований сближаются с кросс-модельным обучением различных модальностей, таких как речь и зрение. Он сказал, что Baidu также использует графы знаний в процессе глубокого обучения. «Раньше система глубокого обучения работала с необработанными текстами или необработанными изображениями без ввода каких-либо знаний, и система использовала самообучение для сбора правил вне данных», — сказал Ма. «Но теперь мы рассматриваем графы знаний в качестве входных данных».
Будьте в курсе в удобном формате, присоединяйтесь: TG-канал и ВК
Бесплатная служба распространения новостей для научных организаций и стартапов
hello@technovery.com