Омар Маддури, докторант кафедры электротехники и вычислительной техники Техасского университета A&M, работает с доктором Бьюнг-Джун Юн, профессором, и доктором Эдвардом Догерти, профессором кафедры Роберта М. Кеннеди, над оценкой моделей машинного обучения. используя принципы трансферного обучения. В проекте также участвуют доктор Фрэнсис «Фрэнк» Александр из Брукхейвенской национальной лаборатории и доктор Сяонин Цянь из факультета электротехники и вычислительной техники Техасского университета A&M.
В машинном обучении на основе данных модели создаются для прогнозирования и оценки того, что должно произойти в любом заданном наборе данных. Одной из важных областей машинного обучения является классификация, которая позволяет оценивать набор данных с помощью алгоритма, а затем классифицировать или разбивать на классы или категории. Когда предоставленные наборы данных очень малы, может быть очень сложно не только построить модель классификации на основе этих данных, но и оценить производительность этой модели, обеспечив ее точность. Здесь в игру вступает трансферное обучение .
«При трансферном обучении мы пытаемся передать знания или принести данные из другой области, чтобы увидеть, можем ли мы улучшить задачу, которую мы выполняем в интересующей или целевой области», — объяснил Маддури.
Целевая область — это место, где строятся модели и оценивается их производительность. Исходный домен — это отдельный домен, который по-прежнему имеет отношение к целевому домену, из которого передаются знания, чтобы упростить анализ в целевом домене.
В проекте Маддури используется совместная априорная плотность для моделирования связи между исходным и целевым доменами и предлагается байесовский подход для применения принципов трансферного обучения для обеспечения общей оценки ошибок моделей. Оценщик ошибок даст оценку того, насколько точны эти модели машинного обучения при классификации имеющихся наборов данных.
Это означает, что до получения каких-либо данных группа создает модель, используя свои первоначальные выводы о параметрах модели в целевой и исходной областях, а затем обновляет эту модель с повышенной точностью по мере появления дополнительных доказательств или информации о наборах данных.
Для эффективного использования разработанный оценщик был реализован с использованием передовых статистических методов, которые позволили быстро проверять наборы исходных данных, что увеличивает вычислительную сложность процесса обучения переносу в 10–20 раз.
Дополнительная информация: Омар Маддури и др., Надежная выборка важности для оценки ошибок в контексте оптимального байесовского трансферного обучения, Patterns (2022). DOI: 10.1016/j.patter.2021.100428
Будьте в курсе в удобном формате, присоединяйтесь: TG-канал и ВК
Бесплатная служба распространения новостей для научных организаций и стартапов
hello@technovery.com