• Главная
  • Лента новостей 1
  • Лента новостей 2
  • Статьи
  • Календарь событий
  • Образование
  • Финансирование
  • Открытые инновации
  • Шоу-рум
  • О проекте
  • Партнеры
  • Добавить публикацию
  • Сервисы
  • Реклама
  • hello@technovery.com
  • telegram
  • vk
technovery
Нет результатов
Все результаты
technovery
Нет результатов
Все результаты

Google опубликовал методику самосовершенствования языковой модели ИИ

12 января, 2023
Цифра
Google опубликовал методику самосовершенствования языковой модели ИИ

Исследователи из Google и Университета Иллинойса в Урбана-Шампейн (UIUC) опубликовали методику под названием « Самоулучшаемая языковая модель » (LMSI), которая настраивает большую языковую модель (LLM) на наборе данных, сгенерированном той же моделью. Используя LMSI, исследователи улучшили производительность LLM в шести контрольных тестах и ​​установили новые рекорды точности в четырех из них.

Команда начала с предварительно обученной модели PaLM с параметрами 540B . Модель была предоставлена ​​в виде входных вопросов из немаркированного обучающего набора данных вместе с подсказками. Модель генерировала ответы на вопросы, которые затем использовались вместе с входными данными в качестве точной настройки обучающего набора данных. Затем отлаженная модель была оценена на наборе эталонных наборов данных для трех различных задач обработки естественного языка (NLP): арифметических рассуждений, рассуждений на основе здравого смысла и вывода на естественном языке. В четырех тестах — ARC-c , OpenBookQA , ANLI-A2 и ANLI-A3 — модель превзошла предыдущие рекорды. По словам команды Google:

Обзор LMSI

Помимо доработанной модели PaLM 540B, команда также исследовала дистилляцию знаний, используя сгенерированный набор данных для тонкой настройки меньших версий PaLM. Команда обнаружила, что точно настроенная модель параметров 62B превзошла предварительно обученную модель параметров 540B, а точно настроенная модель параметров 8B превзошла предварительно обученную модель параметров 62B.

 

Будьте в курсе в удобном формате, присоединяйтесь: TG-канал и ВК

Бесплатная служба распространения новостей для научных организаций и стартапов

hello@technovery.com

 

Source: InfoQ
Теги: AIМашинное обучение

Related Posts

Приложение Glaze защищает художественные произведения от любопытных искусственных интеллектов
Цифра

Приложение Glaze защищает художественные произведения от любопытных искусственных интеллектов

22 марта, 2023
Китайская компания Baidu в ответ на GPT запустила свой искусственный интеллект «ERNIE Bot»
Цифра

Китайская компания Baidu в ответ на GPT запустила свой искусственный интеллект «ERNIE Bot»

20 марта, 2023
Разработана самоуправляемая лаборатория с ИИ, многократно ускоряющая химические исследования
Наука

Разработана самоуправляемая лаборатория с ИИ, многократно ускоряющая химические исследования

17 марта, 2023
Загрузить больше

Технологии

Робототехника
Беспилотники
Машинное обучение
AI
Транспорт
Материалы
ВИЭ
Интернет вещей
Микроэлектроника
Оптика
Носимые устройства

Смотреть все »

Запросы

Х5 Group в партнерстве с платформой Technovery приступают к поиску инновационных проектов для решения проблематики пищевых отходов

СМ Инновации

Тинькофф работает со стартапами

Масштабируйте свой стартап вместе с Контуром

Акселератор ВТБ

АСИ и АВТОВАЗ запустили отбор проектов по развитию автопрома

Х5 Group в партнерстве с платформой Technovery приступают к поиску инновационных проектов для решения проблематики пищевых отходов
Пилотные проекты

Х5 Group в партнерстве с платформой Technovery приступают к поиску инновационных проектов для решения проблематики пищевых отходов

7 марта, 2023

© 2022 technovery

  • hello@technovery.com
  • Условия использования
  • Политика конфиденциальности
Нет результатов
Все результаты
  • Главная
  • Лента новостей 1
  • Лента новостей 2
  • Статьи
  • Календарь событий
  • Образование
  • Финансирование
  • Открытые инновации
  • Шоу-рум
  • Карта технологий
  • О проекте
  • Партнеры
  • Добавить публикацию
  • Сервисы
  • Реклама
  • hello@technovery.com

© 2022 technovery