Под давлением инвесторов и партнеров китайский ИТ-гигант спешно представил Ernie, чатбот на базе собственного мультимодального искусственного интеллекта. Релиз бета-версии прошел за закрытыми дверями, только для избранных пользователей, без обычной для индустрии живой демонстрации возможностей.
Соучредитель Baidu, председатель и главный исполнительный директор Янхун «Робин» Ли провел пять коротких, по-видимому, предварительно записанных демонстраций возможностей ИИ. В первом он попросил его кратко изложить сюжет научно-фантастического сериала «Три тела» Цысинь Лю (хорошее чтение, если вы еще не погрузились в китайскую научную фантастику). Он спросил ИИ, как он может продолжить книги с философской точки зрения и что общего между главными актерами в фильмах.
Не говоря по-китайски, трудно оценить, как работала модель, но Ли заявил, что эти задачи обычно приводят к высокой вероятности ошибок в такой языковой модели, как эта, и сказал, что ERNIE Bot легко с ними справился. Похоже, что ИИ имеет доступ к результатам поиска и знаниям помимо своих первоначальных обучающих данных: «Бот ERNIE использует расширение поиска и расширение знаний», — сказал Ли. У нас есть 550 миллиардов точек данных знаний, поэтому мы можем гарантировать, что ответы ERNIE будут в основном правильными».
Второе задание было более творческим и ориентированным на бизнес: ИИ просили предложить названия компаний и соответствующие слоганы для высокотехнологичной сервисной компании, а также первоначальный информационный бюллетень компании объемом 600 слов. Третий поставил под сомнение «математическое логическое мышление» и его способность указывать на недостатки во входных подсказках.
Четвертый продемонстрировал понимание ERNIE Bot китайского языка и контекста, а также его способность работать в рамках творческих ограничений. Была добавлена известная китайская идиома, примерно означающая «бумага из Лояна дорогая», и ИИ правильно распознал ее как аллегорию экономики спроса и предложения. Затем он смог написать китайское стихотворение, в котором каждый символ идиомы был встроен в каждое предложение стихотворения.
Чтобы увидеть, отличает ли это ERNIE Bot от англоязычных конкурентов, таких как ChatGPT, я запустил аналогичную подсказку в GPT-4 и обнаружил, что у нее нет проблем с тем же самым — при условии, что ее китайский язык не звучит неестественно для носителей языка.
Финальная демонстрация продемонстрировала свою мультимодальную креативность — и здесь ERNIE Bot продемонстрировал некоторые возможности, которые GPT еще не включил, поскольку он только начинает открывать доступ к входным данным на основе изображений и в настоящее время выводит только текст. .
Его попросили создать изображение плаката для Всемирной конференции по интеллектуальному транспорту 2023 года, что, похоже, было сделано с впечатляющей скоростью. Затем был задан вопрос, какие города будут наиболее подходящими для развития упомянутого интеллектуального транспорта. Затем ему сказали зачитать ответ на сычуаньском диалекте, что он и сделал. Затем Ли просто сказал ему «сделать из этого видео». Он выполнил эту задачу с ошеломляющей скоростью, и ему потребовалось около десяти секунд, чтобы быть готовым к воспроизведению. Вы можете увидеть эту демонстрацию в видео ниже — пропустите примерно 1:20, если вы просто хотите посмотреть видео.
Однако, этот несколько поспешный запуск, похоже, не впечатлил инвесторов Baidu, и, как сообщает CNBC , акции компании упали на целых 10% во время презентации, а к концу дня в Гонконге они упали примерно на 6,4%, что стало самым низким показателем с 19 января.
Ли пообещал, что технология Ernie будет постоянно совершенствоваться и подгоняться под запросы пользователей, а также объявил о намерении разработать дополнительные слои поверх языковой модели с использованием обучающих данных из различных отраслей промышленности. По его словам, примерно к 2030 году ожидается значительный рост производительности благодаря ИИ, и Baidu хочет сделать специализированные большие модели, говорящие на языке отдельных отраслей, например, энергетики, транспорта или СМИ.
Будьте в курсе в удобном формате, присоединяйтесь: TG-канал и ВК
Бесплатная служба распространения новостей для научных организаций и стартапов
hello@technovery.com