ML Party от Яндекса

ср, 25 октябрь 2023, 18:00 (GMT+02:00)
Сербия, Белград, Стари Град, б-р ВойводеБойовица, д. 12, хаб «Сербская Роза»
Бесплатно
Есть трансляция

Теги:

ML Party — вечерний митап для ML-инженеров в офисах Яндекса и не только. Встречаемся сообществом экспертов в области машинного обучения, чтобы обсудить тренды, новые подходы, решения и вызовы индустрии в неформальной обстановке.

В этот раз поговорим про прикладной проект на стыке технологий машинного обучения и ecom-продукта, обсудим этапы задачи матчинга предложений на товары и потери на разных стадиях, а также рассмотрим один из алгоритмов обучения генеративных моделей с подкреплением. Вас ждут три технических доклада и полезный нетворкинг с экспертами из разных компаний.Мероприятие бесплатное. Зарегистрируйтесь, пожалуйста, чтобы ничего не пропустить.Обращаем ваше внимание, что количество мест в офлайне ограничено пространством зала, поэтому мы вынуждены делать отбор офлайн-участников. Мы пришлём приглашения за 2 дня до мероприятия. Важно отметить, что офлайн-мероприятие 18+.

Если у вас остались вопросы — напишите Насте (ML Devrel Yandex) или задавайте вопросы в чате Yandex for ML.

Расписание

Генеративные модели и методы обучения с подкреплением

Федор Лебедь Разработчик отдела NLP группы YandexGPT Alignment, Яндекс Поиск

Языковые модели учатся генерировать текст, похожий на человеческий, при этом такие аспекты, как полезность, безопасность и правдивость, за исключением фильтрации датасетов, никак не регулируются. Методы обучения с подкреплением позволяют обучить не просто модель, способную генерировать правдоподобный текст, а модель, чьи генерации будут высоко оценены человеком по вышеприведённым аспектам. В этом докладе мы рассмотрим один из таких алгоритмов: DPO и то, как мы применяли его в Яндексе для обучения YandexGPT.

Как мы группируем предложения магазинов в карточки товаров и при чём тут HNSW и CatBoost

Максим Мачула Руководитель службы качества контента в Поиске по Товарам, Яндекс

Расскажу, какую задачу решает поиск по товарам, как придумать метрику, которую можно вырастить и как среди миллиардов предложений найти похожие. Обсудим этапы задачи матчинга предложений на товары и потери на разных стадиях. Поделюсь историей о том, как у нас долго ничего не получалось и мы не знали почему, и только когда сделали все части проекта хорошо — увидели профит.

Нейросетевая генерация ecom-объявлений

Алексей Березникер Руководитель команды генерации рекламы, Яндекс

Поговорим про прикладной проект на стыке технологий машинного обучения и ecom-продукта. Подробно рассмотрим многостадийную систему обучения дискриминативных и генеративных нейронных сетей семейства BERT и GPT соответственно: от подготовки датасета до использования reinforcement learning для улучшения качества генерации. Обсудим подходы к асессорским разметкам и их роль в системе, а также офлайн- и онлайн-механизмы оценки эффективности разработанной системы.