Thu, 07 March 2024, 18:30 (GMT+03:00)
Russia, Saint Petersburg, ул. Малая Монетная, 2Г (БЦ Лангензипен)
Free
Stream available
Community's avatar ODS Moscow

Привет, друзья! С радостью приглашаем вас на уникальное событие, посвященное силе и вкладу женщин в мире данных - митап "Woman In Data Science"! Это не просто встреча, это праздник ума, таланта и вдохновения, организованный ODS SPB при поддержке компании Samokat.tech.

Программа:

  1. [Мега]Матчер. Система соответсвий товаров: ожидания, проблемы и решения в e-comm платформе. | Гращенков Кирилл, Senior ML разработчик в Samokat.tech
  2. Как сделать рекомендации точнее: модель второго уровня в задаче подбора вакансий по резюме | Анастасия Овчинникова, Team Lead DS at Работа.ру
  3. Data Quality - почему это так важно и как выбирать подход | Дина Сафина, head of data platform Ozon.Fintech
  4. Если данных маловато, или Байесом по неопределенности | Оксана Крымина, Actuarial Data Scientist, Страховой дом ВСК

Schedule

[Мега]Матчер. Система соответсвий товаров: ожидания, проблемы и решения в e-comm платформе.

Гращенков Кирилл Senior ML разработчик в Samokat.tech

О чем поговорим:

  • что такое матчинг: зачем о нужен крупным маркетплейсам, какие бизнес-задачи решает
  • в прямом эфире попробуем сматчить товары
  • посмотрим, что под капотом сервиса матчинга товаров и разберем основные подводные камни во время разработки модели: a) Проблема задублированности и почему это проблема б) Проблема последовательного обучения моделей в) Оценка качества модели и калибровка порогов

Как сделать рекомендации точнее: модель второго уровня в задаче подбора вакансий по резюме

Анастасия Овчинникова Team Lead DS at Работа.ру

  1. Описание проблемы. Почему одной модели недостаточно.
  2. Выбираем оптимальную модель.
  3. Работа с признаками: как не погрязнуть в море возможностей и не упустить ничего важного.
  4. Эффективная интеграция модели в production: обеспечение стабильности и масштабируемости
  5. Неожиданные препятствия и пути их преодоления
  6. Модель в проде. Что дальше?

Data Quality - почему это так важно и как выбирать подход

Дина Сафина head of data platform Ozon.Fintech

  • Значение Data Quality в современной компании: как обеспечить высокое качество данных для достоверных результатов моделей и аналитики
  • Инструменты и методы Data Quality: как повысить эффективность анализа данных и минимизировать ошибки
  • Роль Data Quality в успешной реализации проектов по Data Science: ключевые принципы и практические примеры

Если данных маловато, или Байесом по неопределенности

Оксана Крымина Actuarial Data Scientist, Страховой дом ВСК

  1. Мало данных или мало информации? * Информация Фишера
  2. Наблюдаемые признаки недостатка информации * Мало строк записей * Overdispersed Distributions (в таргете и в объясняющих переменных)
  3. Идеальное комбо проблем: марки и модели автомобилей в страховании КАСКО
  4. Байесовские модели: ищем распределение вместо точечной оценки * парадигма байесовского вывода * байесовская ОЛМ (обобщенная линейная модель) * что нужно для реализации в коде: Stan, ресурсные требования
  5. Учесть все: граф знаний и байесовская модель * feature-engineering: группировка (из кластеризации) * аугментация данных * эмбеддинги вершин * иерархическая модель и порождение орграфом