WiDS Meetup
Thu, 07 March 2024, 18:30 (GMT+03:00) | |
Russia, Saint Petersburg, ул. Малая Монетная, 2Г (БЦ Лангензипен) | |
Free | |
Stream available | |
ODS Moscow
|
Привет, друзья! С радостью приглашаем вас на уникальное событие, посвященное силе и вкладу женщин в мире данных - митап "Woman In Data Science"! Это не просто встреча, это праздник ума, таланта и вдохновения, организованный ODS SPB при поддержке компании Samokat.tech.
Программа:
- [Мега]Матчер. Система соответсвий товаров: ожидания, проблемы и решения в e-comm платформе. | Гращенков Кирилл, Senior ML разработчик в Samokat.tech
- Как сделать рекомендации точнее: модель второго уровня в задаче подбора вакансий по резюме | Анастасия Овчинникова, Team Lead DS at Работа.ру
- Data Quality - почему это так важно и как выбирать подход | Дина Сафина, head of data platform Ozon.Fintech
- Если данных маловато, или Байесом по неопределенности | Оксана Крымина, Actuarial Data Scientist, Страховой дом ВСК
Schedule
[Мега]Матчер. Система соответсвий товаров: ожидания, проблемы и решения в e-comm платформе.
Гращенков Кирилл Senior ML разработчик в Samokat.tech
О чем поговорим:
- что такое матчинг: зачем о нужен крупным маркетплейсам, какие бизнес-задачи решает
- в прямом эфире попробуем сматчить товары
- посмотрим, что под капотом сервиса матчинга товаров и разберем основные подводные камни во время разработки модели: a) Проблема задублированности и почему это проблема б) Проблема последовательного обучения моделей в) Оценка качества модели и калибровка порогов
Как сделать рекомендации точнее: модель второго уровня в задаче подбора вакансий по резюме
Анастасия Овчинникова Team Lead DS at Работа.ру
- Описание проблемы. Почему одной модели недостаточно.
- Выбираем оптимальную модель.
- Работа с признаками: как не погрязнуть в море возможностей и не упустить ничего важного.
- Эффективная интеграция модели в production: обеспечение стабильности и масштабируемости
- Неожиданные препятствия и пути их преодоления
- Модель в проде. Что дальше?
Data Quality - почему это так важно и как выбирать подход
Дина Сафина head of data platform Ozon.Fintech
- Значение Data Quality в современной компании: как обеспечить высокое качество данных для достоверных результатов моделей и аналитики
- Инструменты и методы Data Quality: как повысить эффективность анализа данных и минимизировать ошибки
- Роль Data Quality в успешной реализации проектов по Data Science: ключевые принципы и практические примеры
Если данных маловато, или Байесом по неопределенности
Оксана Крымина Actuarial Data Scientist, Страховой дом ВСК
- Мало данных или мало информации? * Информация Фишера
- Наблюдаемые признаки недостатка информации * Мало строк записей * Overdispersed Distributions (в таргете и в объясняющих переменных)
- Идеальное комбо проблем: марки и модели автомобилей в страховании КАСКО
- Байесовские модели: ищем распределение вместо точечной оценки * парадигма байесовского вывода * байесовская ОЛМ (обобщенная линейная модель) * что нужно для реализации в коде: Stan, ресурсные требования
- Учесть все: граф знаний и байесовская модель * feature-engineering: группировка (из кластеризации) * аугментация данных * эмбеддинги вершин * иерархическая модель и порождение орграфом