
T-Meetup: CV & Speech
сб, 05 апрель 2025, 11:00 (GMT+03:00) | |
Россия, Москва, штаб-квартира Т-Банка | |
Бесплатно | |
Есть трансляция | |
![]() |
T-Bank (ex Tinkoff)
|
Теги: conference ml cv speech
Обсудим компьютерное зрение и речевые технологии. Разбор кейсов и размышления
от спикеров Т-Банка, X5 Tech, SberDevices и Avito Tech
Секция Speech
● Нормализация текста с использованием больших языковых моделей для задач синтеза речи — Кирилл Кордюков
Обсуждение необходимости нормализации текста в задачах text-to-speech.
● Как и для чего распознавать эмоции в устной речи? — Владимир Кондратенко
Глубокий анализ задач распознавания эмоций в речи, существующих подходов и практических кейсов применения технологии.
● Протоколы без боли: как мы делали автоматическое протоколирование в X5 — Артем Ерохин
Рассказ о создании сервиса автоматического протоколирования встреч по аудиозаписям с использованием существующих моделей и библиотек, включая архитектуру решения и возникающие сложности.
● Как улучшить качество и скорость обучения системы распознавания речи — Антон Хомяков
Обзор экспериментов с архитектурой, данными и инференсом на примере VoiceKit, направленных на повышение качества и скорости обучения систем распознавания речи.
Секция CV
● Обучение и использование LoRA-адаптеров
для диффузионных моделей — Александр Весельев, MLE в Т-Банке
Расскажу, что такое адаптеры и какие они бывают. Сравню разные LoRA-адаптеры — их преимущества и недостатки. Разберу примеры фреймворков для обучения и их особенности. Обсудим, как обучать LoRA с ограниченными compute-ресурсами
● Как мы учили сети рисовать автомобили пользователей в сфере Авто Т-Банка — Денис Кодин, MLE в Т-Банке
Разберу построение пайплайна генерации персонализированных иконок автомобилей для интерфейса мобильного банка
● VLM: история развития, обзор и наш опыт сравнения — Александр Иванов, MLE в Т-Банке
● Эффективная модерация изображений: как исправлять нарушения, сохраняя количество и качество контента — Владимир Морозов, Senior DS Engineer в Automated Moderation,
Avito Tech
Расскажу, как скрытие нарушений на изображениях вместо блокировки улучшает клиентский опыт, применение блюра сокращает ручные проверки, а inpainting на основе LaMa, LDM и SAM удаляет нарушения с фотографий, сохраняя и улучшая их исходный вид. Также поделюсь примерами внедрения и анализом рисков.