Обложка мероприятия T-Meetup: CV & Speech

T-Meetup: CV & Speech

сб, 05 апрель 2025, 11:00 (GMT+03:00)
Россия, Москва, штаб-квартира Т-Банка
Бесплатно
Есть трансляция
Community's avatar T-Bank (ex Tinkoff)

Теги:

Обсудим компьютерное зрение и речевые технологии. Разбор кейсов и размышления
от спикеров Т-Банка, X5 Tech, SberDevices и Avito Tech

Секция Speech

Нормализация текста с использованием больших языковых моделей для задач синтеза речи — Кирилл Кордюков
Обсуждение необходимости нормализации текста в задачах text-to-speech.

Как и для чего распознавать эмоции в устной речи? — Владимир Кондратенко
Глубокий анализ задач распознавания эмоций в речи, существующих подходов и практических кейсов применения технологии.

Протоколы без боли: как мы делали автоматическое протоколирование в X5 — Артем Ерохин
Рассказ о создании сервиса автоматического протоколирования встреч по аудиозаписям с использованием существующих моделей и библиотек, включая архитектуру решения и возникающие сложности.

Как улучшить качество и скорость обучения системы распознавания речи — Антон Хомяков
Обзор экспериментов с архитектурой, данными и инференсом на примере VoiceKit, направленных на повышение качества и скорости обучения систем распознавания речи.

Секция CV

Обучение и использование LoRA-адаптеров
для диффузионных моделей
— Александр Весельев, MLE в Т-Банке
Расскажу, что такое адаптеры и какие они бывают. Сравню разные LoRA-адаптеры — их преимущества и недостатки. Разберу примеры фреймворков для обучения и их особенности. Обсудим, как обучать LoRA с ограниченными compute-ресурсами

Как мы учили сети рисовать автомобили пользователей в сфере Авто Т-Банка — Денис Кодин, MLE в Т-Банке
Разберу построение пайплайна генерации персонализированных иконок автомобилей для интерфейса мобильного банка

VLM: история развития, обзор и наш опыт сравнения — Александр Иванов, MLE в Т-Банке

Эффективная модерация изображений: как исправлять нарушения, сохраняя количество и качество контента — Владимир Морозов, Senior DS Engineer в Automated Moderation,
Avito Tech
Расскажу, как скрытие нарушений на изображениях вместо блокировки улучшает клиентский опыт, применение блюра сокращает ручные проверки, а inpainting на основе LaMa, LDM и SAM удаляет нарушения с фотографий, сохраняя и улучшая их исходный вид. Также поделюсь примерами внедрения и анализом рисков.