Почему вам стоит использовать свой велосипед и почему не стоит Александр Бельских

•

0 gostou•144 visualizações

Почему каждый DL-инженер должен написать свою либу для обучения сеток, а потом отказаться от неё. Расскажу про опыт написания kekas-а, и почему в своей команде мы пользуемся pytorch-lightning как более зрелым решением.

Tecnologia

Почему вам стоит использовать свой
велосипед и почему не стоит
Александр Бельских

Обо мне
TeamLead @ Withy
https://github.com/belskikh/kekas
[ods.ai] - @belskikh

Для чего вообще нужен какой-то фреймворк?
Унификация пайплайнов
Ускорение экспериментов
Уменьшение количества кода
Это отличный повод прочитать доклад

Почему не нужен какой-то фреймворк?
- Копируются баги
- Коллегам сложно работать по вашему фреймворку
- Ограничивает в возможностях
- В реальной работе пайплайн меняется относительно редко

Какие фичи есть в кекасе (и каких там нет)?
● Awesome name
● Mixed Precision (FP16)
● Learning Rate Finder
● One Cycle policy
● Tensoboard logging
● Best checkpoints saving
● Early stopping
● TTA
● Freeze / unfreeze
● Easy customization

И ещё несколько...
- Test Time Augmentations
- One Cycle learning (~warmup)
- Plot logs in notebook
- Add custom callbacks

Что я получил после того, как написал кекас
- очень много веселья
- прокачался как DL-инженер
- получил в руки заточенный под себя инструмент

Почему мы в команде (больше) не используем кекас
- нет доков -> только я знаю внутренности
- нет Distributed training
- недостаточно гибкости для генеративных моделей
- не всех устраивает название

Чем пользуемся сейчас
Pytorch-lightning (https://github.com/PyTorchLightning/pytorch-lightning)

Фичи pytorch-lightning
● Running grid search on a cluster
● Fast dev run
● Logging
● Implement Your Own Distributed (DDP) training
● Multi-GPU & Multi-node
● Training loop
● Hooks
● Configure optimizers
● Validations
● Model saving & Restoring training session

Заключение
Написание своего велосипеда это отличное упражнение и обязательно вас
прокачает
Но в команде лучше пользоваться чем-то общим - написать свой совместный
или же воспользоваться готовым

Mais conteúdo relacionado

Mais procurados

Организация надежного резервного копирования веб-проекта. Практика и подводны...Anton Baranov

сервис нагрузочного тестирования Ddosme.ru, иван самсоновOntico

Готовим тестовое окружение, или сколько тестовых инстансов вам нужно / Алекса...Ontico

Нагрузочное тестирование с помощью Яндекс.ТанкаAleksandr Boichenko

Опыт разработки модуля межсетевого экранирования для MySQL / Олег Брославский...Ontico

Why we did not choose HadoopSerguei Gitinsky

Антон ГалицынCodeFest

Optimization of a big PostgreSQL databaseAlex Chistyakov

Repeatability on DevOps-40 meetup Apr 2014Alex Chistyakov

Docker в работе: взгляд на его использование в Badoo через год / Турецкий Ант...Ontico

Веб-сервер Phantomyaevents

«Масштабируемый DevOps» Александр КолесеньIT Share

presentation_r00t_confMax Glekov

Нагрузочное тестирование с помощью Яндекс.Танк - Алексей Лавренюк, PyCon RU 2...it-people

Всему своё время / Роман Ивлиев (Банки.ру)Ontico

Производительность WebGL-приложений / Дмитренко Кирилл (Яндекс)Ontico

КРИ-2013. "Нагрузочное тестирование или Боты - санитары сервера"Alexander Akbashev

Как превратить Openstack Swift в хранилище для высоких нагрузок разных типов,...Ontico

Григорий Липин: Автоматизация нагрузочного тестированияYandex

Mais procurados (19)

Организация надежного резервного копирования веб-проекта. Практика и подводны...

сервис нагрузочного тестирования Ddosme.ru, иван самсонов

Готовим тестовое окружение, или сколько тестовых инстансов вам нужно / Алекса...

Нагрузочное тестирование с помощью Яндекс.Танка

Опыт разработки модуля межсетевого экранирования для MySQL / Олег Брославский...

Why we did not choose Hadoop

Антон Галицын

Optimization of a big PostgreSQL database

Repeatability on DevOps-40 meetup Apr 2014

Docker в работе: взгляд на его использование в Badoo через год / Турецкий Ант...

Веб-сервер Phantom

«Масштабируемый DevOps» Александр Колесень

presentation_r00t_conf

Нагрузочное тестирование с помощью Яндекс.Танк - Алексей Лавренюк, PyCon RU 2...

Всему своё время / Роман Ивлиев (Банки.ру)

Производительность WebGL-приложений / Дмитренко Кирилл (Яндекс)

КРИ-2013. "Нагрузочное тестирование или Боты - санитары сервера"

Как превратить Openstack Swift в хранилище для высоких нагрузок разных типов,...

Григорий Липин: Автоматизация нагрузочного тестирования

Semelhante a Почему вам стоит использовать свой велосипед и почему не стоит Александр Бельских

Пайплайн машинного обучения на Apache Spark / Павел Клеменков (Rambler&Co)Ontico

Dmitriy Pasko_NuGet - package management for .NETCiklum

JS Lab2017_Алексей Зеленюк_Сбалансированное окружение для вашей продуктивностиGeeksLab Odessa

Zero Downtime PHP Deployment with Envoyer And ForgeYehor Herasymchuk

EPAM Insider - Izhevsk - Agile in real worldYury Shilyaev

Новые технологии репликации данных в PostgreSQL / Александр Алексеев (Postgre...Ontico

Резервное копирование MySQL в экстремальных условияхSveta Smirnova

2 bdw.keyantishmanti

Gitlab devconfAndrey Kumanyaev

How to cook a blockchain and not get burned Alexander Syrotenko

20160303 Hacking PostgreSQL Тема 02 Сообщество PostgreSQL и инструменты разра...Rais Charipov

Какой фреймворк нам нужен для Web? Денис ЦыплаковAlex Tumanoff

20111002 information retrieval raskovalov_lecture3Computer Science Club

разработка бизнес приложений (7)Alexander Gornik

2013-11-09 02 Александр Самолов. Фреймворки - сладкое злоОмские ИТ-субботники

ORM технологии в .NET (Nhibernate, Linq To SQL, Entity Framework)Pavel Tsukanov

Dive into DevOps | March, How we've migrated projects into Kubernetes and nob...Provectus

Moscow Jenkins Meetup #1. Pipeline для инженеров. Обзор экосистемыOleg Nenashev

Стекаем и Блендим. Разбор популярных библиотек Python, Дмитрий Буслов. 22 июн...Mail.ru Group

JS Lab2017_Redux: время двигаться дальше?_Екатерина ЛизогубоваGeeksLab Odessa

Semelhante a Почему вам стоит использовать свой велосипед и почему не стоит Александр Бельских (20)

Пайплайн машинного обучения на Apache Spark / Павел Клеменков (Rambler&Co)

Dmitriy Pasko_NuGet - package management for .NET

JS Lab2017_Алексей Зеленюк_Сбалансированное окружение для вашей продуктивности

Zero Downtime PHP Deployment with Envoyer And Forge

EPAM Insider - Izhevsk - Agile in real world

Новые технологии репликации данных в PostgreSQL / Александр Алексеев (Postgre...

Резервное копирование MySQL в экстремальных условиях

2 bdw.key

Gitlab devconf

How to cook a blockchain and not get burned

20160303 Hacking PostgreSQL Тема 02 Сообщество PostgreSQL и инструменты разра...

Какой фреймворк нам нужен для Web? Денис Цыплаков

20111002 information retrieval raskovalov_lecture3

разработка бизнес приложений (7)

2013-11-09 02 Александр Самолов. Фреймворки - сладкое зло

ORM технологии в .NET (Nhibernate, Linq To SQL, Entity Framework)

Dive into DevOps | March, How we've migrated projects into Kubernetes and nob...

Moscow Jenkins Meetup #1. Pipeline для инженеров. Обзор экосистемы

Стекаем и Блендим. Разбор популярных библиотек Python, Дмитрий Буслов. 22 июн...

JS Lab2017_Redux: время двигаться дальше?_Екатерина Лизогубова

Mais de Mail.ru Group

Автоматизация без тест-инженеров по автоматизации, Мария Терехина и Владислав...Mail.ru Group

BDD для фронтенда. Автоматизация тестирования с Cucumber, Cypress и Jenkins, ...Mail.ru Group

Другая сторона баг-баунти-программ: как это выглядит изнутри, Владимир ДубровинMail.ru Group

Использование Fiddler и Charles при тестировании фронтенда проекта pulse.mail...Mail.ru Group

Управление инцидентами в Почте Mail.ru, Антон ВикторовMail.ru Group

DAST в CI/CD, Ольга СвиридоваMail.ru Group

CV в пайплайне распознавания ценников товаров: трюки и хитрости Николай Масл...Mail.ru Group

RAPIDS: ускоряем Pandas и scikit-learn на GPU Павел Клеменков, NVidiaMail.ru Group

WebAuthn в реальной жизни, Анатолий ОстапенкоMail.ru Group

AMP для электронной почты, Сергей ПешковMail.ru Group

Как мы захотели TWA и сделали его без мобильных разработчиков, Данила СтрелковMail.ru Group

Кейсы использования PWA для партнерских предложений в Delivery Club, Никита Б...Mail.ru Group

Метапрограммирование: строим конечный автомат, Сергей Федоров, Яндекс.ТаксиMail.ru Group

Как не сделать врагами архитектуру и оптимизацию, Кирилл Березин, Mail.ru GroupMail.ru Group

Этика искусственного интеллекта, Александр Кармаев (AI Journey)Mail.ru Group

Нейро-машинный перевод в вопросно-ответных системах, Федор Федоренко (AI Jour...Mail.ru Group

Конвергенция технологий как тренд развития искусственного интеллекта, Владими...Mail.ru Group

Обзор трендов рекомендательных систем от Пульса, Андрей Мурашев (AI Journey)Mail.ru Group

Мир глазами нейросетей, Данила Байгушев, Александр Сноркин ()Mail.ru Group

Learning from Swift sources, Иван СметанинMail.ru Group

Mais de Mail.ru Group (20)

Автоматизация без тест-инженеров по автоматизации, Мария Терехина и Владислав...

BDD для фронтенда. Автоматизация тестирования с Cucumber, Cypress и Jenkins, ...

Другая сторона баг-баунти-программ: как это выглядит изнутри, Владимир Дубровин

Использование Fiddler и Charles при тестировании фронтенда проекта pulse.mail...

Управление инцидентами в Почте Mail.ru, Антон Викторов

DAST в CI/CD, Ольга Свиридова

CV в пайплайне распознавания ценников товаров: трюки и хитрости Николай Масл...

RAPIDS: ускоряем Pandas и scikit-learn на GPU Павел Клеменков, NVidia

WebAuthn в реальной жизни, Анатолий Остапенко

AMP для электронной почты, Сергей Пешков

Как мы захотели TWA и сделали его без мобильных разработчиков, Данила Стрелков

Кейсы использования PWA для партнерских предложений в Delivery Club, Никита Б...

Метапрограммирование: строим конечный автомат, Сергей Федоров, Яндекс.Такси

Как не сделать врагами архитектуру и оптимизацию, Кирилл Березин, Mail.ru Group

Этика искусственного интеллекта, Александр Кармаев (AI Journey)

Нейро-машинный перевод в вопросно-ответных системах, Федор Федоренко (AI Jour...

Конвергенция технологий как тренд развития искусственного интеллекта, Владими...

Обзор трендов рекомендательных систем от Пульса, Андрей Мурашев (AI Journey)

Мир глазами нейросетей, Данила Байгушев, Александр Сноркин ()

Learning from Swift sources, Иван Сметанин

Почему вам стоит использовать свой велосипед и почему не стоит Александр Бельских

1. Почему вам стоит использовать свой велосипед и почему не стоит Александр Бельских

2. Обо мне TeamLead @ Withy https://github.com/belskikh/kekas [ods.ai] - @belskikh

3. О чем этот доклад?

4. Для чего вообще нужен какой-то фреймворк? Унификация пайплайнов Ускорение экспериментов Уменьшение количества кода Это отличный повод прочитать доклад

5. Для чего вообще нужен какой-то фреймворк? Унификация пайплайнов Ускорение экспериментов Уменьшение количества кода Это отличный повод прочитать доклад

6. Для чего вообще нужен какой-то фреймворк? Унификация пайплайнов Ускорение экспериментов Уменьшение количества кода Это отличный повод прочитать доклад

7. Для чего вообще нужен какой-то фреймворк? Унификация пайплайнов Ускорение экспериментов Уменьшение количества кода Это отличный повод прочитать доклад

8. Почему не нужен какой-то фреймворк? - Копируются баги - Коллегам сложно работать по вашему фреймворку - Ограничивает в возможностях - В реальной работе пайплайн меняется относительно редко

9. Как появился на свет кекас?

10. Что собой представляет кекас?

11. Какие фичи есть в кекасе (и каких там нет)? ● Awesome name ● Mixed Precision (FP16) ● Learning Rate Finder ● One Cycle policy ● Tensoboard logging ● Best checkpoints saving ● Early stopping ● TTA ● Freeze / unfreeze ● Easy customization

12. Какие фичи есть в кекасе (и каких там нет)? ● Awesome name ● Mixed Precision (FP16) ● Learning Rate Finder ● One Cycle policy ● Tensoboard logging ● Best checkpoints saving ● Early stopping ● TTA ● Freeze / unfreeze ● Easy customization ● “Normal” name ● Tests ● Documentation ● Distributed training

13. Чуть подробнее про коллбеки

14. Чуть подробнее про коллбеки

15. Пример использования кекаса ТЫК

16. Инициализация

17. Обычное обучение

18. Обучение с другим оптимизатором

19. Обучение со шкедулером

20. Логгирование

21. Сохранение чекпоинтов

22. Ранняя остановка обучения

23. Всё вместе

24. Заморозка / разморозка весов

25. Сохранение/загрузка весов модели

26. Сохранение/загрузка весов модели

27. Инференс модели

28. И ещё несколько... - Test Time Augmentations - One Cycle learning (~warmup) - Plot logs in notebook - Add custom callbacks

29. Что я получил после того, как написал кекас - очень много веселья - прокачался как DL-инженер - получил в руки заточенный под себя инструмент

30. Почему мы в команде (больше) не используем кекас - нет доков -> только я знаю внутренности - нет Distributed training - недостаточно гибкости для генеративных моделей - не всех устраивает название

31. Чем пользуемся сейчас Pytorch-lightning (https://github.com/PyTorchLightning/pytorch-lightning)

32. Фичи pytorch-lightning ● Running grid search on a cluster ● Fast dev run ● Logging ● Implement Your Own Distributed (DDP) training ● Multi-GPU & Multi-node ● Training loop ● Hooks ● Configure optimizers ● Validations ● Model saving & Restoring training session

33. Интерфейс

34. Обучение

35. Заключение Написание своего велосипеда это отличное упражнение и обязательно вас прокачает Но в команде лучше пользоваться чем-то общим - написать свой совместный или же воспользоваться готовым

36. Спасибо!

Почему вам стоит использовать свой велосипед и почему не стоит Александр Бельских

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (19)

Semelhante a Почему вам стоит использовать свой велосипед и почему не стоит Александр Бельских

Semelhante a Почему вам стоит использовать свой велосипед и почему не стоит Александр Бельских (20)

Mais de Mail.ru Group

Mais de Mail.ru Group (20)

Почему вам стоит использовать свой велосипед и почему не стоит Александр Бельских