Для векторных операций замена 32-битных чисел с плавающей запятой на 8-битные целые числа приводит к кратному увеличению производительности. Техники сокращения битности чисел принято называть квантизацией.
Предлагаем вам прослушать вводную лекцию о квантизации параметров нейронных сетей вообще и о методе LSQ (Learned step size quantization) в частности. Процесс сведения к минимуму возникающих потерь и подбора оптимальных параметров можно сделать обучаемым, главное — правильно реализовать методы дифференцирования.
Иван Печенко, ведущий инженер исследовательского центра Samsung в Москве, рассказывает: что такое квантизация, почему её использование важно в индустрии, как рассчитываются параметры квантизации и как сделать их обучаемыми.
Приглашаем к просмотру!
Больше лекций по ИИ от наших спикеров: