Квантизация нейронных сетей. Иван Печенко (Samsung)

21.04.2022

Для векторных операций замена 32-битных чисел с плавающей запятой на 8-битные целые числа приводит к кратному увеличению производительности. Техники сокращения битности чисел принято называть квантизацией.

Предлагаем вам прослушать вводную лекцию о квантизации параметров нейронных сетей вообще и о методе LSQ (Learned step size quantization) в частности. Процесс сведения к минимуму возникающих потерь и подбора оптимальных параметров можно сделать обучаемым, главное — правильно реализовать методы дифференцирования.

Иван Печенко, ведущий инженер исследовательского центра Samsung в Москве, рассказывает: что такое квантизация, почему её использование важно в индустрии, как рассчитываются параметры квантизации и как сделать их обучаемыми.

Приглашаем к просмотру!