آشنایی با Mixed Precision و مزایای آن

همان‌طور که احتمالا می‌دانید اکثر فریمورک‌های اصلی یادگیری عمیق از جمله Tensorflow و PyTorch به صورت پیش‌فرض با floating point های 32 بیتی فرآیند آموزش شبکه‌های عصبی را انجام می‌دهند. تحقیقات شرکت Nvidia نشان می‌دهد که برای رسیدن به بیشترین دقت استفاده از fp32 لزوما ضروری نیست. این شرکت روشی را به نام Mixed Precision طراحی کرده است که ایده آن براساس همین مساله است که می‌توان بخش‌هایی از فرآیند آموزش را با fp16 به جای fp32 انجام داد. در این روش از ترکیبی از هر دوی این ها استفاده می‌شود که به همین دلیل در اسمش از Mixed استفاده شده است. این روش هیچ اثر منفی‌ای بر روی دقت مدل‌ها ندارد اما باعث افزایش چشمگیر سرعت می‌شود.

استفاده از Mixed Precision چه مزایایی دارد؟

با استفاده از fp16 سرعت آموزش شبکه‌ی عصبی شما در حداقل (بسته به معماری مدل) دو برابر خواهد شد. هم‌چنین این کار استفاده از GPU Memory رو نصف می‌کند که موجب می‌شود بتوانید مدل‌های بزرگ‌تری آموزش دهید، مقدار Batch Size را افزایش دهید و یا ورودی شبکه را بزرگ‌تر کنید. به بیان دیگر، یعنی دیگر با خطای Out Of Memory مواجه نخواهید شد! برای مثال در تصویر زیر فرق استفاده از Nvidia V100 در حالت fp16 را در آموزش مدل های مختلف مشاهده می کنید.