۱. مفهوم اتوانکدر در یادگیری عمیق
اتوانکدر (Autoencoder) یک شبکه عصبی مصنوعی غیرنظارتی است که برای یادگیری ویژگیهای مهم دادهها، کاهش ابعاد و بازسازی دادههای ورودی استفاده میشود. این مدل متشکل از دو بخش است:
این معماری بهطور گسترده در بینایی کامپیوتری، پردازش سیگنال، کاهش نویز، تشخیص ناهنجاری و بازسازی دادهها مورد استفاده قرار میگیرد.
۲. تاریخچه تکامل اتوانکدرها
۲.۱. ظهور اولیه: مدلهای عصبی اولیه (دهه ۱۹۸۰ و ۱۹۹۰)
مفهوم اتوانکدرها به دهه ۱۹۸۰ بازمیگردد، زمانی که پژوهشگران در حوزه شبکههای عصبی تلاش کردند الگوهای تکرارشونده در دادهها را بهطور کارآمد استخراج کنند. اولین پیادهسازیها بهعنوان شبکههای عصبی چندلایه (MLP) با تابع هزینه مبتنی بر بازسازی داده توسعه یافتند.
۲.۲. معرفی یادگیری عمیق و پیشرفتهای اساسی (دهه ۲۰۰۰)
در اوایل دهه ۲۰۰۰، هینتون (Geoffrey Hinton) و همکارانش مفهوم اتوانکدرهای عمیق (Deep Autoencoders) را مطرح کردند. این مدلها از پیشآموزش (Pretraining) لایهای بهره بردند و امکان یادگیری نمایشهای پیچیدهتر از دادهها را فراهم کردند.
۲.۳. دوران مدرن: مدلهای پیشرفته اتوانکدر (۲۰۱۰ به بعد)
تحقیقات در دهه ۲۰۱۰ منجر به توسعه نسخههای پیشرفتهتری از
اتوانکدرها شد، از جمله:
اتوانکدر
واریاسیونی (VAE): یادگیری توزیع
احتمالاتی دادهها.
اتوانکدر
متخاصم (AAE): ترکیب اتوانکدر با شبکههای
متخاصم مولد (GANs) برای بهبود کیفیت
بازسازی دادهها.
اتوانکدر
مقاوم در برابر نویز (DAE): بازسازی دادههای
دارای نویز با استفاده از معماری مقاوم در برابر تغییرات نامطلوب.
این مدلها امروزه در حوزههای مختلفی مانند تشخیص جعل چهره (Deepfake Detection)، فشردهسازی تصویر، تشخیص ناهنجاری و تولید دادههای مصنوعی به کار گرفته میشوند.
۳. معماری و نحوه عملکرد اتوانکدر
اتوانکدرها از یک شبکه عصبی متقارن تشکیل شدهاند که شامل دو بخش اصلی است:
۳.۱. رمزگذار (Encoder)
هدف: تبدیل داده ورودی به یک نمایش فشرده در
فضای نهان.
ساختار: شامل لایههای
کانولوشنی (CNN) یا پرسپترون چندلایه (MLP) است که دادهها را به بردار ویژگی کاهش میدهند.
۳.۲. رمزگشا (Decoder)
هدف: بازسازی داده اولیه از نمایش فشرده.
ساختار: شامل لایههایی مشابه
رمزگذار، اما در جهت معکوس.
۳.۳. تابع هزینه (Loss Function)
در اتوانکدرهای معمولی، تابع هزینه مبتنی بر خطای بازسازی
(Reconstruction Error) مانند MSE (Mean Squared Error) تعریف
میشود.
در اتوانکدرهای واریاسیونی (VAE)،
تابع واگرایی کولبک-لیبلر (KL Divergence) برای منظمسازی فضای
نهان استفاده میشود.
معماری اتوانکدر و مبانی ریاضی
اتوانکدرها شامل دو بخش اصلی هستند:
۳.۱. فرمولبندی ریاضی اتوانکدر
بهطور کلی، فرآیند رمزگذاری و رمزگشایی را میتوان بهصورت زیر مدلسازی کرد:
۱. تبدیل ورودی به نمایش نهفته:
که در آن:
۲. بازسازی داده از نمایش نهفته:
که در آن:
۳.۲. تابع هزینه (Loss Function)
خطای بازسازی (Reconstruction Loss) بهصورت میانگین مربعات خطا (Mean Squared Error - MSE) تعریف میشود: