Data Augmentation #
تقویت داده ها (Data Augmentation) به معنی افزایش تعداد نقاط داده است. از منظر تصاویر، به معنی افزایش تعداد تصاویر در مجموعه داده ها و از منظر پایگاه داده به معنی افزایش تعداد ردیف ها یا رکوردها یا اشیاء است.
دلیل این کار این است که نقاط داده در اختیار ما بی نهایت نیست. از طرفی هر چه داده ها بیشتر باشند، مدل های یادگیری ماشین/ یادگیری عمیق بهتر عمل می کنند. اما فرآیند جمع آوری داده ها هزینه دارد. این هزینه می تواند مالی، نیروی انسانی، منابع پردازش و زمان باشد. بنابراین، مجبوریم داده های موجود را افزایش دهیم.
برای این کار راه های مختلفی وجود دارد. در داده های تصویری، می توان با چرخش تصویر اصلی، تغییر شرایط نور، بُرش متفاوت و غیره از یک تصویر، نمونه های متفاوتی ایجاد کرد.
البته با این روش امکان رخ دادن بیش برازش وجود دارد و بنابراین باید مراقب این موضوع بود.