هر محصول علاوه بر توسعه نیاز به پشتیبانی و نگهداشت دارد. مدلهای تحلیل داده و یادگیری ماشین نیز از این قاعده مستثنی نیستند. این مدلها بر اساس مجموعهای از دادهها ساخته میشوند. اما پس از استقرار در محصول و گذشت زمان، غیرقابل اعتماد و قدیمی شده و دقت کاهش مییابد. دلیل این موضوع این است که دادههای ورودی جدید در محیط واقعی تغییر میکنند و ممکن است باعث عملکرد ناعادلانه مدل شود. تغییرات ممکن است در مفهوم داده یا توزیع ویژگیها اتفاق بیافتد.
مقالهی زیر در مورد اهمیت رصد تغییرات در دادهها، روشهای شناسایی این تغییرات با استفاده از تستهای مختلف و مدیریت این تغییرات در محصول با استفاده از زبان برنامهنویسی پایتون بحث میکند.
The Importance of Data Drift Detection that Data Scientists Do Not Know