شناخت درست داده اولین و مهمترین گام شروع عملیات حوزههای تحلیل داده و یادگیری ماشین است که بر اساس آن مراحل آمادهسازی داده پایهریزی میشوند. این شناخت از یک سو مربوط به منبع اطلاعات و چیستی آنهاست (به عنوان نمونه شناخت کسب و کاری که این دیتا مرتبط با آن است یا فرآیندی که در نهایت منجر به تولید این دادهها شدهاند) و از سوی دیگر بررسی آنچه که اکنون در اختیار ما قرار گرفته است. در این مقاله ۱۱ گام مهم اکتشاف در دادهها با استفاده از زبان برنامهنویسی پایتون شرح داده شده است.
11 Essential Code Blocks for Complete EDA