نوشته‌ها با موضوع تحلیل داده در الگوریتمستان

نوشته‌ها با موضوع تحلیل داده در الگوریتمستان


هر محصول علاوه بر توسعه نیاز به پشتیبانی و نگهداشت دارد. مدل‌های تحلیل داده و یادگیری ماشین نیز از این قاعده مستثنی نیستند. این مدل‌ها بر اساس مجموعه‌ای از داده‌ها ساخته می‌شوند. اما پس از استقرار در محصول و گذشت زمان، غیرقابل اعتماد و قدیمی شده و دقت کاهش می‌یابد ...
مراقبت از رانش داده‌ها

شناخت درست داده اولین و مهمترین گام شروع عملیات حوزه‌‌‌های تحلیل داده و یادگیری ماشین است که بر اساس آن مراحل آماده‌سازی داده پایه‌ریزی می‌شوند. این شناخت از یک سو مربوط به منبع اطلاعات و چیستی آنهاست (به عنوان نمونه شناخت کسب و کاری که این دیتا مرتبط با آن است یا فرآیندی که در نهایت منجر به تولید این داده‌ها شده‌اند) و از سوی دیگر بررسی آنچه که اکنون در اختیار ما قرار گرفته است ...
اکتشاف داده با پایتون

در دنیای علم کامپیوتر و فناوری اطلاعات، ضرب‌المثل معروفی وجود دارد که می‌گوید: «Garbage In, Garbage Out»؛ یعنی اگر داده‌های ورودی نامناسب باشند، خروجی نیز قابل اعتماد نخواهد بود. در حوزه‌ی علم داده که کیفیت اطلاعات ورودی نقش اساسی در نتایج نهایی دارد، می‌توان گفت معادل فارسی این مفهوم، همان ضرب‌المثل «خشت اول گر نهد معمار کج ...
معرفی ابزار Great Expectations

امروز هنگام مرتب‌سازی فایل‌های دسته‌بندی‌نشده‌ام، به فایلی برخوردم که متاسفانه به خاطر ندارم چه زمانی و از چه منبعی آن را دریافت کرده‌ام. با این حال، این فایل به‌صورت خلاصه و منسجم، در یک صفحه کلیات مفاهیم آماری از جمله تعاریف و کاربردها، شاخص‌های آماری مهم، آزمون‌های پارامتریک و ناپارامتریک را در بر دارد ...
برگه تقلب آمار

توزیع‌های آماری به ما کمک می‌کنند شناخت بهتری از داده‌ها داشته باشیم و در مورد احتمال وقوع پیشامدها با منطق بهتری نظر بدهیم. بنابراین فهم درست تعاریف، تفاوت‌ها و کاربردشان بسیار مهم است. جزوه‌ی بیست صفحه‌ای Probability Distributions Cheat Sheet شامل همه‌ی توزیع‌های احتمالاتی مشهور برای مرور کاربردها و تفاوت‌های آنها است ...
خلاصه توزیع احتمالات

این روزها هر جا صحبت از تحلیل داده یا هوش تجاری می‌شود، معمولا از ابزارهایی مانند زبان برنامه‌نویسی پایتون یا PowerBI نیز سخن به میان می‌آید. اما این حوزه قدمتی بیشتر از این ابزارهای مدرن دارد و در دهه‌های گذشته سازمان‌ها برای مدیریت و تحلیل داده‌ها از روش‌های ساده‌تر دیگری استفاده می‌کردند ...
دوره تحلیل داده با اکسل کوئرا

کتاب «Practical Statistics for Data Scientists» یک منبع جامع و کاربردی برای معرفی مفاهیم و تکنیک‌های آماری ضروری در حوزه‌های تحلیل داده‌ها، یادگیری ماشین و هوش مصنوعی است. در این کتاب، مفاهیم آماری به شیوه‌ای قابل فهم و با استفاده از سناریوهای واقعی علم داده و کدهای نمونه به زبان‌های R و پایتون ارائه شده است ...
کتاب آمار عملی برای دانشمندان داده

کانال یوتیوب StatQuest with Josh Starmer یک منبع آموزشی بسیار خوب در زمینه‌های آمار و ریاضیات دوست‌داشتنی است که با توضیحات جذاب و بصری‌سازی عالی، تفسیرهای ساده و قابل فهم کاربردی در حوزه‌های علم داده و یادگیری ماشین ارائه می‌کند ...
ویدئوهای آموزشی StatQuest

ویراست سوم کتاب Python for Data Analysis انتشارات O’Reilly با دسترسی آزاد در قالب html هم منتشر شد. Python for Data Analysis, 3E ...
کتاب رایگان Python for Data Analysis