نوشته‌ها با موضوع المپیاد هوش مصنوعی در الگوریتمستان

نوشته‌ها با موضوع المپیاد هوش مصنوعی در الگوریتمستان


شناخت درست داده اولین و مهمترین گام شروع عملیات حوزه‌‌‌های تحلیل داده و یادگیری ماشین است که بر اساس آن مراحل آماده‌سازی داده پایه‌ریزی می‌شوند. این شناخت از یک سو مربوط به منبع اطلاعات و چیستی آنهاست (به عنوان نمونه شناخت کسب و کاری که این دیتا مرتبط با آن است یا فرآیندی که در نهایت منجر به تولید این داده‌ها شده‌اند) و از سوی دیگر بررسی آنچه که اکنون در اختیار ما قرار گرفته است ...
اکتشاف داده با پایتون

نمودار ROC (مخفف Receiver Operating Characteristic) به صورت گرافیکی نمایش می‌دهد که چقدر یک مدل دسته‌بندی عملکرد خوبی دارد و AUC (یا همان مساحت زیر نمودار) یک معیار عددی است که از نمودار ROC مشتق می‌شود و عملکرد کلی یک مدل را خلاصه می‌کند ...
در باب حکمت منحنی ROC و AUC

یکی از مسائل مهم در ساخت مدل یادگیری ماشین و هوش مصنوعی توجه ویزه به موضوع کم‌برازش و بیش‌برازش است تا بتوانیم در نهایت یک مدل عمومی‌تر و قابل قبول بسازیم. این موضوع با پیچیدگی مدل یادگیری ماشین در ارتباط است و محاسبات بایاس و واریانس نیز ابزار مناسبی برای تشخیص هستند ...
بایاس-واریانس و پیچیدگی مدل یادگیری ماشین

توزیع‌های آماری به ما کمک می‌کنند شناخت بهتری از داده‌ها داشته باشیم و در مورد احتمال وقوع پیشامدها با منطق بهتری نظر بدهیم. بنابراین فهم درست تعاریف، تفاوت‌ها و کاربردشان بسیار مهم است. جزوه‌ی بیست صفحه‌ای Probability Distributions Cheat Sheet شامل همه‌ی توزیع‌های احتمالاتی مشهور برای مرور کاربردها و تفاوت‌های آنها است ...
خلاصه توزیع احتمالات

همانطور که می‌دانیم روابط و محاسبات ریاضی پایه و اساس محاسبات یادگیری ماشین و هوش مصنوعی است.در جزوه‌ی ده صفحه‌ای ریاضیات یادگیری ماشین رابطه‌های ریاضی مشهور مورد استفاده در این حوزه‌ها آمده است. ۱- جبر خطی ۲- آمار و احتمال ۳- حسابان ۴- بهینه‌سازی ۵- رگرسیون ۶- شبکه عصبی ۷- کلاسترینگ ۸- کاهش بُعد ۹- توزیع‌های احتمالی ۱۰- یادگیری تقویتی Mathematics for Machine Learning: Essential Equations (V4) ...
ریاضیات یادگیری ماشین

یکی از دغدغه‌هایی که ممکن است در زمان مطالعه‌ی مباحث مربوط به یادگیری ماشین و هوش مصنوعی داشته باشیم، حجم بالای جزئیات الگوریتم‌های آنها است و معمولا هر کتاب هم تنها بخشی از مطالب این حوزه‌ها را پوشش می‌دهد یا حجم کتاب بسیار زیاد است ...
کتاب The Hundred-Page Machine Learning Book

معمولا وقتی روی مدل‌سازی یا تحلیل داده کار می‌کنیم به انتخاب‌های تصادفی از داده یا پارامترهای مدل می‌رسیم و seed یا random_state نقش مهمی برای جلوگیری از نقش این انتخاب‌های تصادفی در مدل نهایی ایفا می‌کنند ...
انتخاب seed درست

کانال یوتیوب StatQuest with Josh Starmer یک منبع آموزشی بسیار خوب در زمینه‌های آمار و ریاضیات دوست‌داشتنی است که با توضیحات جذاب و بصری‌سازی عالی، تفسیرهای ساده و قابل فهم کاربردی در حوزه‌های علم داده و یادگیری ماشین ارائه می‌کند ...
ویدئوهای آموزشی StatQuest