نوشته‌ها با موضوع هوش مصنوعی در الگوریتمستان

نوشته‌ها با موضوع هوش مصنوعی در الگوریتمستان


ریپوی AI-Links یک دایرکتوری شامل صدها لینک هوش مصنوعی‌های کاربردی نظم دهی شده با توجه به کاربرد و نوع استفاده، شامل چت‌بات‌ها، تولید تصویر، ویدیو، صدا، کدنویسی و ابزارهای کاربردی دیگر است. AI-Links بانک ابزارهای هوش مصنوعی ...
ریپوی بانک ابزارهای هوش مصنوعی

این روزها همه جا صحبت از هوش مصنوعی و اثر آن حتی در زندگی روزمره است. اما اگر در ابعاد کلان به عنوان پیشروان علم هوش مصنوعی یا توسعه‌دهندگان محصولات مبتنی بر این حوزه به قضیه نگاه کنیم، چالش‌های متنوعی از بحث‌های علمی و فنی تا بحث‌های اخلاقی و قانونی وجود دارند ...
چالش‌های دنیای هوش مصنوعی

یکی از نگرانی‌هایی که در نخستین روزهای معرفی مدل‌های زبانی بزرگ (LLMها) بسیار مطرح بود، موضوع توهم (Hallucination) در پاسخ‌های آن‌ها بود؛ حالتی که مدل با اطمینان کامل، اطلاعات نادرست یا ساختگی تولید می‌کند ...
ریپوی رتبه‌بندی توهم مدل‌های زبانی

هر محصول علاوه بر توسعه نیاز به پشتیبانی و نگهداشت دارد. مدل‌های تحلیل داده و یادگیری ماشین نیز از این قاعده مستثنی نیستند. این مدل‌ها بر اساس مجموعه‌ای از داده‌ها ساخته می‌شوند. اما پس از استقرار در محصول و گذشت زمان، غیرقابل اعتماد و قدیمی شده و دقت کاهش می‌یابد ...
مراقبت از رانش داده‌ها

شناخت درست داده اولین و مهمترین گام شروع عملیات حوزه‌‌‌های تحلیل داده و یادگیری ماشین است که بر اساس آن مراحل آماده‌سازی داده پایه‌ریزی می‌شوند. این شناخت از یک سو مربوط به منبع اطلاعات و چیستی آنهاست (به عنوان نمونه شناخت کسب و کاری که این دیتا مرتبط با آن است یا فرآیندی که در نهایت منجر به تولید این داده‌ها شده‌اند) و از سوی دیگر بررسی آنچه که اکنون در اختیار ما قرار گرفته است ...
اکتشاف داده با پایتون

نمودار ROC (مخفف Receiver Operating Characteristic) به صورت گرافیکی نمایش می‌دهد که چقدر یک مدل دسته‌بندی عملکرد خوبی دارد و AUC (یا همان مساحت زیر نمودار) یک معیار عددی است که از نمودار ROC مشتق می‌شود و عملکرد کلی یک مدل را خلاصه می‌کند ...
در باب حکمت منحنی ROC و AUC

یکی از مسائل مهم در ساخت مدل یادگیری ماشین و هوش مصنوعی توجه ویزه به موضوع کم‌برازش و بیش‌برازش است تا بتوانیم در نهایت یک مدل عمومی‌تر و قابل قبول بسازیم. این موضوع با پیچیدگی مدل یادگیری ماشین در ارتباط است و محاسبات بایاس و واریانس نیز ابزار مناسبی برای تشخیص هستند ...
بایاس-واریانس و پیچیدگی مدل یادگیری ماشین

خلاصه‌ای از تعاریف و مفاهیم جبر خطی کاربردی در علوم داده شامل مباحث زیر از این پیوند قابل دریافت است. + مبانی جبر خطی: فضای برداری، ماتریس‌ها و کاربردهای آنها + تجزیه‌ی مقادیر ویژه ماتریس مربعی + فرم‌های مربعی و توزیع گاوسی چند متغیره + تجزیه‌ی مقادیر ویژه مقدار تکین، معکوس شبه، نرم ماتریس، تقریب اکارت-یانگ + تحلیل مؤلفه‌های اصلی (PCA) + تبدیل فوریه و کاربردهای آن + پردازش سیگنال گراف (GSP) و کاربردهای آن ...
کتابچه جبر خطی کاربردی

توزیع‌های آماری به ما کمک می‌کنند شناخت بهتری از داده‌ها داشته باشیم و در مورد احتمال وقوع پیشامدها با منطق بهتری نظر بدهیم. بنابراین فهم درست تعاریف، تفاوت‌ها و کاربردشان بسیار مهم است. جزوه‌ی بیست صفحه‌ای Probability Distributions Cheat Sheet شامل همه‌ی توزیع‌های احتمالاتی مشهور برای مرور کاربردها و تفاوت‌های آنها است ...
خلاصه توزیع احتمالات

فرض کنید مجموعه‌ی بزرگی از تصاویر حیوانات از سطح وب گردآوری کرده‌اید، اما هیچ برچسبی برای آن‌ها وجود ندارد. برچسب‌گذاری دستی هر تصویر برای تعیین نوع حیوان فرایندی زمان‌بر و پرهزینه است. یا سناریویی مشابه را در نظر بگیرید که مجموعه‌ای عظیم از اخبار متنی که بدون برچسب موضوعی (سیاسی، ورزشی، فناوری و ...
ریپوی یادگیری خودنظارتی

همان‌طور که می‌دانیم، دو رویکرد اصلی برای سفارشی‌سازی مدل‌های زبانی بزرگ (LLMs) وجود دارد: Fine-Tuning و Retrieval-Augmented Generation یا همان RAG. در روش Fine-Tuning، مدل با داده‌های خاص یک حوزه مجدداً آموزش داده می‌شود ...
استفاده‌ی Uber از RAG

از همان روزهای آغازین ظهور ChatGPT و همتایانش، پرسش‌ها و نگرانی‌های متعددی درباره‌ی آینده‌ی شغلی افراد مطرح شد؛ اینکه آیا هوش مصنوعی قرار است جای تمام مشاغل را بگیرد؟ البته در این یادداشت قصد ندارم درباره‌ی تغییرات بازار کار صحبت کنم، بلکه می‌خواهم به یکی از تأثیرات جانبی استفاده از چت‌بات‌های هوشمند اشاره کنم: کاهش استفاده از موتورهای جستجو مانند گوگل ...
استارتاپ Scrunch AI برای SEO

با خواندن پستی در لینکدین به مقاله ‌ای در مدیوم با این نشانی رسیدم که به نوعی بازگوکننده‌ی دیدگاه شخصی من نیز است. در روزهایی که بحث هوش مصنوعی در همه‌جا داغ است، استارتاپ‌ها و شرکت‌های متعددی در این حوزه فعالیت‌های گوناگونی را آغاز کرده‌اند ...
مرگ استارتاپ‌های هوش مصنوعی تا سال 2026

این روزها اهمیت هوش مصنوعی بر کسی پوشیده نیست. اگر در گذشته صحبت از هوش مصنوعی تنها در مجامع علمی و دانشگاه‌ها بود، حالا به مدد پیشرفتش در حوزه‌هایی مثل پردازش زبان طبیعی و عرضه‌ی محصولاتی مثل ChatGPT، حضورش را بیش از پیش در زندگی شخصی خود احساس می‌کنیم ...
هوش مصنوعی به زبان ساده

یکی از دغدغه‌هایی که ممکن است در زمان مطالعه‌ی مباحث مربوط به یادگیری ماشین و هوش مصنوعی داشته باشیم، حجم بالای جزئیات الگوریتم‌های آنها است و معمولا هر کتاب هم تنها بخشی از مطالب این حوزه‌ها را پوشش می‌دهد یا حجم کتاب بسیار زیاد است ...
کتاب The Hundred-Page Machine Learning Book

عامل‌های هوش مصنوعی (AI Agents) نسل جدید از سامانه‌های هوشمند هستند که تنها محدود به پاسخ‌گویی پرسش‌های کاربر نبوده و می‌توانند مانند یک همکار مستقل فکر کنند، تصمیم بگیرند، ابزارهای مختلف را به‌کار بگیرند و حتی در صورت نیاز مسیر خود را اصلاح کنند ...
کتاب AI Agents - The Illustrated Guidebook

معمولا وقتی روی مدل‌سازی یا تحلیل داده کار می‌کنیم به انتخاب‌های تصادفی از داده یا پارامترهای مدل می‌رسیم و seed یا random_state نقش مهمی برای جلوگیری از نقش این انتخاب‌های تصادفی در مدل نهایی ایفا می‌کنند ...
انتخاب seed درست

کتاب «Practical Statistics for Data Scientists» یک منبع جامع و کاربردی برای معرفی مفاهیم و تکنیک‌های آماری ضروری در حوزه‌های تحلیل داده‌ها، یادگیری ماشین و هوش مصنوعی است. در این کتاب، مفاهیم آماری به شیوه‌ای قابل فهم و با استفاده از سناریوهای واقعی علم داده و کدهای نمونه به زبان‌های R و پایتون ارائه شده است ...
کتاب آمار عملی برای دانشمندان داده

یکی از چالش‌های مهم مدل‌های زبانی بزرگ بحث پاسخ‌های متوهمانه‌ است. یعنی مدل مولد در درستی پاسخ‌هایی که می‌دهد هیچ شکی ندارد، در حالی که ممکن است اشتباه باشد. حال وقتی مدل را با داده‌های جدیدی که از قبل هیچ شناختی ندارد فاین‌تیون (تنظیم دقیق‌تر) می‌کنیم، نگران توهم بیشتر باشیم یا نه؟ مقاله‌ی «Does Fine-Tuning LLMs on New Knowledge Encourage Hallucinations» در این مورد بحث می‌کند ...
توهم مدل‌های مولد

یکی از چالش‌های مهم استفاده از الگوریتم‌های یادگیری ماشین در صنعت مربوط به کیفیت داده‌هاست. کم بودن داده، نامتوازن بودن آنها، نداشتن برچسب و مقادیر نامعتبر متنوع یا از دست رفته از جمله دغدغه‌های مهم هستند ...
یادگیری ماشین در صنعت

کانال یوتیوب StatQuest with Josh Starmer یک منبع آموزشی بسیار خوب در زمینه‌های آمار و ریاضیات دوست‌داشتنی است که با توضیحات جذاب و بصری‌سازی عالی، تفسیرهای ساده و قابل فهم کاربردی در حوزه‌های علم داده و یادگیری ماشین ارائه می‌کند ...
ویدئوهای آموزشی StatQuest

معمولا وقتی در حوزه‌ی تحلیل داده صحبت از مباحثی مانند دسته‌بندی مشتریان می‌شود اولین ایده استفاده از کلاسترینگ و الگوریتم‌هایی مثل KMeans است. اما این مقاله ضمن دسته‌بندی مشتریان یکی از دیتاست‌های کگل با روش‌های KMeans و KPrototype مدل زبانی بزرگ (LLM) را هم وارد بازی کرده است ...
استفاده از LLM در دسته‌بندی مشتری‌ها

وقتی ابعاد یا تعداد ویژگی‌های یک مدل یادگیری ماشین زیاد باشد می‌توانیم از تکنیک‌های کاهش ابعاد برای پایین آوردن تعداد ویژگی‌ها بدون از دست دادن اطلاعات اساسی استفاده کنیم. این کار معمولا باعث ساده‌تر شدن مجموعه داده‌های پیچیده و بالا رفتن کارآیی مدل‌ها می‌شود ...
کاهش ابعاد تفسیرپذیر

کتاب Understanding Deep Learning به زودی از انتشارات MIT منتشر خواهد شد و نویسنده‌ی کتاب (Simon J.D. Prince استاد تمام علوم کامپیوتر) نسخه‌ی پیش‌نویس کتاب به همراه کدها را به صورت عمومی منتشر کرده که در حال به‌روز شدن هستند ...
کتاب Understanding Deep Learning

ویراست سوم کتاب Python for Data Analysis انتشارات O’Reilly با دسترسی آزاد در قالب html هم منتشر شد. Python for Data Analysis, 3E ...
کتاب رایگان Python for Data Analysis

کتاب Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow یکی از کتاب‌های معروف و پرطرفدار در زمینه‌ی یادگیری ماشین و یادگیری عمیق است. این کتاب راهنمای عملی و عمیقی برای ساخت و استفاده از مدل‌های یادگیری ماشین و یادگیری عمیق با استفاده از کتابخانه‌های Scikit-Learn، Keras و TensorFlow ارائه می‌دهد ...
کتاب Hands-On Machine Learning

کتاب مقدمه‌ای بر یادگیری آماری (An Introduction to Statistical Learning with Applications in Python) یک کتاب جامع آموزش یادگیری ماشین با رویکرد الگوریتم‌های یادگیری آماری از انتشارات معتبر اشپرینگر است ...
کتاب مقدمه‌ای بر یادگیری آماری