این روزها هر جا صحبت از تحلیل داده یا هوش تجاری می‌شود، معمولا از ابزارهایی مانند زبان برنامه‌نویسی پایتون یا PowerBI نیز سخن به میان می‌آید. اما این حوزه قدمتی بیشتر از این ابزارهای مدرن دارد و در دهه‌های گذشته سازمان‌ها برای مدیریت و تحلیل داده‌ها از روش‌های ساده‌تر دیگری استفاده می‌کردند ...
کتاب «Practical Statistics for Data Scientists» یک منبع جامع و کاربردی برای معرفی مفاهیم و تکنیک‌های آماری ضروری در حوزه‌های تحلیل داده‌ها، یادگیری ماشین و هوش مصنوعی است. در این کتاب، مفاهیم آماری به شیوه‌ای قابل فهم و با استفاده از سناریوهای واقعی علم داده و کدهای نمونه به زبان‌های R و پایتون ارائه شده است ...
کتاب Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow یکی از کتاب‌های معروف و پرطرفدار در زمینه‌ی یادگیری ماشین و یادگیری عمیق است. این کتاب راهنمای عملی و عمیقی برای ساخت و استفاده از مدل‌های یادگیری ماشین و یادگیری عمیق با استفاده از کتابخانه‌های Scikit-Learn، Keras و TensorFlow ارائه می‌دهد ...
یکی از چالش‌های مهم مدل‌های زبانی بزرگ بحث پاسخ‌های متوهمانه‌ است. یعنی مدل مولد در درستی پاسخ‌هایی که می‌دهد هیچ شکی ندارد، در حالی که ممکن است اشتباه باشد. حال وقتی مدل را با داده‌های جدیدی که از قبل هیچ شناختی ندارد فاین‌تیون (تنظیم دقیق‌تر) می‌کنیم، نگران توهم بیشتر باشیم یا نه؟ مقاله‌ی «Does Fine-Tuning LLMs on New Knowledge Encourage Hallucinations» در این مورد بحث می‌کند ...
توزیع‌های آماری به ما کمک می‌کنند شناخت بهتری از داده‌ها داشته باشیم و در مورد احتمال وقوع پیشامدها با منطق بهتری نظر بدهیم. بنابراین فهم درست تعاریف، تفاوت‌ها و کاربردشان بسیار مهم است. جزوه‌ی بیست صفحه‌ای Probability Distributions Cheat Sheet شامل همه‌ی توزیع‌های احتمالاتی مشهور برای مرور کاربردها و تفاوت‌های آنها است ...
این روزها همه جا صحبت از هوش مصنوعی و اثر آن حتی در زندگی روزمره است. اما اگر در ابعاد کلان به عنوان پیشروان علم هوش مصنوعی یا توسعه‌دهندگان محصولات مبتنی بر این حوزه به قضیه نگاه کنیم، چالش‌های متنوعی از بحث‌های علمی و فنی تا بحث‌های اخلاقی و قانونی وجود دارند ...
یکی از چالش‌های مهم دوران دبیرستان به یاد داشتن مقدار سینوس و کسینوس زوایای مشهور بوده و هست. در این راستا روش‌هایی مانند محاسبه به کمک دست و تا کردن انگشتان پیشنهاد شده است که هر کدام از انگشتان نماد یک زاویه هستند ...
معمولا وقتی روی مدل‌سازی یا تحلیل داده کار می‌کنیم به انتخاب‌های تصادفی از داده یا پارامترهای مدل می‌رسیم و seed یا random_state نقش مهمی برای جلوگیری از نقش این انتخاب‌های تصادفی در مدل نهایی ایفا می‌کنند ...
ترکیب (Combination) به انتخاب تعدادی عنصر از یک مجموعه بزرگ‌تر بدون در نظر گرفتن ترتیب آن‌ها اشاره دارد. در ترکیب، برخلاف جایگشت (Permutation)، ترتیب انتخاب عناصر مهم نیست. این مفهوم در ریاضیات کاربرد گسترده‌ای دارد و یکی از موارد اصلی استفاده از آن در محاسبه‌ی ضرایب بسط دوجمله‌ای است ...
معمای هشت وزیر از جمله مسائل کلاسیک مباحث طراحی الگوریتم است که در حالت کلی‌تر با عنوان معمای n وزیر یا معمای چند وزیر مطرح می‌شود. برای افرادی که با بازی شطرنج آشنایی ندارند وزیر مهره‌ای از مهره‌های بازی شطرنج است که می‌تواند در تمامی هشت جهت به هر تعداد خانه - تا زمانی که مهره‌ای مانع نباشد - حرکت کند ...
روش مرتب‌سازی سریع (Quick Sort) یکی از الگوریتم‌های مشهور مرتب‌سازی داده‌ها است. این الگوریتم طی مراحل بازگشتی زیر یک روش تقسیم و غلبه برای مرتب کردن داده‌ها ارائه می‌نماید: 1- انتخاب عنصر محوری: یکی از عناصر آرایه به عنوان عنصر محوری (pivot) - به عنوان مثال عنصر اول - انتخاب می‌شود ...
ضرب ماتریس‌ها یک عمل ریاضی است برای ترکیب دو ماتریس است که در مباحث مختلفی مانند گرافیک کامپیوتری، فیزیک و یادگیری ماشین کاربرد دارد. در این عملیات، برای هر عنصر از ماتریس حاصل، عناصر سطرهای ماتریس اول با عناصر ستون‌های ماتریس دوم ضرب می‌شوند و مجموع این ضرب‌ها به‌عنوان عنصر متناظر در ماتریس جدید قرار می‌گیرد ...
برای محاسبه زمان اجرای کد در ++C می‌توان از دو تابع clock یا time استفاده کرد. تابع clock، تعداد کلاک‌های در اختیار برنامه از CPU تا آن لحظه را برمی‌گرداند که با تقسیم بر CLOCKS_PER_SEC به ثانیه تبدیل می‌شود ...
سری دوم مجموعه سوالات تمرینی مسابقه برنامه‌نویسی ACM-ICPC در پیوند زیر تنظیم شده است: vjudge.net/contest/244032 این سوالات از مجموعه سوالات مسابقات عموم سوالات با موضوع مباحث ریاضی و روش‌های حل مبتنی بر برنامه‌نویسی پویا یا حریصانه از مجموعه سوالات مسابقات برنامه‌نویسی ACM-ICPC دوره‌های گذشته و همینطور وب‌سایت‌هایی مانند CodeForces انتخاب شده است و ترتیب خاصی از نظر درجه سختی یا روش حل وجود ندارد ...
ویراست سوم کتاب Python for Data Analysis انتشارات O’Reilly با دسترسی آزاد در قالب html هم منتشر شد. Python for Data Analysis, 3E ...