این روزها هر جا صحبت از تحلیل داده یا هوش تجاری می‌شود، معمولا از ابزارهایی مانند زبان برنامه‌نویسی پایتون یا PowerBI نیز سخن به میان می‌آید. اما این حوزه قدمتی بیشتر از این ابزارهای مدرن دارد و در دهه‌های گذشته سازمان‌ها برای مدیریت و تحلیل داده‌ها از روش‌های ساده‌تر دیگری استفاده می‌کردند ...
کتاب «Practical Statistics for Data Scientists» یک منبع جامع و کاربردی برای معرفی مفاهیم و تکنیک‌های آماری ضروری در حوزه‌های تحلیل داده‌ها، یادگیری ماشین و هوش مصنوعی است. در این کتاب، مفاهیم آماری به شیوه‌ای قابل فهم و با استفاده از سناریوهای واقعی علم داده و کدهای نمونه به زبان‌های R و پایتون ارائه شده است ...
کتاب Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow یکی از کتاب‌های معروف و پرطرفدار در زمینه‌ی یادگیری ماشین و یادگیری عمیق است. این کتاب راهنمای عملی و عمیقی برای ساخت و استفاده از مدل‌های یادگیری ماشین و یادگیری عمیق با استفاده از کتابخانه‌های Scikit-Learn، Keras و TensorFlow ارائه می‌دهد ...
یکی از چالش‌های مهم مدل‌های زبانی بزرگ بحث پاسخ‌های متوهمانه‌ است. یعنی مدل مولد در درستی پاسخ‌هایی که می‌دهد هیچ شکی ندارد، در حالی که ممکن است اشتباه باشد. حال وقتی مدل را با داده‌های جدیدی که از قبل هیچ شناختی ندارد فاین‌تیون (تنظیم دقیق‌تر) می‌کنیم، نگران توهم بیشتر باشیم یا نه؟ مقاله‌ی «Does Fine-Tuning LLMs on New Knowledge Encourage Hallucinations» در این مورد بحث می‌کند ...
توزیع‌های آماری به ما کمک می‌کنند شناخت بهتری از داده‌ها داشته باشیم و در مورد احتمال وقوع پیشامدها با منطق بهتری نظر بدهیم. بنابراین فهم درست تعاریف، تفاوت‌ها و کاربردشان بسیار مهم است. جزوه‌ی بیست صفحه‌ای Probability Distributions Cheat Sheet شامل همه‌ی توزیع‌های احتمالاتی مشهور برای مرور کاربردها و تفاوت‌های آنها است ...
این روزها همه جا صحبت از هوش مصنوعی و اثر آن حتی در زندگی روزمره است. اما اگر در ابعاد کلان به عنوان پیشروان علم هوش مصنوعی یا توسعه‌دهندگان محصولات مبتنی بر این حوزه به قضیه نگاه کنیم، چالش‌های متنوعی از بحث‌های علمی و فنی تا بحث‌های اخلاقی و قانونی وجود دارند ...
نمودار ROC (مخفف Receiver Operating Characteristic) به صورت گرافیکی نمایش می‌دهد که چقدر یک مدل دسته‌بندی عملکرد خوبی دارد و AUC (یا همان مساحت زیر نمودار) یک معیار عددی است که از نمودار ROC مشتق می‌شود و عملکرد کلی یک مدل را خلاصه می‌کند ...
به‌طور کلی، وقتی از امنیت اطلاعات در فضای فناوری اطلاعات صحبت می‌کنیم، معمولاً منظورمان امنیت تبادل اطلاعات یا امنیت نگهداشت آن‌هاست. در هر دو حالت، محرمانگی اطلاعات و نحوه‌ی پیاده‌سازی آن از طریق الگوریتم‌های رمزنگاری از اهمیت بالایی برخوردار است ...
یکی از چالش‌های مهم دوران دبیرستان به یاد داشتن مقدار سینوس و کسینوس زوایای مشهور بوده و هست. در این راستا روش‌هایی مانند محاسبه به کمک دست و تا کردن انگشتان پیشنهاد شده است که هر کدام از انگشتان نماد یک زاویه هستند ...
معمای هشت وزیر از جمله مسائل کلاسیک مباحث طراحی الگوریتم است که در حالت کلی‌تر با عنوان معمای n وزیر یا معمای چند وزیر مطرح می‌شود. برای افرادی که با بازی شطرنج آشنایی ندارند وزیر مهره‌ای از مهره‌های بازی شطرنج است که می‌تواند در تمامی هشت جهت به هر تعداد خانه - تا زمانی که مهره‌ای مانع نباشد - حرکت کند ...
الگوریتم جستجوی اول عمق (Depth First Search - DFS) یا نام‌های دیگری همچون جستجو در عمق، پیمایش اول عمق، پیمایش عمق اول الگوریتمی مشابه الگوریتم جستجوی اول سطح (BFS) برای پیمایش گراف است. این دو الگوریتم خواص و کاربردهای مشترک بسیاری دارند و تفاوت اصلی در این است که در هر تکرار الگوریتم DFS تنها یکی از گره‌های مجاور گره پردازش شده برای مرحله بعد انتخاب می‌شود ...
ترکیب (Combination) به انتخاب تعدادی عنصر از یک مجموعه بزرگ‌تر بدون در نظر گرفتن ترتیب آن‌ها اشاره دارد. در ترکیب، برخلاف جایگشت (Permutation)، ترتیب انتخاب عناصر مهم نیست. این مفهوم در ریاضیات کاربرد گسترده‌ای دارد و یکی از موارد اصلی استفاده از آن در محاسبه‌ی ضرایب بسط دوجمله‌ای است ...
برای محاسبه زمان اجرای کد در ++C می‌توان از دو تابع clock یا time استفاده کرد. تابع clock، تعداد کلاک‌های در اختیار برنامه از CPU تا آن لحظه را برمی‌گرداند که با تقسیم بر CLOCKS_PER_SEC به ثانیه تبدیل می‌شود ...
این روزها اهمیت هوش مصنوعی بر کسی پوشیده نیست. اگر در گذشته صحبت از هوش مصنوعی تنها در مجامع علمی و دانشگاه‌ها بود، حالا به مدد پیشرفتش در حوزه‌هایی مثل پردازش زبان طبیعی و عرضه‌ی محصولاتی مثل ChatGPT، حضورش را بیش از پیش در زندگی شخصی خود احساس می‌کنیم ...
زمانی که ورودی مسأله از نوع عددی است لزومی ندارد داخل متغیر عددی ذخیره کنیم. گاهی ممکن ذخیره آن به صورت رشته بهتر باشد. مثلا برای مسأله LC-Display باید عدد را از چپ به راست و رقم به رقم پردازش کنیم ...