نوشته‌ها با موضوع مدل زبانی بزرگ (LLM)

نوشته‌ها با موضوع مدل زبانی بزرگ (LLM)


یکی از نگرانی‌هایی که در نخستین روزهای معرفی مدل‌های زبانی بزرگ (LLMها) بسیار مطرح بود، موضوع توهم (Hallucination) در پاسخ‌های آن‌ها بود؛ حالتی که مدل با اطمینان کامل، اطلاعات نادرست یا ساختگی تولید می‌کند ...
ریپوی رتبه‌بندی توهم مدل‌های زبانی

همان‌طور که می‌دانیم، دو رویکرد اصلی برای سفارشی‌سازی مدل‌های زبانی بزرگ (LLMs) وجود دارد: Fine-Tuning و Retrieval-Augmented Generation یا همان RAG. در روش Fine-Tuning، مدل با داده‌های خاص یک حوزه مجدداً آموزش داده می‌شود ...
استفاده‌ی Uber از RAG

از همان روزهای آغازین ظهور ChatGPT و همتایانش، پرسش‌ها و نگرانی‌های متعددی درباره‌ی آینده‌ی شغلی افراد مطرح شد؛ اینکه آیا هوش مصنوعی قرار است جای تمام مشاغل را بگیرد؟ البته در این یادداشت قصد ندارم درباره‌ی تغییرات بازار کار صحبت کنم، بلکه می‌خواهم به یکی از تأثیرات جانبی استفاده از چت‌بات‌های هوشمند اشاره کنم: کاهش استفاده از موتورهای جستجو مانند گوگل ...
استارتاپ Scrunch AI برای SEO

معمولا وقتی در حوزه‌ی تحلیل داده صحبت از مباحثی مانند دسته‌بندی مشتریان می‌شود اولین ایده استفاده از کلاسترینگ و الگوریتم‌هایی مثل KMeans است. اما این مقاله ضمن دسته‌بندی مشتریان یکی از دیتاست‌های کگل با روش‌های KMeans و KPrototype مدل زبانی بزرگ (LLM) را هم وارد بازی کرده است ...
استفاده از LLM در دسته‌بندی مشتری‌ها

کتاب Understanding Deep Learning به زودی از انتشارات MIT منتشر خواهد شد و نویسنده‌ی کتاب (Simon J.D. Prince استاد تمام علوم کامپیوتر) نسخه‌ی پیش‌نویس کتاب به همراه کدها را به صورت عمومی منتشر کرده که در حال به‌روز شدن هستند ...
کتاب Understanding Deep Learning