azaduniqomml | Unsorted

Telegram-канал azaduniqomml - MODELIUM

100

🔶 هسته دانشجویی هوش مصنوعی و یادگیری ماشین 🏫 دانشگاه آزاد اسلامی قم | دانشکده هوش مصنوعی 👤 سرپرست کارگروه : آتنا سادات چاوشی @chavooshiiii

Subscribe to a channel

MODELIUM

🚀 معرفی Stackoverflow.ai

🔍 یه ابزار جستجو و کشف مبتنی بر هوش مصنوعی که توسط تیم Stack Overflow ساخته شده.

✨ ویژگی کلیدی این پلتفرم، اتصال مستقیم به پایگاه دانش Stack Overflow ـه؛ جایی با بیش از ۵۸ میلیون سؤال و پاسخ معتبر که توسط جامعه توسعه‌دهندگان تأیید شده.

📚 نکته جالب اینجاست که پاسخ‌های هوش مصنوعی رو در کنار محتوای تولیدشده توسط کاربران نشون میده.
یعنی هم از قدرت AI استفاده می‌کنی، هم از تجربه واقعی برنامه‌نویس‌ها.

👩‍💻 این ابزار بیشتر مثل یه دستیار تحصیلی طراحی شده؛ مخصوصاً برای دانشجوها و برنامه‌نویس‌هایی که تازه دارن کدنویسی یاد می‌گیرن می‌تونه خیلی مفید باشه.

🔗 لینک دسترسی

#هوش_مصنوعی #برنامه‌نویسی #یادگیری_ماشین #ابزار_هوش_مصنوعی #معرفی_سایت

📍@azaduniqomMl

Читать полностью…

MODELIUM

📌آموزش فارسی یادگیری ماشینی و یادگیری عمیق

✅ و جلسه‌ی چهل و یکم با موضوع جدید،
Long-Short Term Memory (LSTM)
آغاز میکنیم.


📝 Long-Short Term Memory (LSTM)
یک نوع شبکه عصبی بازگشتی (RNN) است که برای پردازش داده‌های ترتیبی (مثل متن، گفتار، یا سری‌های زمانی) استفاده می‌شود.

🔹 مزیت اصلی آن نسبت به RNN معمولی این است که می‌تواند وابستگی‌های بلندمدت را به خاطر بسپارد، چون ساختار داخلی‌اش (سلول حافظه و دروازه‌ها: input gate, forget gate, output gate) کنترل می‌کند چه اطلاعاتی ذخیره یا فراموش شوند.

🔹 به همین دلیل در مسائلی مثل ترجمه ماشینی، تحلیل احساسات، پیش‌بینی بازار، و تشخیص گفتار خیلی پرکاربرد است.



#آموزش
#آموزش_یادگیری_ماشینی
#یادگیری_ماشین

📍@azaduniqomML

Читать полностью…

MODELIUM

🚀 Random Patches vs Random Subspaces

بچه‌ها تا حالا از Bagging گفتیم که داده‌ها رو تصادفی انتخاب می‌کنه و هر مدل یه چیزی یاد می‌گیره.
ولی یه مرحله‌ی خفن‌تر هم داریم 👉 این‌بار ویژگی‌ها (Features) هم وارد بازی می‌شن!

🔹 Random Patches
✅ هم داده‌ها (instances) تصادفی انتخاب می‌شن
✅ هم ویژگی‌ها (features)
➡️ یعنی یه جور پچ‌کاری کامل! هم از ردیف‌ها می‌زنیم هم از ستون‌ها 😅

🔹 Random Subspaces
✅ همه‌ی داده‌ها کامل نگه داشته می‌شن
✅ فقط بخشی از ویژگی‌ها به صورت تصادفی انتخاب می‌شن
➡️ یعنی ردیف‌ها کاملن، ستون‌ها نصفه‌نیمه 👌

📌 چرا این کارو می‌کنیم؟
برای ساختن مدل‌های متنوع‌تر 🎯 → کمی بایاس بالا میره، ولی واریانس کلی میاد پایین ✅

📷 مثال: توی داده‌های تصویری با هزاران پیکسل، این روش خیلی می‌چسبه! 😉


📍@azaduniqomMl

Читать полностью…

MODELIUM

❓️سوال سی و پنج : تفاوت‌ها و موازنه‌ها (trade-off) بین الگوریتم‌های دسته‌بندی مختلف چیه؟ چطور بهترین رو انتخاب کنیم؟

✅ جواب ساده:

هیچ الگوریتمی وجود نداره که بگیم همیشه بهترینه! 🚫

انتخاب الگوریتم بیشتر بستگی به نوع مسئله و داده‌هات داره. معمولاً اینجوری پیش میری:

1. اول با یه الگوریتم ساده و سریع شروع می‌کنی (مثلاً Logistic Regression یا Decision Tree).

2. بعد چندتا الگوریتم مختلف رو امتحان می‌کنی (مثلاً KNN، SVM، Random Forest).

3. عملکردشون رو مقایسه می‌کنی با معیارهایی مثل دقت (Accuracy)، F1 Score، Precision، Recall

4. اون مدلی که بهترین کارایی رو روی دیتای تو داشته باشه انتخاب میشه ✅

📌 در واقع انتخاب الگوریتم بیشتر یه فرایند آزمایش و مقایسه هست تا یه فرمول ثابت.

#سوالات_مصاحبه #سوال_سی_و_پنجم

📍@azaduniqomMl

Читать полностью…

MODELIUM

❓️سوال سی و سه: خطای نوع اول و دوم چیست؟

🔹 خطای نوع اول (Type I error )
✅ جواب: یعنی وقتی فرض صفر (H₀) درست بوده، اما تو اشتباهی ردش کردی.
بهش میگن False Positive.
مثال: دکتر میگه شما مریضی 😷، درحالی که سالمی.

🔹 خطای نوع دوم (Type II error)
✅ یعنی وقتی فرض صفر (H₀) غلط بوده، اما تو اشتباهی قبولش کردی.
بهش میگن False Negative.
مثال: دکتر میگه شما سالمی 🙂، درحالی که واقعا مریضی.

✨ خلاصه:

نوع یک = Type I = False Positive = اشتباه رد کردن چیزی که درسته.
نوع دو = Type II = False Negative = اشتباه قبول کردن چیزی که غلطه.

#سوالات_مصاحبه #سوال_سی_و_سوم

📍@azaduniqomMl

Читать полностью…

MODELIUM

🥤 Bagging vs 🍔 Pasting

تا حالا شده از چند نفر نظر بخوای و آخرش با جمع‌بندی، بهترین نتیجه رو بگیری؟ تو یادگیری ماشین هم داریم چیزی به اسم Ensemble که همین کارو می‌کنه!

💡 Bagging (Bootstrap Aggregating)

از دیتای اصلی نمونه می‌گیریم با جایگزینی

یعنی یه داده ممکنه چند بار انتخاب بشه 🥤


💡 Pasting

نمونه‌گیری بدون جایگزینی

هر داده فقط یک بار انتخاب میشه 🍔


📊 چطوری کار می‌کنه؟

1. هر مدل روی یه زیرمجموعه آموزش می‌بینه


2. همه مدل‌ها نظرشونو میدن:

Classification → رای‌گیری

Regression → میانگین‌گیری




✨ مزیت: خطاهای مدل‌ها همدیگه رو خنثی می‌کنن → مدل نهایی دقیق‌تر و پایدارتر!

😅 مثال ساده:

فقط از یه نفر بپرسی کجا بریم غذا → سلیقه‌ای

از چند نفر بپرسی و جمع‌بندی کنی → احتمالاً بهترین انتخاب درمیاد


🔥 یادآوری سریع:

Bagging = با جایگزینی 🥤

Pasting = بدون جایگزینی 🍔


📍@azaduniqomMl

Читать полностью…

MODELIUM

❓ سؤال سی و دو: F1 Score چیه؟

‌در واقع F1 یه عدد بین 0 تا 1ه که نشون میده مدل چقدر خوبه وقتی هم Precision (چقدر پیش‌بینی درست داری) و هم Recall (چقدر از موارد درست رو پیدا کردی) مهم باشه.

🔹 چرا لازمه؟

* بعضی وقتا مدل فقط یکی رو خوب می‌کنه:

* اگر Precision بالا ولی Recall پایین 👉 مثلا میگه همه تراکنش‌ها سالم‌ان تا خطا نده.
* اگر Recall بالا ولی Precision پایین 👉 مثلا همه رو مشکوک به کلاهبرداری می‌دونه.

*پس F1 میاد این دوتا رو متعادل می‌کنه.


🔹 فرمول خیلی ساده:

F1 = 2 * Precision* Recall / Precision + Recall


🔹 تفسیر:

* 1 → عالی! مدل هم خوب پیدا کرده، هم درست تشخیص داده.
* 0 → فاجعه! مدل کلاً خراب کرده.

✅ مثال روزمره:
فرض کن دنبال دوستت تو یه جمع شلوغ می‌گردی:

* Precision = از کسایی که صدا کردی، چندتاشون واقعاً دوستت بودن؟

* Recall = از کل دوستای حاضر، چندتاشونو پیدا کردی؟

* F1 = ترکیب این دوتا، یعنی هم کم صدا بزنی هم درست پیدا کنی 😅

#سوالات_مصاحبه #سوال_سی_و_دوم

📍@azaduniqomMl

Читать полностью…

MODELIUM

❓️سؤال سی : Chi-squared test چیه؟

جواب ساده و روان 👇

✦ تست کای-دو (Chi-squared test) یه روش آماریه برای بررسی این‌که توزیع داده‌هایی که مشاهده کردی با توزیع مورد انتظارت (تحت فرض استقلال یا مدل خاص) همخونی داره یا نه.

🔹 به زبون ساده‌تر: می‌خواد ببینه آیا اختلاف بین داده‌های واقعی و داده‌های پیش‌بینی شده فقط یه اتفاق تصادفی بوده یا معنی‌دار هست.

📍 مثال:
فرض کن می‌خوای بدونی جنسیت (زن/مرد) و نوع شغل مستقل از هم هستن یا نه. با تست کای-دو می‌تونی بررسی کنی که آیا واقعاً بین این دو متغیر رابطه‌ای وجود داره یا همه‌چی تصادفی پیش اومده.

➕ خلاصه در قالب نکته:

چی می‌سنجه؟ میزان اختلاف بین داده‌ی واقعی و داده‌ی مورد انتظار.

کجا کاربرد داره؟ وقتی می‌خوای رابطه‌ی بین متغیرهای کیفی (categorical) رو بررسی کنی.

پایه‌اش چیه؟ توزیع کای-دو (chi-squared distribution).


#سوالات_مصاحبه #سوال_سی

📍@azaduniqomMl

Читать полностью…

MODELIUM

🤔 تا حالا اسم Ensemble Learning به گوشت خورده؟
یعنی به جای اینکه فقط روی یه مدل حساب کنیم، چندتا مدل مختلف رو کنار هم میذاریم و نتیجه‌هاشون رو ترکیب می‌کنیم تا دقت پیش‌بینی بیشتر بشه.
🔹 دقیقاً مثل وقتی چندتا متخصص دور هم جمع میشن و مشورت می‌کنن.

حالا یکی از ساده‌ترین روش‌های Ensemble، چیزی هست به اسم Voting Classifier.
🗳️ توی این روش هر مدل یه رأی میده؛ در حالت Hard Voting اکثریت برنده میشه، و در حالت Soft Voting میانگین احتمال‌ها حساب میشه.
یعنی فقط یه جور «رأی‌گیری» بین مدل‌هاست.

اما این تنها روش Ensemble نیست! روش‌های معروف دیگه هم داریم مثل:

Bagging → مدل‌های زیادی روی داده‌های مختلف آموزش می‌گیرن و نتیجه نهایی میانگین گرفته میشه (مثل Random Forest) 🌳

Boosting → مدل‌ها پشت سر هم ساخته میشن و هرکدوم سعی می‌کنن خطای قبلی‌ها رو جبران کنن (مثل XGBoost, AdaBoost) 🚀

Stacking → خروجی چند مدل میره به یه مدل جدیدتر که یاد می‌گیره چطور ترکیبشون کنه 🏗️


✅ خلاصه: Ensemble یعنی «تیمی کار کردن مدل‌ها» و Voting فقط یکی از ساده‌ترین تاکتیک‌های این تیمه.


📍@azaduniqomMl

Читать полностью…

MODELIUM

🚀 حکمت جمعیت در یادگیری ماشین!

تا حالا شنیدی وقتی از یه سوال سخت، جواب هزار نفر آدم معمولی رو جمع کنیم، میانگین جوابشون از جواب یه متخصص هم دقیق‌تر درمیاد؟ 🤯
به این میگن حکمت جمعیت (Wisdom of the Crowd).

حالا همین ایده توی یادگیری ماشین هم هست!
📊 اگر پیش‌بینی چند مدل (مثل کلاسفایرها یا رگرسورها) رو با هم ترکیب کنیم، معمولاً نتیجه بهتر از بهترین مدل تکی میشه.
به این میگن:
👉 Ensemble Learning یا یادگیری تجمیعی.

🔹 یکی از معروف‌ترین روش‌هاش Random Forest ـه:
تصور کن کلی درخت تصمیم (Decision Tree) داریم که هرکدوم روی یه بخش تصادفی از داده‌ها آموزش دیدن.
برای پیش‌بینی؟
هر درخت رأی میده ✅❌ و در نهایت کلاسی انتخاب میشه که بیشترین رأی رو آورده.
ساده‌ست، ولی فوق‌العاده قویه! 💪🌳🌳🌳

📌 جالبه بدونی خیلی از قهرمانای مسابقات یادگیری ماشین (مثل Netflix Prize) هم از همین روش‌های ترکیبی استفاده کردن.

✨ توی پست‌های بعدی، میریم سراغ روش‌های مختلف Ensemble مثل:
🔹 Bagging
🔹 Boosting
🔹 Stacking
#Ensemble #یادگیری_تجمیعی #داده_کاوی #مدل_پیش_بینی #علم_داده #RandomForest #یادگیری_نظارت_شده

📍@azaduniqomMl

Читать полностью…

MODELIUM

📌آموزش فارسی یادگیری ماشینی و یادگیری عمیق

✅ و جلسه‌ی چهلم با موضوع جدید،
Recurrent Neural Networks(RNNs)
آغاز میکنیم.


📝RNN (Recurrent Neural Network) یا شبکه عصبی بازگشتی یک نوع شبکه عصبی در هوش مصنوعی است که برای پردازش داده‌های توالی‌دار (مثل متن، صدا، ویدیو و داده‌های زمانی) طراحی شده است


✔️ کاربردها:
• پردازش زبان طبیعی (ترجمه ماشینی، تولید متن، چت‌بات‌ها)
• تشخیص گفتار
• پیش‌بینی سری‌های زمانی (مثلاً قیمت سهام یا آب‌وهوا)
• تولید موسیقی یا صدا


#آموزش
#آموزش_یادگیری_ماشینی
#یادگیری_ماشین

📍@azaduniqomML

Читать полностью…

MODELIUM

📌آموزش فارسی یادگیری ماشینی و یادگیری عمیق

جلسه‌ی سی‌ و نهم در ادامه‌ی موضوع Convolutional Neural Network (CNN) البته که این قسمت هم پروژه هستش


🖇️جلسه سی و چهارم
🖇️جلسه سی و پنجم
🖇️چلسه سی و ششم
🖇️جلسه سی و هفتم
🖇️جلسه سی و هشتم

#آموزش
#آموزش_یادگیری_ماشینی
#یادگیری_ماشین

📍@azaduniqomML

Читать полностью…

MODELIUM

❓️ سوال بیست و هشتم: در مسئله‌ی یادگیری ماشین، وقتی داده‌ها نامتوازن (Imbalanced) باشن چه مشکلی ایجاد میشه و چه روش‌هایی برای مقابله با اون وجود داره؟

⚖️ وقتی دیتاستت کج و معوجه باشه!

فرض کن توی دیتاستت ۹۹.۹۲٪ نمونه‌ها مثبت باشن و فقط ۰.۰۸٪ منفی 😱
مثلا توی تشخیص تقلب کارت اعتباری 💳

* بیشتر تراکنش‌ها عادی هستن ✅
* فقط یه ذره‌شون تقلبی‌ان ❌

خب حالا اگه مدلت همیشه بگه «همه چیز اوکیه» 😎
دقتش خیلی بالا میشه ولی عملا بی‌خاصیت میشه! چون تقلبا رو نمی‌بینه 🤦‍♂️

🔧 راهکارها برای مقابله با این مشکل:

1️⃣ جمع کردن داده بیشتر ➝ کلاس‌ها متعادل‌تر بشن.
2️⃣ Oversampling یا Undersampling ➝ زیاد کردن داده‌های کم یا کم کردن داده‌های زیاد
3️⃣ One-Class Learning ➝ مدلی که یاد می‌گیره «فقط کدوم حالت عادیه» و غیرعادی‌ها رو تشخیص میده
4️⃣ Cost Function نامتقارن ➝ جریمه‌ی بیشتری بذاریم روی خطای کلاس کم‌تعداد تا مدل جدی‌تر بگیره

خلاصه: توی دیتای نامتوازن، فقط «دقت بالا» ملاک خوبی نیست. باید بدونی مدل روی کلاس‌های کم‌تعداد چه عملکردی داره


#سوالات_مصاحبه #سوال_بیست_و_هشتم
📍@azaduniqomMl

Читать полностью…

MODELIUM

📌آموزش فارسی یادگیری ماشینی و یادگیری عمیق

جلسه‌ی سی‌ و هشتم در ادامه‌ی موضوع Convolutional Neural Network (CNN) البته که این قسمت هم پروژه هستش


❌اگر جلسات گذشته رو ندیدید از طریق لینک زیر برید ببینید تا بتونید این پروژه رو انجام بدید❌

🖇️جلسه سی و چهارم
🖇️جلسه سی و پنجم
🖇️چلسه سی و ششم
🖇️جلسه سی و هفتم

#آموزش
#آموزش_یادگیری_ماشینی
#یادگیری_ماشین

📍@azaduniqomML

Читать полностью…

MODELIUM

🌳 بی‌ثباتی (Instability) در درخت تصمیم

خب تا اینجا فهمیدیم درخت تصمیم خیلی کاربردیه:
✅ راحت فهمیده میشه
✅ تفسیرش ساده‌ست
✅ انعطاف‌پذیره و قدرتمنده

اما… 😅 چندتا مشکل هم داره:

⚡ ۱. مرزهای عمودی و افقی!
درخت تصمیم عاشق مرزهای عمودی و افقیه.
یعنی همیشه شاخه‌ها رو طوری می‌سازه که خطهای جداسازی عمود بر محور X یا Y باشه.

📌 مشکلش کجاست؟
اگه داده‌هامونو بچرخونیم (مثلا ۴۵ درجه)، دیگه مدل مرز قشنگی پیدا نمی‌کنه و الکی پیچیده میشه

راه‌حل؟ 👉 استفاده از PCA (تحلیل مؤلفه‌های اصلی) برای جهت‌دهی بهتر داده‌ها.

⚡ ۲. حساسیت زیاد به داده‌ها

مثلا فقط کافیه یک نمونه خاص رو از داده پاک کنیم (مثل اون گل Iris با گلبرگ ۴.۸ × ۱.۸ سانتی‌متر 🌸).
نتیجه؟ کل شکل درخت عوض میشه! 😱

حتی اگه همون داده رو دوباره بدی، چون الگوریتم تصادفی (stochastic) کار می‌کنه، ممکنه مدل‌های متفاوتی بسازه.

📌 راه‌حل؟

از random_state استفاده کنیم تا خروجی ثابت بمونه.
یا بهتر از اون: بجای یه درخت، از جنگل تصادفی (Random Forest) 🌲🌲🌲 استفاده کنیم → مدل پایدارتر و دقیق‌تر میشه.
#درخت_تصمیم #بی_ثباتی_مدل #جنگل_تصادفی

📍@azaduniqomMl

Читать полностью…

MODELIUM

❓سوال سی و هفت: مزایای نمایش داده‌ها با شبکه بیزین چیه؟

📌 شبکه بیزین (Bayesian Network) یه مدل گرافیکی احتمالاتیه که ویژگی‌ها و وابستگی‌هاشون رو با یه گراف جهت‌دار بدون چرخه (DAG) نشون میده.

مزایا:
🔹 نمایش استقلال و استقلال شرطی → جایی که ویژگی‌ها مستقل باشن یا فقط تحت شرایط خاصی به هم وابسته باشن.

🔹 کد کردن بخش‌های مهم وابستگی → لازم نیست کل توزیع مشترک رو نگه داریم، فقط قسمت‌های مرتبط رو ذخیره می‌کنه.

🔹 نمایش تصویری و قابل فهم → گراف‌ها نشون میدن که استنباط‌ها چقدر پیچیده‌ان.

🔹 مفید برای داده‌های ناقص → چون ساختار روابط بین ویژگی‌ها رو می‌شناسه، می‌تونه مقادیر گم‌شده رو راحت‌تر یاد بگیره.

🧠 خلاصه‌ش اینه:
شبکه بیزین مثل یه نقشه راهه که نشون میده کدوم ویژگی‌ها روی همدیگه اثر دارن. اینجوری هم فهم روابط ساده‌تر میشه، هم با داده‌های ناقص بهتر کنار میاد.
#سوالات_مصاحبه #سوال_سی_و_هفتم

📍@azaduniqomMl

Читать полностью…

MODELIUM

🌲🌲 جنگل تصادفی (Random Forest): جنگل جادویی درخت‌ها! 🌲🌲

یه درخت تصمیم (Decision Tree) قشنگه ولی معمولاً دچار Overfitting میشه 😅
راه‌حل؟ 🌟 یه جنگل بساز! کلی درخت تصمیم با هم رأی میدن ✅

🔹 چی هست؟
👉 جنگل تصادفی مجموعه‌ای از درخت‌ تصمیم‌هاست که با Bagging آموزش میشه.
🔸 دسته‌بندی: RandomForestClassifier
🔸 رگرسیون: RandomForestRegressor

🔹 ویژگی مهم
به‌جای انتخاب بهترین ویژگی، از یه زیرمجموعه تصادفی استفاده می‌کنه.
نتیجه؟ درخت‌ها متنوع‌تر 🌳🌳🌳 → مدل پایدارتر.

🔹 مزایا
✅ مقاوم‌تر از یه درخت تنها
✅ خطای کمتر (بایاس ↑ کم ولی واریانس ↓ زیاد)
✅ اجرا روی چند CPU → سرعت بالا

🔹 کد نمونه

from sklearn.ensemble import RandomForestClassifier

rnd_clf = RandomForestClassifier(
n_estimators=500,
max_leaf_nodes=16,
n_jobs=-1
)
rnd_clf.fit(X_train, y_train)
y_pred_rf = rnd_clf.predict(X_test)
📍@AzaduniQomMl

Читать полностью…

MODELIUM

❓ سوال سی و شش: What is a Bayesian Classifier? (بیزین کلاسیفایر چیه؟)

🧠 بیزین کلاسیفایر یه مدل احتمالاتی هست که سعی می‌کنه احتمال خطای دسته‌بندی رو کم کنه.

🔹 اینطوری کار می‌کنه:

* از روی داده‌های آموزش، احتمال وقوع هر ویژگی رو با توجه به کلاس محاسبه می‌کنه.
* بعد توی مرحله تست، با استفاده از قاعده بیز (Bayes’ Rule) میاد حدس می‌زنه نمونه جدید مربوط به کدوم کلاس هست.


📌 ساده‌تر بگم:
بیزین کلاسیفایر میگه: «با توجه به داده‌هایی که دیدم، احتمال اینکه این نمونه متعلق به کلاس A باشه بیشتره یا کلاس B؟» 🤔

📊 پرکاربردترین نسخه‌ش هم Naive Bayes هست که فرض می‌کنه ویژگی‌ها مستقل از هم هستن (که همیشه درست نیست ولی خیلی وقتا جواب میده 😉).

#سوالات_مصاحبه #سوال_سی_و_ششم

📍@azaduniqomMl

Читать полностью…

MODELIUM

❓️سوال سی و چهار: چندتا از الگوریتم‌های معروف دسته‌بندی (Classification) رو نام ببر؟

✅ جواب:

* Decision Tree (درخت تصمیم) 🌳
* K-Nearest Neighbors (KNN) 👥
* Naive Bayes 🎲
* Support Vector Machines (SVM) 📏
* Random Forest 🌲🌲

این‌ها از پرکاربردترین الگوریتم‌های دسته‌بندی هستن.

#سوالات_مصاحبه #سوال_سی_و_چهارم

📍@azaduniqomMl

Читать полностью…

MODELIUM

📌؛ Out-of-Bag Evaluation چیه؟

وقتی توی روش Bagging داده‌ها رو با جایگزینی انتخاب می‌کنیم، بعضی نمونه‌ها چند بار وارد آموزش می‌شن و بعضی‌ها اصلاً انتخاب نمی‌شن 🤷‍♂️

🔹 به اون داده‌هایی که انتخاب نمی‌شن میگن Out-of-Bag (OOB) یا همون «بیرون‌کیسه‌ای»! 👜

تقریباً 63٪ داده‌ها وارد آموزش می‌شن و حدود 37٪ می‌مونن OOB (البته این 37٪ برای هر مدل فرق می‌کنه).

🔹 نکته جذاب اینجاست:
چون یه مدل خاص اون داده‌های OOB رو ندیده، میشه با همونا مدل رو تست کرد!
یعنی بدون اینکه یه Validation Set جدا داشته باشی، همون داده‌های OOB نقش اعتبارسنجی رو بازی می‌کنن 🤓👌

در نهایت، برای کل Ensemble، میانگین عملکرد روی داده‌های OOB حساب میشه ✅

📍@AzaduniQomMl

Читать полностью…

MODELIUM

🚀 اگه می‌خوای یادگیری ماشین رو اصولی یاد بگیری، این ۵ منبع رایگان می‌تونه مثل یه نقشه راه کمکت کنه 📚✨

1️⃣ مبانی پایه 🤖
🔹 یادگیری ماشین کاربردی – آموزش مفاهیم پایه با مثال‌های واقعی:
https://sample-link.com/ml-applied
🔹 یادگیری ماشین تفسیرپذیر – یاد بگیر مدل‌هات فقط دقیق نباشن، بلکه قابل فهم هم باشن:
https://sample-link.com/ml-interpret

2️⃣ ریاضیات یادگیری ماشین ➕➗
🔹 ریاضیات برای یادگیری ماشین – جبر خطی، آمار و حسابان مخصوص ML:
https://sample-link.com/ml-math
🔹 یادگیری ماشین احتمالاتی – همه چیز درباره احتمالات و مدل‌های آماری:
https://sample-link.com/ml-prob

3️⃣ عدالت در یادگیری ماشین ⚖️
🔹 عدالت و یادگیری ماشین – چطور الگوریتم‌هات رو عادلانه و بدون تبعیض طراحی کنی:
https://sample-link.com/ml-fairness

4️⃣ یادگیری ماشین در محیط تولید 🛠️
🔹 یادگیری ماشین در عمل – از تست روی لپ‌تاپ تا پیاده‌سازی در دنیای واقعی:
https://sample-link.com/ml-in-prod

5️⃣ دوره‌های رایگان یادگیری ماشین 🎥🎓
🔹 یه لیست کامل از بهترین دوره‌های رایگان برای شروع:
https://sample-link.com/ml-free-courses

✨ همه لینک‌ها اینجاست 👆
شروع کن و قدم‌به‌قدم حرفه‌ای‌تر شو 🚀🔥


📍@azaduniqomMl

Читать полностью…

MODELIUM

❓️سؤال سی و یک: p-value چیه و چرا مهمه؟

🔹 در واقع p-value یه عدد آماریه که بهمون میگه:
«اگه فرض صفر (H₀) درست باشه، احتمال اینکه همچین نتیجه‌ای (یا حتی شدیدتر) ببینیم چقدره؟»

📌 اهمیتش:

* اگه p-value ≤ 0.05 باشه → یعنی شواهد قوی بر علیه فرض صفر داریم → پس می‌تونیم فرض صفر رو رد کنیم.
* اگه p-value > 0.05 باشه → یعنی شواهد کافی برای رد فرض صفر نداریم.
* هرچی p-value کوچیک‌تر باشه → مطمئن‌تر می‌شیم که نتیجه‌ی ما تصادفی نبوده.

مثال ساده 🌱:
فرض کن می‌خوای تست کنی یه سکه سالمه یا نه.


اگه بارها بندازی و همیشه شیر بیاد، p-value خیلی کوچیک میشه → پس احتمالاً سکه سالم نیست.

اگه p-value بزرگ باشه، یعنی شواهد کافی برای گفتن اینکه سکه مشکل داره نداری.


#سوالات_مصاحبه #سوال_سی_و_یکم

📍@azaduniqomMl

Читать полностью…

MODELIUM

🎯 فقط توی ۱۰ هفته اولین پروژه‌ی یادگیری ماشین خودتو بساز!

⌛ با روزی ۲–۳ ساعت تمرین، از صفر می‌رسی به جایی که یه پروژه واقعی AI بسازی و توی پورتفولیو یا لینکدینت نشون بدی 👨🏻‍💻🚀

📆 نقشه راه ۱۰ هفته‌ای:

🐍 پایتون برای دیتا ساینس
⬅️ شروع با پایتون و استفاده ازش تو کار با داده‌ها.
🔗 Python for Data Science:
https://youtube.com/playlist?list=PLVZqlMpoM6kbaeySxhdtgQPFEC5nV7Faa

📊 ریاضیات لازم ML
⬅️ جبر خطی، آمار و احتمال به زبان ساده و کاربردی.
🔗 How Models Learn:
https://youtube.com/watch?v=8onB7rPG4Pk
🔗 Machine Learning Math:
https://youtube.com/playlist?list=PLZSO_6-bSqHTeEgEF3J6VJkMwy3kgXQZ3

🤖 مبانی یادگیری ماشین
⬅️ مفاهیم پایه مثل رگرسیون، دسته‌بندی و مشکل Overfitting.
🔗 Supervised ML:
https://youtube.com/watch?v=H2eUamhC4XA
🔗 ML in 10 Hours:
https://youtube.com/watch?v=aircAruvnKk

📈 کار با داده در پایتون
⬅️ ابزارهای Pandas, NumPy و Matplotlib با مثال‌های واقعی.
🔗 Python Pandas Data Science Tutorial:
https://youtube.com/watch?v=zmdjNSmRXF4
🔗 Lambda Expressions:
https://youtube.com/watch?v=hYzwCsKGRrg

🧠 یادگیری عمیق مقدماتی
⬅️ آشنایی با شبکه‌های عصبی و مکانیزم Backpropagation.
🔗 PyTorch for Deep Learning:
https://youtube.com/playlist?list=PLhhyoLH6IjfxeoooqP9rhU3HJIAVAJ3Vz
🔗 Backpropagation Calculus:
https://youtube.com/watch?v=tIeHLnjs5U8

⚡ ترنسفورمرها به زبان ساده
⬅️ از Attention تا GPT و معماری‌های مدرن.
🔗 Illustrated Guide to Transformers:
http://jalammar.github.io/illustrated-transformer/
🔗 The Illustrated Transformer:
https://jalammar.github.io/illustrated-transformer/

🤗 کار با Hugging Face
⬅️ اجرای مدل‌های آماده مثل BERT و GPT فقط در چند خط کد.
🔗 Hugging Face LLM Course:
https://huggingface.co/course/chapter1

✍️ پرامپت‌نویسی + OpenAI API
⬅️ نوشتن پرامپت‌های مؤثر و اتصال GPT به اپلیکیشن با پایتون.
🔗 OpenAI Cookbook:
https://github.com/openai/openai-cookbook
🔗 OpenAI API in Python:
https://platform.openai.com/docs/api-reference/introduction

🔗 پروژه‌های کوچک با LangChain
⬅️ آشنایی با LangChain و ساخت یک ایجنت مرحله به مرحله.
🔗 LangChain Crash Course:
https://youtube.com/watch?v=aywZrzNaKjs

🏆 جمع‌بندی و نمایش کارها
⬅️ پروژه‌هات رو بازبینی کن، بهترین‌ها رو انتخاب کن و تو لینکدین بذار.

✨ آخرش چی داری؟
✅ هم مبانی یادگیری ماشین رو یاد گرفتی
✅ هم پروژه واقعی داری برای نمایش
✅ و می‌تونی مسیر تخصصی خودتو تو AI انتخاب کنی

🌐 #یادگیری_ماشین


📍@azaduniqomMl

Читать полностью…

MODELIUM

🤝 وقتی مدل‌ها دست به یکی می‌کنن!

فرض کن چندتا مدل مختلف داری:
🔹 Logistic Regression
🔹 SVM
🔹 Random Forest
🔹 KNN
و چند مدل دیگه...

هر کدوم حدوداً ۸۰٪ دقت دارن. حالا یه راه ساده برای گرفتن نتیجه بهتر اینه که:
📢 بذاری همه رأی بدن و برنده کسی باشه که بیشترین رأی رو آورده!
به این میگن Hard Voting Classifier.

✨ نکته جالب:
حتی اگه هر مدل خیلی قوی نباشه (مثلاً فقط کمی بهتر از حدس تصادفی باشه)، وقتی تعدادشون زیاد باشه و تنوع داشته باشن، با هم ترکیب بشن تبدیل میشن به یه مدل قوی! 🔥

👀 مثال:
یه سکه‌ رو در نظر بگیر که ۵۱٪ مواقع شیر میاد و ۴۹٪ خط.

* اگه فقط یه بار بندازی، خیلی شانسیه.
* ولی اگه هزار بار بندازی، به احتمال ۷۵٪ شیرها بیشترن!
* اگه ده هزار بار بندازی، این احتمال میره بالای ۹۷٪! 🎯

این همون قانون اعداد بزرگ ـه.

📌 توی Voting Classifier هم همین اتفاق میفته:
هر مدل یه رأی میده، در نهایت تصمیم اکثریت باعث میشه دقت کلی بالاتر از هر مدل تکی بشه.

#یادگیری_ماشین #مدل_ترکیبی #رای_گیری #هوش_مصنوعی #علم_داده #کلاسفایر #یادگیری_تجمیعی #دقت_مدل #الگوریتم

📍@azaduniqomMl

Читать полностью…

MODELIUM

❓ سوال بیست و نهم: Paired t-test یعنی چی و کجا استفاده میشه؟

💡 جواب ساده:
Paired t-test یه آزمون آماریه که میاد میانگین اختلاف بین دو حالت یکسان از یه گروه رو بررسی می‌کنه.
یعنی چی؟ 🤔
یعنی وقتی مثلا می‌خوای بدونی:

فشار خون یه نفر قبل و بعد مصرف دارو تغییر کرده یا نه 🩸💊

نمره دانشجوها قبل و بعد یه دوره آموزشی فرق کرده یا نه 🎓

📌 ایده اصلی:

فرض صفر (H₀): هیچ فرقی وجود نداره (میانگین اختلاف = صفر).

فرض مقابل (H₁): یه فرق واقعی وجود داره (میانگین اختلاف ≠ صفر).

✅ کاربرد: وقتی داده‌ها "جفت" باشن.
یعنی هر فرد یا نمونه رو قبل و بعد از یه شرایط خاص اندازه بگیریم.

خلاصه: Paired t-test کمک می‌کنه بفهمیم تغییر دیده‌شده، واقعیه یا فقط یه تغییر شانسی.


#سوالات_مصاحبه #سوال_بیست_و_نهم

📍@azaduniqomMl

Читать полностью…

MODELIUM

🔹 Data Pipeline مسیریه که داده رو از لحظه جمع‌آوری تا استفاده نهایی، خودکار و سریع جابه‌جا و آماده می‌کنه.

این مسیر ۵ مرحله اصلی داره:

1️⃣ Collect → جمع‌آوری داده از منابع مختلف (اپ، سنسور، دیتابیس...)
2️⃣ Ingest → ورود داده به سیستم (مثلاً از طریق صف‌ها)
3️⃣ Store → ذخیره‌سازی داده (دیتالیک، انبار داده، DB)
4️⃣ Compute → پردازش و تمیزکاری داده (Batch یا Stream)
5️⃣ Consume → مصرف داده (تحلیل، داشبورد، ML، اپلیکیشن‌ها)


---

👉 به زبان خیلی ساده: پایپ‌لاین داده، داده خام رو می‌گیره، مرتب و پردازش می‌کنه، و آماده استفاده برای تحلیل یا ML می‌کنه.


📍@azaduniqomMl

Читать полностью…

MODELIUM

🔍 پارادوکس سیمپسون چیست؟

پارادوکس سیمپسون زمانی رخ می‌دهد که یک روند یا رابطه در چندین گروه از داده‌ها وجود داشته باشد، اما وقتی این گروه‌ها با هم ترکیب می‌شوند، آن روند ناپدید شده یا معکوس می‌شود. این پدیده می‌تواند منجر به تفسیرهای نادرست از داده‌ها شود، به‌ویژه زمانی که متغیرهای مزاحم (confounding variables) نادیده گرفته شوند.

🧠 یک مثال‌های واقعی :

- تبعیض جنسیتی در پذیرش دانشجویان دانشگاه کالیفرنیا، برکلی
در نگاه اول، مردان شانس بیشتری برای پذیرش در مقطع تحصیلات تکمیلی داشتند. اما وقتی پذیرش‌ها بر اساس رشته‌های مختلف بررسی شد، مشخص شد که زنان بیشتر به رشته‌های رقابتی‌تر با نرخ پذیرش پایین‌تر تمایل دارند. در نتیجه، در مجموع، زنان شانس بیشتری برای پذیرش داشتند.


⚠️ اما چرا باید مراقب باشیم؟

پارادوکس سیمپسون نشان می‌دهد که همیشه باید داده‌ها را با دقت و در بافت مناسب تحلیل کنیم. نادیده گرفتن متغیرهای مزاحم می‌تواند منجر به تفسیرهای نادرست و تصمیم‌گیری‌های اشتباه شود.

#آمار #تحلیل_داده #پارادوکس_سیمپسون #آموزش

📍@AzaduniQomMl

Читать полностью…

MODELIUM

❓️سوال بیست و هفتم:چقدر دیتا برای آموزش، اعتبارسنجی و تست لازم داریم؟

یکی از سوالای همیشگی توی یادگیری ماشین همینه: *چطور دیتامو تقسیم کنم؟* 🤔

🔹 قانون کلی:
هیچ جواب مطلقی وجود نداره!


اگه داده آموزش خیلی کم باشه ➝ مدل خوب یاد نمی‌گیره                                                          
اگه داده تست خیلی کم باشه ➝ عملکرد مدل رو درست نمی‌تونی بسنجی 😅
📌 نکته طلایی:
معمولا داده‌ها رو به نسبت ۸۰٪ آموزش / ۲۰٪ تست تقسیم می‌کنن.
🔹 بعدشم میشه بخشی از آموزش رو بذاری برای Validation (اعتبارسنجی)، یا از تکنیک Cross-Validation استفاده کنی تا مدل دچار *Overfitting* نشه ✨
✅ خلاصه‌اش:
* Training (آموزش): مدل یاد می‌گیره 📚
* Validation (اعتبارسنجی): کمک می‌کنه هایپرپارامترها رو تنظیم کنیم ⚙️
* Test (تست): عملکرد واقعی مدل رو می‌سنجیم 🎯

#سوالات_مصاحبه #سوال_بیست_و_هفتم

📍@azaduniqomMl

Читать полностью…

MODELIUM

🌳 هایپرپارامترهای منظم‌سازی در درخت تصمیم

درخت تصمیم خیلی راحت Overfit میشه چون می‌تونه بی‌نهایت شاخه بسازه. ✂️

برای کنترلش باید آزادی درخت رو با هایپرپارامترها محدود کنیم (Regularization).
📌 دلیلش؟
درخت تصمیم مدل غیرپارامتریه.
یعنی تعداد پارامترها از قبل مشخص نیست.
هرچی داده بدی، درخت می‌تونه شاخه‌های بیشتری درست کنه.
مهم‌ترین تنظیمات (Hyperparameters) در Scikit-Learn:

max_depth: بیشترین عمق درخت (پیش‌فرض None = بی‌نهایت شاخه! 🌳😅)

min_samples_split: حداقل تعداد نمونه برای شکستن یک گره

min_samples_leaf: حداقل تعداد نمونه در یک برگ

min_weight_fraction_leaf: مثل بالایی ولی به صورت درصدی

max_leaf_nodes: حداکثر تعداد برگ‌ها

max_features: حداکثر تعداد ویژگی‌ها که برای Split بررسی میشن

📊 راهکار ساده:
افزایش مقدار min_ ها + کاهش مقدار max_* ها → درخت ساده‌تر، Overfitting کمتر، پیش‌بینی بهتر

#درخت_تصمیم #هایپرپارامتر #منظم_سازی #مدل_پیش_بینی

📍@azaduniqomMl

Читать полностью…

MODELIUM

📌آموزش فارسی یادگیری ماشینی و یادگیری عمیق

جلسه‌ی سی‌ و هفتم در ادامه‌ی موضوع Convolutional Neural Network (CNN) البته که این قسمت پروژه هستش


❌اگر جلسات گذشته رو ندیدید از طریق لینک زیر برید ببینید تا بتونید این پروژه رو انجام بدید❌

🖇️جلسه سی و چهارم
🖇️جلسه سی و پنجم
🖇️چلسه سی و ششم


#آموزش
#آموزش_یادگیری_ماشینی
#یادگیری_ماشین

📍@azaduniqomML

Читать полностью…
Subscribe to a channel