100
🔶 هسته دانشجویی هوش مصنوعی و یادگیری ماشین 🏫 دانشگاه آزاد اسلامی قم | دانشکده هوش مصنوعی 👤 سرپرست کارگروه : آتنا سادات چاوشی @chavooshiiii
🚀 معرفی Stackoverflow.ai
🔍 یه ابزار جستجو و کشف مبتنی بر هوش مصنوعی که توسط تیم Stack Overflow ساخته شده.
✨ ویژگی کلیدی این پلتفرم، اتصال مستقیم به پایگاه دانش Stack Overflow ـه؛ جایی با بیش از ۵۸ میلیون سؤال و پاسخ معتبر که توسط جامعه توسعهدهندگان تأیید شده.
📚 نکته جالب اینجاست که پاسخهای هوش مصنوعی رو در کنار محتوای تولیدشده توسط کاربران نشون میده.
یعنی هم از قدرت AI استفاده میکنی، هم از تجربه واقعی برنامهنویسها.
👩💻 این ابزار بیشتر مثل یه دستیار تحصیلی طراحی شده؛ مخصوصاً برای دانشجوها و برنامهنویسهایی که تازه دارن کدنویسی یاد میگیرن میتونه خیلی مفید باشه.
🔗 لینک دسترسی
#هوش_مصنوعی #برنامهنویسی #یادگیری_ماشین #ابزار_هوش_مصنوعی #معرفی_سایت
📍@azaduniqomMlЧитать полностью…
📌آموزش فارسی یادگیری ماشینی و یادگیری عمیق
✅ و جلسهی چهل و یکم با موضوع جدید،
Long-Short Term Memory (LSTM)
آغاز میکنیم.
📝 Long-Short Term Memory (LSTM)
یک نوع شبکه عصبی بازگشتی (RNN) است که برای پردازش دادههای ترتیبی (مثل متن، گفتار، یا سریهای زمانی) استفاده میشود.
🔹 مزیت اصلی آن نسبت به RNN معمولی این است که میتواند وابستگیهای بلندمدت را به خاطر بسپارد، چون ساختار داخلیاش (سلول حافظه و دروازهها: input gate, forget gate, output gate) کنترل میکند چه اطلاعاتی ذخیره یا فراموش شوند.
🔹 به همین دلیل در مسائلی مثل ترجمه ماشینی، تحلیل احساسات، پیشبینی بازار، و تشخیص گفتار خیلی پرکاربرد است.
#آموزش
#آموزش_یادگیری_ماشینی
#یادگیری_ماشین
📍@azaduniqomMLЧитать полностью…
🚀 Random Patches vs Random Subspaces
بچهها تا حالا از Bagging گفتیم که دادهها رو تصادفی انتخاب میکنه و هر مدل یه چیزی یاد میگیره.
ولی یه مرحلهی خفنتر هم داریم 👉 اینبار ویژگیها (Features) هم وارد بازی میشن!
🔹 Random Patches
✅ هم دادهها (instances) تصادفی انتخاب میشن
✅ هم ویژگیها (features)
➡️ یعنی یه جور پچکاری کامل! هم از ردیفها میزنیم هم از ستونها 😅
🔹 Random Subspaces
✅ همهی دادهها کامل نگه داشته میشن
✅ فقط بخشی از ویژگیها به صورت تصادفی انتخاب میشن
➡️ یعنی ردیفها کاملن، ستونها نصفهنیمه 👌
📌 چرا این کارو میکنیم؟
برای ساختن مدلهای متنوعتر 🎯 → کمی بایاس بالا میره، ولی واریانس کلی میاد پایین ✅
📷 مثال: توی دادههای تصویری با هزاران پیکسل، این روش خیلی میچسبه! 😉
📍@azaduniqomMlЧитать полностью…
❓️سوال سی و پنج : تفاوتها و موازنهها (trade-off) بین الگوریتمهای دستهبندی مختلف چیه؟ چطور بهترین رو انتخاب کنیم؟
✅ جواب ساده:
هیچ الگوریتمی وجود نداره که بگیم همیشه بهترینه! 🚫
انتخاب الگوریتم بیشتر بستگی به نوع مسئله و دادههات داره. معمولاً اینجوری پیش میری:
1. اول با یه الگوریتم ساده و سریع شروع میکنی (مثلاً Logistic Regression یا Decision Tree).
2. بعد چندتا الگوریتم مختلف رو امتحان میکنی (مثلاً KNN، SVM، Random Forest).
3. عملکردشون رو مقایسه میکنی با معیارهایی مثل دقت (Accuracy)، F1 Score، Precision، Recall
4. اون مدلی که بهترین کارایی رو روی دیتای تو داشته باشه انتخاب میشه ✅
📍@azaduniqomMlЧитать полностью…
❓️سوال سی و سه: خطای نوع اول و دوم چیست؟
🔹 خطای نوع اول (Type I error )
✅ جواب: یعنی وقتی فرض صفر (H₀) درست بوده، اما تو اشتباهی ردش کردی.
بهش میگن False Positive.
مثال: دکتر میگه شما مریضی 😷، درحالی که سالمی.
🔹 خطای نوع دوم (Type II error)
✅ یعنی وقتی فرض صفر (H₀) غلط بوده، اما تو اشتباهی قبولش کردی.
بهش میگن False Negative.
مثال: دکتر میگه شما سالمی 🙂، درحالی که واقعا مریضی.
✨ خلاصه:
نوع یک = Type I = False Positive = اشتباه رد کردن چیزی که درسته.
نوع دو = Type II = False Negative = اشتباه قبول کردن چیزی که غلطه.
📍@azaduniqomMlЧитать полностью…
🥤 Bagging vs 🍔 Pasting
تا حالا شده از چند نفر نظر بخوای و آخرش با جمعبندی، بهترین نتیجه رو بگیری؟ تو یادگیری ماشین هم داریم چیزی به اسم Ensemble که همین کارو میکنه!
💡 Bagging (Bootstrap Aggregating)
از دیتای اصلی نمونه میگیریم با جایگزینی
یعنی یه داده ممکنه چند بار انتخاب بشه 🥤
💡 Pasting
نمونهگیری بدون جایگزینی
هر داده فقط یک بار انتخاب میشه 🍔
📊 چطوری کار میکنه؟
1. هر مدل روی یه زیرمجموعه آموزش میبینه
2. همه مدلها نظرشونو میدن:
Classification → رایگیری
Regression → میانگینگیری
✨ مزیت: خطاهای مدلها همدیگه رو خنثی میکنن → مدل نهایی دقیقتر و پایدارتر!
😅 مثال ساده:
فقط از یه نفر بپرسی کجا بریم غذا → سلیقهای
از چند نفر بپرسی و جمعبندی کنی → احتمالاً بهترین انتخاب درمیاد
🔥 یادآوری سریع:
Bagging = با جایگزینی 🥤
Pasting = بدون جایگزینی 🍔
📍@azaduniqomMlЧитать полностью…
❓ سؤال سی و دو: F1 Score چیه؟
در واقع F1 یه عدد بین 0 تا 1ه که نشون میده مدل چقدر خوبه وقتی هم Precision (چقدر پیشبینی درست داری) و هم Recall (چقدر از موارد درست رو پیدا کردی) مهم باشه.
🔹 چرا لازمه؟
* بعضی وقتا مدل فقط یکی رو خوب میکنه:
* اگر Precision بالا ولی Recall پایین 👉 مثلا میگه همه تراکنشها سالمان تا خطا نده.
* اگر Recall بالا ولی Precision پایین 👉 مثلا همه رو مشکوک به کلاهبرداری میدونه.
*پس F1 میاد این دوتا رو متعادل میکنه.
🔹 فرمول خیلی ساده:
F1 = 2 * Precision* Recall / Precision + Recall
* Precision = از کسایی که صدا کردی، چندتاشون واقعاً دوستت بودن؟
* Recall = از کل دوستای حاضر، چندتاشونو پیدا کردی؟
* F1 = ترکیب این دوتا، یعنی هم کم صدا بزنی هم درست پیدا کنی 😅
📍@azaduniqomMlЧитать полностью…
❓️سؤال سی : Chi-squared test چیه؟
جواب ساده و روان 👇
✦ تست کای-دو (Chi-squared test) یه روش آماریه برای بررسی اینکه توزیع دادههایی که مشاهده کردی با توزیع مورد انتظارت (تحت فرض استقلال یا مدل خاص) همخونی داره یا نه.
🔹 به زبون سادهتر: میخواد ببینه آیا اختلاف بین دادههای واقعی و دادههای پیشبینی شده فقط یه اتفاق تصادفی بوده یا معنیدار هست.
📍 مثال:
فرض کن میخوای بدونی جنسیت (زن/مرد) و نوع شغل مستقل از هم هستن یا نه. با تست کای-دو میتونی بررسی کنی که آیا واقعاً بین این دو متغیر رابطهای وجود داره یا همهچی تصادفی پیش اومده.
➕ خلاصه در قالب نکته:
چی میسنجه؟ میزان اختلاف بین دادهی واقعی و دادهی مورد انتظار.
کجا کاربرد داره؟ وقتی میخوای رابطهی بین متغیرهای کیفی (categorical) رو بررسی کنی.
پایهاش چیه؟ توزیع کای-دو (chi-squared distribution).
📍@azaduniqomMlЧитать полностью…
🤔 تا حالا اسم Ensemble Learning به گوشت خورده؟
یعنی به جای اینکه فقط روی یه مدل حساب کنیم، چندتا مدل مختلف رو کنار هم میذاریم و نتیجههاشون رو ترکیب میکنیم تا دقت پیشبینی بیشتر بشه.
🔹 دقیقاً مثل وقتی چندتا متخصص دور هم جمع میشن و مشورت میکنن.
حالا یکی از سادهترین روشهای Ensemble، چیزی هست به اسم Voting Classifier.
🗳️ توی این روش هر مدل یه رأی میده؛ در حالت Hard Voting اکثریت برنده میشه، و در حالت Soft Voting میانگین احتمالها حساب میشه.
یعنی فقط یه جور «رأیگیری» بین مدلهاست.
اما این تنها روش Ensemble نیست! روشهای معروف دیگه هم داریم مثل:
Bagging → مدلهای زیادی روی دادههای مختلف آموزش میگیرن و نتیجه نهایی میانگین گرفته میشه (مثل Random Forest) 🌳
Boosting → مدلها پشت سر هم ساخته میشن و هرکدوم سعی میکنن خطای قبلیها رو جبران کنن (مثل XGBoost, AdaBoost) 🚀
Stacking → خروجی چند مدل میره به یه مدل جدیدتر که یاد میگیره چطور ترکیبشون کنه 🏗️
✅ خلاصه: Ensemble یعنی «تیمی کار کردن مدلها» و Voting فقط یکی از سادهترین تاکتیکهای این تیمه.
📍@azaduniqomMlЧитать полностью…
🚀 حکمت جمعیت در یادگیری ماشین!
تا حالا شنیدی وقتی از یه سوال سخت، جواب هزار نفر آدم معمولی رو جمع کنیم، میانگین جوابشون از جواب یه متخصص هم دقیقتر درمیاد؟ 🤯به این میگن حکمت جمعیت (Wisdom of the Crowd).
📍@azaduniqomMlЧитать полностью…
📌آموزش فارسی یادگیری ماشینی و یادگیری عمیق
✅ و جلسهی چهلم با موضوع جدید،
Recurrent Neural Networks(RNNs)
آغاز میکنیم.
📝RNN (Recurrent Neural Network) یا شبکه عصبی بازگشتی یک نوع شبکه عصبی در هوش مصنوعی است که برای پردازش دادههای توالیدار (مثل متن، صدا، ویدیو و دادههای زمانی) طراحی شده است
✔️ کاربردها:
• پردازش زبان طبیعی (ترجمه ماشینی، تولید متن، چتباتها)
• تشخیص گفتار
• پیشبینی سریهای زمانی (مثلاً قیمت سهام یا آبوهوا)
• تولید موسیقی یا صدا
#آموزش
#آموزش_یادگیری_ماشینی
#یادگیری_ماشین
📍@azaduniqomMLЧитать полностью…
📌آموزش فارسی یادگیری ماشینی و یادگیری عمیق
✅ جلسهی سی و نهم در ادامهی موضوع Convolutional Neural Network (CNN) البته که این قسمت هم پروژه هستش
🖇️جلسه سی و چهارم
🖇️جلسه سی و پنجم
🖇️چلسه سی و ششم
🖇️جلسه سی و هفتم
🖇️جلسه سی و هشتم
#آموزش
#آموزش_یادگیری_ماشینی
#یادگیری_ماشین
📍@azaduniqomMLЧитать полностью…
❓️ سوال بیست و هشتم: در مسئلهی یادگیری ماشین، وقتی دادهها نامتوازن (Imbalanced) باشن چه مشکلی ایجاد میشه و چه روشهایی برای مقابله با اون وجود داره؟
⚖️ وقتی دیتاستت کج و معوجه باشه!
فرض کن توی دیتاستت ۹۹.۹۲٪ نمونهها مثبت باشن و فقط ۰.۰۸٪ منفی 😱
مثلا توی تشخیص تقلب کارت اعتباری 💳
* بیشتر تراکنشها عادی هستن ✅
* فقط یه ذرهشون تقلبیان ❌
خب حالا اگه مدلت همیشه بگه «همه چیز اوکیه» 😎
دقتش خیلی بالا میشه ولی عملا بیخاصیت میشه! چون تقلبا رو نمیبینه 🤦♂️
🔧 راهکارها برای مقابله با این مشکل:
1️⃣ جمع کردن داده بیشتر ➝ کلاسها متعادلتر بشن.
2️⃣ Oversampling یا Undersampling ➝ زیاد کردن دادههای کم یا کم کردن دادههای زیاد
3️⃣ One-Class Learning ➝ مدلی که یاد میگیره «فقط کدوم حالت عادیه» و غیرعادیها رو تشخیص میده
4️⃣ Cost Function نامتقارن ➝ جریمهی بیشتری بذاریم روی خطای کلاس کمتعداد تا مدل جدیتر بگیره
خلاصه: توی دیتای نامتوازن، فقط «دقت بالا» ملاک خوبی نیست. باید بدونی مدل روی کلاسهای کمتعداد چه عملکردی داره
📍@azaduniqomMlЧитать полностью…
📌آموزش فارسی یادگیری ماشینی و یادگیری عمیق
✅ جلسهی سی و هشتم در ادامهی موضوع Convolutional Neural Network (CNN) البته که این قسمت هم پروژه هستش
❌اگر جلسات گذشته رو ندیدید از طریق لینک زیر برید ببینید تا بتونید این پروژه رو انجام بدید❌
🖇️جلسه سی و چهارم
🖇️جلسه سی و پنجم
🖇️چلسه سی و ششم
🖇️جلسه سی و هفتم
#آموزش
#آموزش_یادگیری_ماشینی
#یادگیری_ماشین
📍@azaduniqomMLЧитать полностью…
🌳 بیثباتی (Instability) در درخت تصمیم
خب تا اینجا فهمیدیم درخت تصمیم خیلی کاربردیه:
✅ راحت فهمیده میشه
✅ تفسیرش سادهست
✅ انعطافپذیره و قدرتمنده
اما… 😅 چندتا مشکل هم داره:
⚡ ۱. مرزهای عمودی و افقی!
درخت تصمیم عاشق مرزهای عمودی و افقیه.
یعنی همیشه شاخهها رو طوری میسازه که خطهای جداسازی عمود بر محور X یا Y باشه.
📌 مشکلش کجاست؟
اگه دادههامونو بچرخونیم (مثلا ۴۵ درجه)، دیگه مدل مرز قشنگی پیدا نمیکنه و الکی پیچیده میشه
راهحل؟ 👉 استفاده از PCA (تحلیل مؤلفههای اصلی) برای جهتدهی بهتر دادهها.
⚡ ۲. حساسیت زیاد به دادهها
مثلا فقط کافیه یک نمونه خاص رو از داده پاک کنیم (مثل اون گل Iris با گلبرگ ۴.۸ × ۱.۸ سانتیمتر 🌸).
نتیجه؟ کل شکل درخت عوض میشه! 😱
حتی اگه همون داده رو دوباره بدی، چون الگوریتم تصادفی (stochastic) کار میکنه، ممکنه مدلهای متفاوتی بسازه.
📌 راهحل؟
از random_state استفاده کنیم تا خروجی ثابت بمونه.
یا بهتر از اون: بجای یه درخت، از جنگل تصادفی (Random Forest) 🌲🌲🌲 استفاده کنیم → مدل پایدارتر و دقیقتر میشه.
#درخت_تصمیم #بی_ثباتی_مدل #جنگل_تصادفی
📍@azaduniqomMlЧитать полностью…
❓سوال سی و هفت: مزایای نمایش دادهها با شبکه بیزین چیه؟
📌 شبکه بیزین (Bayesian Network) یه مدل گرافیکی احتمالاتیه که ویژگیها و وابستگیهاشون رو با یه گراف جهتدار بدون چرخه (DAG) نشون میده.
مزایا:
🔹 نمایش استقلال و استقلال شرطی → جایی که ویژگیها مستقل باشن یا فقط تحت شرایط خاصی به هم وابسته باشن.
🔹 کد کردن بخشهای مهم وابستگی → لازم نیست کل توزیع مشترک رو نگه داریم، فقط قسمتهای مرتبط رو ذخیره میکنه.
🔹 نمایش تصویری و قابل فهم → گرافها نشون میدن که استنباطها چقدر پیچیدهان.
🔹 مفید برای دادههای ناقص → چون ساختار روابط بین ویژگیها رو میشناسه، میتونه مقادیر گمشده رو راحتتر یاد بگیره.
🧠 خلاصهش اینه:#سوالات_مصاحبه #سوال_سی_و_هفتم
شبکه بیزین مثل یه نقشه راهه که نشون میده کدوم ویژگیها روی همدیگه اثر دارن. اینجوری هم فهم روابط سادهتر میشه، هم با دادههای ناقص بهتر کنار میاد.
📍@azaduniqomMlЧитать полностью…
🌲🌲 جنگل تصادفی (Random Forest): جنگل جادویی درختها! 🌲🌲
یه درخت تصمیم (Decision Tree) قشنگه ولی معمولاً دچار Overfitting میشه 😅
راهحل؟ 🌟 یه جنگل بساز! کلی درخت تصمیم با هم رأی میدن ✅
🔹 چی هست؟
👉 جنگل تصادفی مجموعهای از درخت تصمیمهاست که با Bagging آموزش میشه.
🔸 دستهبندی: RandomForestClassifier
🔸 رگرسیون: RandomForestRegressor
🔹 ویژگی مهم
بهجای انتخاب بهترین ویژگی، از یه زیرمجموعه تصادفی استفاده میکنه.
نتیجه؟ درختها متنوعتر 🌳🌳🌳 → مدل پایدارتر.
🔹 مزایا
✅ مقاومتر از یه درخت تنها
✅ خطای کمتر (بایاس ↑ کم ولی واریانس ↓ زیاد)
✅ اجرا روی چند CPU → سرعت بالا
🔹 کد نمونه
from sklearn.ensemble import RandomForestClassifier
rnd_clf = RandomForestClassifier(
n_estimators=500,
max_leaf_nodes=16,
n_jobs=-1
)
rnd_clf.fit(X_train, y_train)
y_pred_rf = rnd_clf.predict(X_test)
📍@AzaduniQomMlЧитать полностью…
❓ سوال سی و شش: What is a Bayesian Classifier? (بیزین کلاسیفایر چیه؟)
🧠 بیزین کلاسیفایر یه مدل احتمالاتی هست که سعی میکنه احتمال خطای دستهبندی رو کم کنه.
🔹 اینطوری کار میکنه:
* از روی دادههای آموزش، احتمال وقوع هر ویژگی رو با توجه به کلاس محاسبه میکنه.
* بعد توی مرحله تست، با استفاده از قاعده بیز (Bayes’ Rule) میاد حدس میزنه نمونه جدید مربوط به کدوم کلاس هست.
📌 سادهتر بگم:
بیزین کلاسیفایر میگه: «با توجه به دادههایی که دیدم، احتمال اینکه این نمونه متعلق به کلاس A باشه بیشتره یا کلاس B؟» 🤔
📍@azaduniqomMlЧитать полностью…
❓️سوال سی و چهار: چندتا از الگوریتمهای معروف دستهبندی (Classification) رو نام ببر؟
✅ جواب:
* Decision Tree (درخت تصمیم) 🌳
* K-Nearest Neighbors (KNN) 👥
* Naive Bayes 🎲
* Support Vector Machines (SVM) 📏
* Random Forest 🌲🌲
اینها از پرکاربردترین الگوریتمهای دستهبندی هستن.
#سوالات_مصاحبه #سوال_سی_و_چهارم
📍@azaduniqomMlЧитать полностью…
📌؛ Out-of-Bag Evaluation چیه؟
وقتی توی روش Bagging دادهها رو با جایگزینی انتخاب میکنیم، بعضی نمونهها چند بار وارد آموزش میشن و بعضیها اصلاً انتخاب نمیشن 🤷♂️
🔹 به اون دادههایی که انتخاب نمیشن میگن Out-of-Bag (OOB) یا همون «بیرونکیسهای»! 👜❌
تقریباً 63٪ دادهها وارد آموزش میشن و حدود 37٪ میمونن OOB (البته این 37٪ برای هر مدل فرق میکنه).
🔹 نکته جذاب اینجاست:
چون یه مدل خاص اون دادههای OOB رو ندیده، میشه با همونا مدل رو تست کرد!
یعنی بدون اینکه یه Validation Set جدا داشته باشی، همون دادههای OOB نقش اعتبارسنجی رو بازی میکنن 🤓👌
در نهایت، برای کل Ensemble، میانگین عملکرد روی دادههای OOB حساب میشه ✅
📍@AzaduniQomMlЧитать полностью…
🚀 اگه میخوای یادگیری ماشین رو اصولی یاد بگیری، این ۵ منبع رایگان میتونه مثل یه نقشه راه کمکت کنه 📚✨
1️⃣ مبانی پایه 🤖
🔹 یادگیری ماشین کاربردی – آموزش مفاهیم پایه با مثالهای واقعی:
https://sample-link.com/ml-applied
🔹 یادگیری ماشین تفسیرپذیر – یاد بگیر مدلهات فقط دقیق نباشن، بلکه قابل فهم هم باشن:
https://sample-link.com/ml-interpret
2️⃣ ریاضیات یادگیری ماشین ➕➗
🔹 ریاضیات برای یادگیری ماشین – جبر خطی، آمار و حسابان مخصوص ML:
https://sample-link.com/ml-math
🔹 یادگیری ماشین احتمالاتی – همه چیز درباره احتمالات و مدلهای آماری:
https://sample-link.com/ml-prob
3️⃣ عدالت در یادگیری ماشین ⚖️
🔹 عدالت و یادگیری ماشین – چطور الگوریتمهات رو عادلانه و بدون تبعیض طراحی کنی:
https://sample-link.com/ml-fairness
4️⃣ یادگیری ماشین در محیط تولید 🛠️
🔹 یادگیری ماشین در عمل – از تست روی لپتاپ تا پیادهسازی در دنیای واقعی:
https://sample-link.com/ml-in-prod
5️⃣ دورههای رایگان یادگیری ماشین 🎥🎓
🔹 یه لیست کامل از بهترین دورههای رایگان برای شروع:
https://sample-link.com/ml-free-courses
✨ همه لینکها اینجاست 👆
شروع کن و قدمبهقدم حرفهایتر شو 🚀🔥
📍@azaduniqomMlЧитать полностью…
❓️سؤال سی و یک: p-value چیه و چرا مهمه؟
🔹 در واقع p-value یه عدد آماریه که بهمون میگه:
«اگه فرض صفر (H₀) درست باشه، احتمال اینکه همچین نتیجهای (یا حتی شدیدتر) ببینیم چقدره؟»
📌 اهمیتش:
* اگه p-value ≤ 0.05 باشه → یعنی شواهد قوی بر علیه فرض صفر داریم → پس میتونیم فرض صفر رو رد کنیم.
* اگه p-value > 0.05 باشه → یعنی شواهد کافی برای رد فرض صفر نداریم.
* هرچی p-value کوچیکتر باشه → مطمئنتر میشیم که نتیجهی ما تصادفی نبوده.
مثال ساده 🌱:
فرض کن میخوای تست کنی یه سکه سالمه یا نه.
اگه بارها بندازی و همیشه شیر بیاد، p-value خیلی کوچیک میشه → پس احتمالاً سکه سالم نیست.
اگه p-value بزرگ باشه، یعنی شواهد کافی برای گفتن اینکه سکه مشکل داره نداری.
📍@azaduniqomMlЧитать полностью…
🎯 فقط توی ۱۰ هفته اولین پروژهی یادگیری ماشین خودتو بساز!
⌛ با روزی ۲–۳ ساعت تمرین، از صفر میرسی به جایی که یه پروژه واقعی AI بسازی و توی پورتفولیو یا لینکدینت نشون بدی 👨🏻💻🚀
📆 نقشه راه ۱۰ هفتهای:
🐍 پایتون برای دیتا ساینس
⬅️ شروع با پایتون و استفاده ازش تو کار با دادهها.
🔗 Python for Data Science:
https://youtube.com/playlist?list=PLVZqlMpoM6kbaeySxhdtgQPFEC5nV7Faa
📊 ریاضیات لازم ML
⬅️ جبر خطی، آمار و احتمال به زبان ساده و کاربردی.
🔗 How Models Learn:
https://youtube.com/watch?v=8onB7rPG4Pk
🔗 Machine Learning Math:
https://youtube.com/playlist?list=PLZSO_6-bSqHTeEgEF3J6VJkMwy3kgXQZ3
🤖 مبانی یادگیری ماشین
⬅️ مفاهیم پایه مثل رگرسیون، دستهبندی و مشکل Overfitting.
🔗 Supervised ML:
https://youtube.com/watch?v=H2eUamhC4XA
🔗 ML in 10 Hours:
https://youtube.com/watch?v=aircAruvnKk
📈 کار با داده در پایتون
⬅️ ابزارهای Pandas, NumPy و Matplotlib با مثالهای واقعی.
🔗 Python Pandas Data Science Tutorial:
https://youtube.com/watch?v=zmdjNSmRXF4
🔗 Lambda Expressions:
https://youtube.com/watch?v=hYzwCsKGRrg
🧠 یادگیری عمیق مقدماتی
⬅️ آشنایی با شبکههای عصبی و مکانیزم Backpropagation.
🔗 PyTorch for Deep Learning:
https://youtube.com/playlist?list=PLhhyoLH6IjfxeoooqP9rhU3HJIAVAJ3Vz
🔗 Backpropagation Calculus:
https://youtube.com/watch?v=tIeHLnjs5U8
⚡ ترنسفورمرها به زبان ساده
⬅️ از Attention تا GPT و معماریهای مدرن.
🔗 Illustrated Guide to Transformers:
http://jalammar.github.io/illustrated-transformer/
🔗 The Illustrated Transformer:
https://jalammar.github.io/illustrated-transformer/
🤗 کار با Hugging Face
⬅️ اجرای مدلهای آماده مثل BERT و GPT فقط در چند خط کد.
🔗 Hugging Face LLM Course:
https://huggingface.co/course/chapter1
✍️ پرامپتنویسی + OpenAI API
⬅️ نوشتن پرامپتهای مؤثر و اتصال GPT به اپلیکیشن با پایتون.
🔗 OpenAI Cookbook:
https://github.com/openai/openai-cookbook
🔗 OpenAI API in Python:
https://platform.openai.com/docs/api-reference/introduction
🔗 پروژههای کوچک با LangChain
⬅️ آشنایی با LangChain و ساخت یک ایجنت مرحله به مرحله.
🔗 LangChain Crash Course:
https://youtube.com/watch?v=aywZrzNaKjs
🏆 جمعبندی و نمایش کارها
⬅️ پروژههات رو بازبینی کن، بهترینها رو انتخاب کن و تو لینکدین بذار.
✨ آخرش چی داری؟
✅ هم مبانی یادگیری ماشین رو یاد گرفتی
✅ هم پروژه واقعی داری برای نمایش
✅ و میتونی مسیر تخصصی خودتو تو AI انتخاب کنی
🌐 #یادگیری_ماشین
📍@azaduniqomMlЧитать полностью…
🤝 وقتی مدلها دست به یکی میکنن!
فرض کن چندتا مدل مختلف داری:
🔹 Logistic Regression
🔹 SVM
🔹 Random Forest
🔹 KNN
و چند مدل دیگه...
هر کدوم حدوداً ۸۰٪ دقت دارن. حالا یه راه ساده برای گرفتن نتیجه بهتر اینه که:
📢 بذاری همه رأی بدن و برنده کسی باشه که بیشترین رأی رو آورده!
به این میگن Hard Voting Classifier.
✨ نکته جالب:
حتی اگه هر مدل خیلی قوی نباشه (مثلاً فقط کمی بهتر از حدس تصادفی باشه)، وقتی تعدادشون زیاد باشه و تنوع داشته باشن، با هم ترکیب بشن تبدیل میشن به یه مدل قوی! 🔥
👀 مثال:
یه سکه رو در نظر بگیر که ۵۱٪ مواقع شیر میاد و ۴۹٪ خط.
* اگه فقط یه بار بندازی، خیلی شانسیه.
* ولی اگه هزار بار بندازی، به احتمال ۷۵٪ شیرها بیشترن!
* اگه ده هزار بار بندازی، این احتمال میره بالای ۹۷٪! 🎯
📍@azaduniqomMlЧитать полностью…
❓ سوال بیست و نهم: Paired t-test یعنی چی و کجا استفاده میشه؟
💡 جواب ساده:
Paired t-test یه آزمون آماریه که میاد میانگین اختلاف بین دو حالت یکسان از یه گروه رو بررسی میکنه.
یعنی چی؟ 🤔
یعنی وقتی مثلا میخوای بدونی:
فشار خون یه نفر قبل و بعد مصرف دارو تغییر کرده یا نه 🩸💊
نمره دانشجوها قبل و بعد یه دوره آموزشی فرق کرده یا نه 🎓
📌 ایده اصلی:
فرض صفر (H₀): هیچ فرقی وجود نداره (میانگین اختلاف = صفر).
فرض مقابل (H₁): یه فرق واقعی وجود داره (میانگین اختلاف ≠ صفر).
✅ کاربرد: وقتی دادهها "جفت" باشن.
یعنی هر فرد یا نمونه رو قبل و بعد از یه شرایط خاص اندازه بگیریم.
خلاصه: Paired t-test کمک میکنه بفهمیم تغییر دیدهشده، واقعیه یا فقط یه تغییر شانسی.
📍@azaduniqomMlЧитать полностью…
🔹 Data Pipeline مسیریه که داده رو از لحظه جمعآوری تا استفاده نهایی، خودکار و سریع جابهجا و آماده میکنه.
این مسیر ۵ مرحله اصلی داره:
1️⃣ Collect → جمعآوری داده از منابع مختلف (اپ، سنسور، دیتابیس...)
2️⃣ Ingest → ورود داده به سیستم (مثلاً از طریق صفها)
3️⃣ Store → ذخیرهسازی داده (دیتالیک، انبار داده، DB)
4️⃣ Compute → پردازش و تمیزکاری داده (Batch یا Stream)
5️⃣ Consume → مصرف داده (تحلیل، داشبورد، ML، اپلیکیشنها)
---
👉 به زبان خیلی ساده: پایپلاین داده، داده خام رو میگیره، مرتب و پردازش میکنه، و آماده استفاده برای تحلیل یا ML میکنه.
📍@azaduniqomMlЧитать полностью…
🔍 پارادوکس سیمپسون چیست؟
پارادوکس سیمپسون زمانی رخ میدهد که یک روند یا رابطه در چندین گروه از دادهها وجود داشته باشد، اما وقتی این گروهها با هم ترکیب میشوند، آن روند ناپدید شده یا معکوس میشود. این پدیده میتواند منجر به تفسیرهای نادرست از دادهها شود، بهویژه زمانی که متغیرهای مزاحم (confounding variables) نادیده گرفته شوند.
🧠 یک مثالهای واقعی :
- تبعیض جنسیتی در پذیرش دانشجویان دانشگاه کالیفرنیا، برکلی
در نگاه اول، مردان شانس بیشتری برای پذیرش در مقطع تحصیلات تکمیلی داشتند. اما وقتی پذیرشها بر اساس رشتههای مختلف بررسی شد، مشخص شد که زنان بیشتر به رشتههای رقابتیتر با نرخ پذیرش پایینتر تمایل دارند. در نتیجه، در مجموع، زنان شانس بیشتری برای پذیرش داشتند.
⚠️ اما چرا باید مراقب باشیم؟
پارادوکس سیمپسون نشان میدهد که همیشه باید دادهها را با دقت و در بافت مناسب تحلیل کنیم. نادیده گرفتن متغیرهای مزاحم میتواند منجر به تفسیرهای نادرست و تصمیمگیریهای اشتباه شود.
#آمار #تحلیل_داده #پارادوکس_سیمپسون #آموزش
📍@AzaduniQomMlЧитать полностью…
❓️سوال بیست و هفتم:چقدر دیتا برای آموزش، اعتبارسنجی و تست لازم داریم؟
یکی از سوالای همیشگی توی یادگیری ماشین همینه: *چطور دیتامو تقسیم کنم؟* 🤔
🔹 قانون کلی:
هیچ جواب مطلقی وجود نداره!
📌 نکته طلایی:🔹 بعدشم میشه بخشی از آموزش رو بذاری برای Validation (اعتبارسنجی)، یا از تکنیک Cross-Validation استفاده کنی تا مدل دچار *Overfitting* نشه ✨
معمولا دادهها رو به نسبت ۸۰٪ آموزش / ۲۰٪ تست تقسیم میکنن.
✅ خلاصهاش:
* Training (آموزش): مدل یاد میگیره 📚
* Validation (اعتبارسنجی): کمک میکنه هایپرپارامترها رو تنظیم کنیم ⚙️
* Test (تست): عملکرد واقعی مدل رو میسنجیم 🎯
📍@azaduniqomMlЧитать полностью…
🌳 هایپرپارامترهای منظمسازی در درخت تصمیم
درخت تصمیم خیلی راحت Overfit میشه چون میتونه بینهایت شاخه بسازه. ✂️
📌 دلیلش؟مهمترین تنظیمات (Hyperparameters) در Scikit-Learn:
درخت تصمیم مدل غیرپارامتریه.
یعنی تعداد پارامترها از قبل مشخص نیست.
هرچی داده بدی، درخت میتونه شاخههای بیشتری درست کنه.
📍@azaduniqomMlЧитать полностью…
📌آموزش فارسی یادگیری ماشینی و یادگیری عمیق
✅ جلسهی سی و هفتم در ادامهی موضوع Convolutional Neural Network (CNN) البته که این قسمت پروژه هستش
❌اگر جلسات گذشته رو ندیدید از طریق لینک زیر برید ببینید تا بتونید این پروژه رو انجام بدید❌
🖇️جلسه سی و چهارم
🖇️جلسه سی و پنجم
🖇️چلسه سی و ششم
#آموزش
#آموزش_یادگیری_ماشینی
#یادگیری_ماشین
📍@azaduniqomMLЧитать полностью…