dataplusscience | Unsorted

Telegram-канал dataplusscience - علم داده (Data Science)

6108

🗨 ارتباط با ما (تبلیغات، سوال، پیشنهاد و انتقاد): ‏📩 @Contact2Mebot 💯 کانال دوم ما: @Datascientists_Files 💎 در پیام‌رسان بله(آپدیت اتومات): https://ble.ir/dataplusscience 💡 در پیام‌رسان ایتا(آپدیت اتومات): https://eitaa.com/DataPlusScience

Subscribe to a channel

علم داده (Data Science)

📢 منابع برتر دیتاست برای متخصصان داده


🏆جامعه داده‌کاوی (Kaggle)
بزرگترین پلتفرم جهانی با ۲۷۳ هزار دیتاست رایگان در حوزه‌های سلامت، مالی و یادگیری ماشین.
▪️ ویژگی‌ها: مسابقات هوش مصنوعی، ابزارهای تحلیل یکپارچه
🔗 kaggle.com/datasets

🔍 موتور جستجوی داده (Google Dataset Search)
ابزار قدرتمند گوگل برای کشف ۲۵ میلیون دیتاست آکادمیک، دولتی و سازمانی.
▪️ فرمت‌ها: CSV، JSON، PDF
🔗 toolbox.google.com/datasetsearch

📚 مخزن دانشگاهی (UCI ML Repository)
منبع کلاسیک دانشگاهی با ۶۵۰+ دیتاست برای توسعه مدل‌های ML.
▪️ نمونه‌ها: Iris، Adult، Wine
🔗 archive.ics.uci.edu


🌍 آمار جهانی (World Bank Data)
داده‌های توسعۀ ۲۰۰+ کشور در حوزه اقتصاد، جمعیت و سلامت.
▪️ ابزار: نمودارهای تعاملی و پیش‌بینی روندها
🔗 data.worldbank.org

📊 داده‌های تحلیلی (FiveThirtyEight)
منبع روزنامه‌نگاری داده‌محور با تمرکز بر ورزش، سیاست و اقتصاد.
▪️ نمونه: آمار NBA و انتخابات آمریکا
🔗 data.fivethirtyeight.com

☁️ مجموعه دیتاست AWS Open Data
پلتفرم کلان‌داده برای پروژه‌های یادگیری عمیق و تصاویر ماهواره‌ای.
▪️ دسترسی رایگان: داده‌های انرژی و محیط‌زیست
🔗 registry.opendata.aws

🧪 داده‌های پژوهشی (Academic Torrents)
منبع دیتاست‌های حجیم تا ۲ ترابایت برای تحقیقات دانشگاهی.
▪️ نمونه: داده‌های پزشکی MIMIC-III
🔗 academictorrents.com

🏥 داده‌های سلامت جهانی (WHO GHO)
آمار سازمان بهداشت جهانی از شیوع بیماری‌ها تا واکسیناسیون.
▪️ کاربرد: تحلیل اپیدمی‌ها و سیاست‌گذاری
🔗 who.int/data/gho

🤖 کتابخانه Hugging Face
پلتفرم تخصصی پردازش زبان با دیتاست‌های متن، صدا و تصویر.
▪️ نمونه: ترجمه ماشینی و تشخیص احساسات
🔗 huggingface.co/datasets

➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @Data➕Science

Читать полностью…

علم داده (Data Science)

📘 صد سوال برتر برای مصاحبه شغلی دانشمند داده

💡 این داکیومنت مجموعه‌ای از سوالات متداول و پاسخ‌های جامع در حوزه علم داده است که برای آماده‌سازی مصاحبه‌های شغلی طراحی شده است. این سوالات بخش‌های مختلفی از مهارت‌های علمی و عملی را پوشش می‌دهند، از جمله آمار، یادگیری ماشین، تحلیل داده‌ها و پردازش زبان طبیعی.

🔑 دسته‌بندی اصلی:

📊 تحلیل آماری: شامل مفاهیم مانند آزمون فرضیه، خطاهای نوع اول و دوم، توزیع‌های احتمالی و قضیه حد مرکزی.
🎲 احتمالات و نظریه اطلاعات: سوالاتی درباره احتمال شرطی، زنجیره مارکوف، قانون مجموع احتمال و آنتروپی.
🤖 یادگیری نظارت‌شده: مفاهیمی چون رگرسیون، درخت تصمیم، گرادیان کاهشی و معیارهای ارزیابی مدل.
📈 یادگیری بدون نظارت: تکنیک‌هایی مانند خوشه‌بندی K-means، DBSCAN، تحلیل مولفه‌های اصلی (PCA) و کاهش ابعاد.
🧠 پردازش زبان طبیعی (NLP): شامل توکن‌سازی، مدل‌سازی زبان، BERT، تحلیل احساسات و مدل‌های توجه (Attention).
🖼 پردازش تصویر: سوالاتی درباره شبکه‌های عصبی پیچشی (CNN)، انتقال سبک، تشخیص اشیا و GANها.

➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @Data➕Science

Читать полностью…

علم داده (Data Science)

.
🔹 ترم جدید حضوری/آنلاین

مسیر شغلی «مهندس هوش مصنوعی» 6 بهمن شروع می شود.

✅ یکساله مهندس AI شوید و آینده شغلی خودتان را تضمین کنید.

🔸 440 ساعت . 110 جلسه . 55 هفته . 20 پروژه . 8 کورس . 3 هیات علمی

♦️ مهارت‌های نرم‌افزاری . ریاضیات AI . یادگیری ماشین پیشرفته . یادگیری عمیق پیشرفته . MLOps . SDLC . پردازش ابری AWS/GCP . مدل‌های مولد و زبانی LLM/VLM


روش های پرداخت شهریه:
🔹 نقدی ۲۰% تخفیف
🔹 شرایط اقساطی
🔹 دانشجویی بلند مدت
🔹 سازمانی بدون پیش پرداخت
🔹 شهریه معوقه


مشاوره کامل قبل ثبت نام:
♦️ دایرکت: @daycheapply
♦️ پیامک: ارسال کد ۱ به ۰۹۳۰۰۲۱۴۴۴۱
♦️ اطلاعات بیشتر: dayche.com/ig

💲 5% کدتخفیف مخصوص این کانال: HY38PG66

t.me/daychecatalog
t.me/daycheapply

Читать полностью…

علم داده (Data Science)

📚 ساخت اولین سیستم RAG (Retrieval-Augmented Generation)

💡 این فایل آموزشی شامل مراحل ساخت یک سیستم RAG ساده برای پاسخگویی به سوالات بر اساس اسناد است. مفاهیم کلیدی مانند استخراج متن (Text Extraction)، تقسیم‌بندی متن (Text Chunking) و جستجوی برداری (Vector Search) را توضیح می‌دهد.

📄 محتوای فایل:

استخراج متن از PDF با استفاده از PyMuPDF
تقسیم‌بندی متن به قطعات کوچکتر (Chunking)
روش‌های بازیابی اطلاعات: جستجوی کلیدواژه‌ای (Keyword-based) و جستجوی برداری (Vector-based)
الگوریتم Okapi BM25 برای رتبه‌بندی اسناد
استفاده از Embeddings برای محاسبه شباهت معنایی
ساخت یک سیستم RAG ساده با استفاده از OpenAI API

🔬 این فایل همچنین محدودیت‌های سیستم RAG پایه را نشان می‌دهد و زمینه را برای بحث در مورد تکنیک‌های پیشرفته‌تر در فصل‌های بعدی فراهم می‌کند.


📢 #RAG #NLP #MachineLearning #VectorSearch #TextExtraction #پردازش_زبان_طبیعی #یادگیری_ماشین #هوش_مصنوعی

➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @Data➕Science

Читать полностью…

علم داده (Data Science)

📊 کتاب Understanding ETL: Data Pipelines for Modern Data Architectures

💡 این کتاب نکه توسط Databricks منتشر شده به معرفی مفاهیم، روش‌ها و بهترین شیوه‌های ETL (استخراج، تبدیل، بارگذاری) در معماری‌های داده مدرن پرداخته است. این کتاب برای مهندسان داده، تحلیلگران و محققین طراحی شده و نحوه ساخت و بهینه‌سازی پایگاه‌های داده و پایپ‌لاین‌های داده را توضیح می‌دهد.

سر فصل مطالب کتاب:

📤 دریافت داده‌ها (Data Ingestion): اصول و روش‌های دریافت داده از منابع مختلف.

🔄 تبدیل داده‌ها (Data Transformation): پردازش و تغییر داده‌ها برای تحلیل‌های دقیق‌تر.

⚙️ هماهنگ‌سازی داده‌ها (Data Orchestration): هماهنگ‌سازی و مدیریت گردش کار داده‌ها.

🛠 مسائل و رفع اشکال پایگاه‌های داده (Pipeline Issues and Troubleshooting): شناسایی و حل مشکلات پایپ‌لاین‌ها.

🚀 کارایی و مقیاس‌پذیری (Efficiency and Scalability): بهینه‌سازی کارایی و مقیاس‌پذیری سیستم‌های ETL


➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @Data➕Science

Читать полностью…

علم داده (Data Science)

📚 کتاب آموزش کاربردی یادگیری تقویتی

💡 این کتاب توسط دکتر امیر حاجی علی بیگی و محمد مهدی ارفع عربشاهی نگاشته شده و به طور جامع مفاهیم یادگیری تقویتی (Reinforcement Learning) را به روشی ساده و کاربردی توضیح می‌دهد. این کتاب برای دانشجویان و علاقه‌مندان به یادگیری ماشین و هوش مصنوعی طراحی شده است تا با استفاده از مفاهیم پایه‌ای و الگوریتم‌های کلیدی مانند Q-learning و SARSA، به درک عمیقی از این حوزه دست یابند.

🔑 محتویات اصلی کتاب:
📘 آشنایی با مفاهیم پایه یادگیری تقویتی
🧑‍🏫 توضیح الگوریتم‌های Q-learning و SARSA
🔄 بررسی زنجیره‌های مارکوف و نحوه استفاده از آن‌ها در مدل‌های یادگیری تقویتی
⚙️ معرفی روش‌های مختلف بهینه‌سازی و پیاده‌سازی در دنیای واقعی
🛠 چالش‌های یادگیری تقویتی و راه‌حل‌ها

📢 #یادگیری_تقویتی #هوش_مصنوعی

➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @Data➕Science

Читать полностью…

علم داده (Data Science)

📊✨ آمار کانال ما در سال 2024 ✨📊

✅ 162 پست جدید منتشر شد.
👥 2800 عضو جدید به خانواده ما پیوستند.
👁 314,270 بازدید از مطالب منتشر شده صورت گرفت.
📤 10,932 اشتراک‌گذاری در پیام‌های خصوصی انجام شد.

امیدواریم گامی مثبت در ترویج و آموزش علوم داده برداشته باشیم و از شما بابت این همراهی صمیمانه سپاسگزاریم. 🙏🌟

➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @Data➕Science

Читать полностью…

علم داده (Data Science)

📦 50 کتابخانه برتر پایتون که باید در سال 2025 بشناسید

💡 این تصویر کتابخانه‌های مهم پایتون را در دسته‌بندی‌های کلیدی معرفی می‌کند که برای برنامه‌نویسان و محققان در حوزه‌های مختلف مانند علم داده، یادگیری ماشین، و توسعه وب اپلیکیشن ضروری هستند.

علم داده و پردازش داده‌ها: کتابخانه‌هایی مثل Pandas، NumPy و Polars برای مدیریت و تحلیل داده‌ها.
یادگیری ماشین: شامل Scikit-learn، XGBoost و LightGBM برای مدل‌سازی و تحلیل.
یادگیری عمیق: PyTorch، TensorFlow، و Keras برای ساخت و آموزش شبکه‌های عصبی.
پردازش زبان طبیعی (NLP): کتابخانه‌هایی مثل NLTK، Spacy، و Hugging Face برای تحلیل و پردازش متن.
بینایی کامپیوتر: OpenCV و Mahotas برای پردازش تصویر و ویدئو.
بصری‌سازی داده‌ها: Matplotlib، Seaborn و Plotly برای ایجاد نمودارهای حرفه‌ای.
هوش مصنوعی مولد: DALL-E 2، StyleGAN، و PEFT برای تولید محتوا و تصاویر.
توسعه وب اپلیکیشن: Streamlit و Dash برای ساخت برنامه‌های تعاملی وب.

مطالعه جزییات

➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @Data➕Science

Читать полностью…

علم داده (Data Science)

📊 انواع پایگاه‌های داده

این تصویر دسته‌بندی انواع پایگاه‌های داده را همراه با نمونه‌های مشهور نشان می‌دهد.

پایگاه‌های داده رابطه‌ای (Relational Databases):
داده‌ها در جداول با روابط مشخص ذخیره می‌شوند. نمونه‌ها: MySQL، PostgreSQL، Oracle Database.

پایگاه‌های داده NoSQL:
برای ذخیره داده‌های بدون ساختار یا نیمه‌ساختار و مدیریت حجم بالای داده‌ها با انعطاف‌پذیری بالا استفاده می‌شوند. نمونه‌ها: MongoDB، Couchbase.

پایگاه‌های داده زمانی (Time-Series Databases):
برای ذخیره و تحلیل داده‌های وابسته به زمان استفاده می‌شوند. نمونه‌ها: InfluxDB، Prometheus.

پایگاه‌های داده توزیع‌شده (Distributed Databases):
داده‌ها در چندین سرور توزیع شده و مقیاس‌پذیری بالایی دارند. نمونه‌ها: Apache Cassandra، Amazon DynamoDB.

پایگاه‌های داده در حافظه (In-Memory Databases):
داده‌ها در حافظه ذخیره می‌شوند و سرعت دسترسی بسیار بالایی دارند. نمونه‌ها: Redis، Memcached.

➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @Data➕Science

Читать полностью…

علم داده (Data Science)

📊 شصت پرسش‌ پرکاربرد در مصاحبه‌های علم داده


📌 این فایل شامل سوالات رایج و پاسخ‌های جامع در حوزه علم داده است. با مطالعه این مجموعه، برای مصاحبه‌های شغلی علم داده آمادگی کامل پیدا کنید. سوالات کدنویسی و سناریوهای واقعی نیز در این فایل بررسی شده‌اند.

💻 ساختار کلی فایل:
✔️ مفاهیم پایه: تفاوت یادگیری نظارت‌شده و نظارت‌نشده، اصول رگرسیون خطی و بایاس-واریانس.
🔍 سوالات متوسط: الگوریتم‌های خوشه‌بندی، جنگل تصادفی و تحلیل مؤلفه‌های اصلی (PCA).
⚡️ سوالات پیشرفته: شبکه‌های عصبی، تحلیل بقا، و مشکلات داده‌های نامتوازن.
🧑‍💻 سوالات کدنویسی: پیاده‌سازی الگوریتم‌هایی مانند K-means، درخت تصمیم و رگرسیون لجستیک.
📈 سوالات موردکاوی (Case-Based): تحلیل ریزش مشتری، پیش‌بینی فروش، و ساخت سیستم پیشنهادگر.


➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @Data➕Science

Читать полностью…

علم داده (Data Science)

📊 خلاصه فارسی گزارش شاخص هوش مصنوعی 2024

💡 این فایل شامل نکات کلیدی گزارش بین‌المللی Artificial Intelligence Index Report 2024 است که توسط دانشگاه استنفورد منتشر شده است. این گزارش جامع به بررسی جنبه‌های مختلف پیشرفت در هوش مصنوعی، از جمله تحقیقات، عملکرد فنی، اقتصاد، مسائل اخلاقی، تنظیم مقررات، و کاربردها در علم، پزشکی و آموزش پرداخته است.

📄 ساختار کلی گزارش:

تحقیقات و توسعه: تسلط صنعت، رشد مدل‌های پایه، هزینه‌های بالا.
عملکرد فنی: پیشی‌گرفتن در برخی وظایف از انسان، چالش معیارهای سخت‌تر.
مسئولیت‌پذیری: نگرانی‌های اخلاقی، شفافیت کم.
اقتصاد: افزایش سرمایه‌گذاری، تغییر بازار کار.
علم و پزشکی: پیشرفت در کشف مواد و سیستم‌های پزشکی.
آموزش: رشد دانشجویان علوم کامپیوتر، کاهش تنوع جغرافیایی.
سیاست‌گذاری: رشد چشمگیر قوانین مرتبط با هوش مصنوعی.
افکار عمومی: نگرانی‌ها و امیدواری‌های جهانی نسبت به تأثیر هوش مصنوعی.

➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @Data➕Science

Читать полностью…

علم داده (Data Science)

📖 50 سوال مهم مصاحبه برای مدل‌های زبانی بزرگ (LLMs)

💡 این فایل شامل سوالات کلیدی مرتبط با مدل‌های زبانی بزرگ و پاسخ‌های تخصصی به آن‌ها است. برای افراد علاقه‌مند به یادگیری مفاهیم پایه و پیشرفته در این حوزه بسیار مفید است. این سوالات مفاهیمی مانند توکن‌سازی (Tokenization)، تکنیک‌های بهینه‌سازی مانند LoRA و QLoRA، و مفهوم توجه چندسری (Multi-head Attention) را پوشش می‌دهند.

📄 رئوس سوالات:

توکن‌سازی و اهمیت آن: چرا و چگونه مدل‌های زبانی بزرگ متن را به توکن‌ها تقسیم می‌کنند؟
بهینه‌سازی حافظه با LoRA و QLoRA: کاهش مصرف حافظه بدون افت عملکرد.
تفاوت مدل‌های اتورگرسیو و ماسک‌شده: کاربردها و نقاط قوت هر روش.
مفاهیم پیشرفته مثل زنجیره افکار (Chain-of-Thought): بهبود توانایی استدلال مدل‌ها.
حل چالش‌های رایج مدل‌های زبانی بزرگ: از فراموشی فاجعه‌بار تا مدیریت منابع.


➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @Data➕Science

Читать полностью…

علم داده (Data Science)

📊 گزارش شاخص هوش مصنوعی ایران 2024

💡 این گزارش، وضعیت هوش مصنوعی در ایران را در سال 2024 تحلیل می‌کند و به بررسی دستاوردها، چالش‌ها و فرصت‌های این فناوری در کشور می‌پردازد. گزارش بر اساس مدل خاصی از تحلیل شاخص‌های هوش مصنوعی تهیه شده که شامل ارزیابی وضعیت فعلی، نوآوری‌ها و پیش‌بینی‌ها است.

فصل‌ها:

توسعه دانش
بررسی روندهای رشد و توسعه دانش در زمینه هوش مصنوعی.

انتشار دانش
تحلیل نحوه انتشار دانش و مقالات علمی مرتبط با هوش مصنوعی.

کسب‌وکار و فعالیت‌های کارآفرینانه
ارزیابی وضعیت استارتاپ‌ها و کسب‌وکارهای فعال در حوزه هوش مصنوعی.

جهت‌دهی به سیستم
تحلیل سیاست‌ها و استراتژی‌های حاکم بر سیستم‌های هوش مصنوعی در ایران.

شکل‌گیری بازار
بررسی بازار هوش مصنوعی در ایران و روندهای موجود در این بخش.

تأمین منابع
تحلیل منابع مالی و انسانی مورد نیاز برای پیشرفت و توسعه هوش مصنوعی.

مشروعیت‌بخشی
بررسی پروژه‌ها و اقدامات مربوط به مشروعیت‌سازی و پذیرش هوش مصنوعی در ایران.

نتیجه‌گیری و جمع‌بندی
جمع‌بندی نتایج و تحلیل نهایی وضعیت و آینده هوش مصنوعی در ایران.

Читать полностью…

علم داده (Data Science)

#دعوت_به_همکاری

اگر مفاهیم مدیریت داده آشنایی دارید و در رزومه خود سابقه مدیریت و کنترل پروژه‌های داده‌ای را دارید، یک فرصت همکاری تمام‌وقت در یک شرکت فعال در صنعت تلکام برای شما فراهم است.

لطفاً رزومه خود را برای بررسی و هماهنگی‌های بیشتر ارسال کنید:
@Maghsoudi91

Читать полностью…

علم داده (Data Science)

#دعوت_به_همکاری

اگر مفاهیم مدیریت داده آشنایی دارید و در رزومه خود سابقه مدیریت و کنترل پروژه‌های داده‌ای را دارید، یک فرصت همکاری تمام‌وقت در یک شرکت فعال در صنعت تلکام برای شما فراهم است.

لطفاً رزومه خود را برای بررسی و هماهنگی‌های بیشتر ارسال کنید:
@Maghsoudi91

Читать полностью…

علم داده (Data Science)

📊 چرخه عمر علم داده (Data Science Lifecycle)

شناسایی مسئله (Problem Identification): تعریف مشکل کسب‌وکار یا نیاز که با داده‌ها قابل حل است.
درک کسب‌وکار (Business Understanding): ترجمه اهداف تجاری به سوالات تحلیلی.
جمع‌آوری داده (Data Acquisition ETL): استخراج، تبدیل و بارگذاری داده‌ها از منابع مختلف.
درک داده (Data Understanding - EDA): تحلیل داده‌ها برای شناسایی الگوها و حذف داده‌های نامناسب.
مهندسی ویژگی‌ها (Feature Engineering): تولید و انتخاب ویژگی‌های مهم برای مدل‌سازی بهتر.
ساخت مدل (Model Creation - Training & Validation): آموزش و ارزیابی مدل‌های یادگیری ماشین.
استقرار مدل (Model Deployment): استفاده از مدل در محیط واقعی برای پیش‌بینی‌ها.
پایش مدل (Model Monitoring): نظارت بر عملکرد مدل و شناسایی مشکلات احتمالی.
تحلیل انحراف داده (Data Drift Analysis): بررسی تغییرات در توزیع داده‌های ورودی.
تحلیل انحراف مدل (Model Drift Analysis): تحلیل کاهش عملکرد مدل به دلیل تغییرات محیطی.
داشبورد و گزارش‌دهی (Dashboard, Reports, and Scores): ارائه نتایج مدل در قالب گزارش‌ها و داشبوردها.



@DataPlusScience

Читать полностью…

علم داده (Data Science)

🌹🌷🌸 سالروز ولادت حضرت امیرالمومنین علی علیه السلام و روز پدر مبارک باد. 🌹🌷🌸


@Data➕Science

Читать полностью…

علم داده (Data Science)

مختصری درباره مدل زبانی DeepSeek-V3 که اخیرا از آن رونمایی شده و سروصدای زیادی رو در اکوسیستم LLMها ایجاد کرده!

از صفحه آقای سید محمدعلی جعفری

➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @Data➕Science

Читать полностью…

علم داده (Data Science)

💯منتشر شد
💎هم اکنون بصورت #رایگان در اختیار علاقه مندان قرار دارد.

▶️هندبوک تحلیل کسب و کار، صفر تا صد تحلیل کسب و کار به زبان ساده و فشرده، منتشر و هم اکنون بصورت رایگان در اختیار علاقه مندان قرار گرفته است.

این کتاب در 113 صفحه و در قالب فایل پی دی اف منتشر شده است.

🤩امیدواریم برای شما مفید باشد.

لطفا این کتاب را در اختیار سایر علاقه‌مندان نیز قرار دهید.

📱کانال تلگرام آکادمی تحلیل کسب و‌کار
/channel/baacademyir

Читать полностью…

علم داده (Data Science)

🔴 فراخوان ارسال مقاله به یازدهمین کنفرانس بین‌المللی وب پژوهی تحت حمایت IEEE

✅ نمایه ها:
مقالات انگلیسی: ارسال به پایگاه IEEE Xplore
مقالات فارسی: پایگاه های ISC و SID

❇️ برگزار کننده: دانشگاه علم و فرهنگ- جهاد دانشگاهی

❇️ زمان: ۲۷ و ۲۸ فروردین ۱۴۰۴

📌 مهلت ارسال مقاله: ۱۳ بهمن ۱۴۰۳
 
❇️ محورهای کنفرانس:

🔹یادگیری ماشین، یادگیری عمیق در وب 
🔹وب کاوی، وب معنایی و تحلیل وب
🔹 اینترنت اشیاء   
🔹پردازش تصویر در وب
🔹بازیابی اطلاعات   
🔹شبکه های اجتماعی
🔹 سکوهای ابری، انبوه و توزیع شده 
🔹بلاکچین و رمزارز    
🔹تعامل انسان و رایانه           
🔹کیفیت وب           
🔹سکوها و ایزارهای نرم افزاری وب     
🔹کسب و کار و بازاریابی الکترونیکی     
🔹امنیت وب
🔹تحلیل رفتار و شخصی سازی 
🔹رسانه و ارتباط شناسی وب
🔹وب و جامعه 
🔹مباحث حقوقی و اخلاقی در وب
   
وبگاه کنفرانس iranwebconf.ir

تلگرام
@webresearch

اینستاگرام
@wwwconference

دبیرخانه مجله و کنفرانس بین‌المللی وب پژوهی

Читать полностью…

علم داده (Data Science)

#موقعیت_شغلی

یک شرکت تلکامی برای تکمیل تیم «استراتژی مدیریت داده» خود به دنبال یک همکار تمام‌وقت است.
این فرد باید به مفاهیم مدیریت داده تسلط داشته و توانایی تعریف و کنترل پروژه‌های مرتبط را داشته باشد. آشنایی با مباحث استراتژی نیز الزامی است.

علاقه‌مندان رزومه‌های خود را به آیدی زیر ارسال کنند:
@Maghsoudi91

Читать полностью…

علم داده (Data Science)

📘 یادداشت‌های آمار: راهنمای جامع مباحث آماری

💡 این فایل شامل مفاهیم پایه و پیشرفته آماری است که به صورت ساده و کاربردی توضیح داده شده‌اند. مباحث شامل انواع داده‌ها، آزمون‌های آماری و تکنیک‌های تحلیل داده است که برای دانشجویان و محققین مفید است.


📊 مفاهیم پایه: شامل آمار توصیفی (Descriptive Statistics) و استنباطی (Inferential Statistics).
📌 اندازه‌گیری گرایش مرکزی: میانگین (Mean)، میانه (Median) و مد (Mode).
📏 اندازه‌گیری پراکندگی: واریانس (Variance) و انحراف معیار (Standard Deviation).
🗂 انواع داده‌ها و مقیاس‌ها: داده‌های اسمی (Nominal)، ترتیبی (Ordinal)، فاصله‌ای (Interval) و نسبتی (Ratio).
🧪 آزمون‌های آماری: آزمون Z، آزمون T، آزمون خی دو (Chi-Square)، و تحلیل واریانس (ANOVA).
📈 توزیع‌های احتمالی: توزیع نرمال (Normal Distribution)، دوجمله‌ای (Binomial) و پواسون (Poisson).
🧮 قضیه حد مرکزی (Central Limit Theorem): تحلیل توزیع نمونه‌ها با اندازه‌های بزرگ.
🔗 تحلیل داده‌های پراکنده: کوواریانس (Covariance) و همبستگی (Correlation).


📊👨‍🏫 @DataPlusScience | @Data➕Science

Читать полностью…

علم داده (Data Science)

🎯 پست موقت

ما در تیم راده دنبال یه نفر تو پوزیشن Data Analyst هستیم.

تسلط نسبی به Power BI و TSQL برامون مهمه.
برای آقایون هم امکان امریه وجود داره.

متاسفانه امکان همکاری پروژه‌ای یا ریموت وجود نداره.
محل کار هم حوالی میدان آرژانتین هستش.

لطفا رزومه‌تون رو به این اکانت ارسال کنید.
@SaeidAliakbar19

Читать полностью…

علم داده (Data Science)

📊 تحلیل داده و توسعه داشبورد با PowerBI

هوش تجاری فرآیندی است که طی آن اطلاعاتی ارزشمند و قابل اطمینان از داده‌های روزمرۀ سازمان استخراج می‌شود و در زمان مناسب در قالب داشبوردهای تحلیل داده در اختیار مدیران سازمان و کسب‌وکار گذارده می‌شود تا در تصمیم‌گیری‌ به آن‌ها استناد شود. پاوربی‌آی (PowerBI) مهم‌ترین ابزار توسعه داشبورد و استقرار سامانه‌های هوش تجاری در دنیاست و در حال حاضر مهم‌ترین نیاز بازار کار داده به شمار می‌رود. با یادگیری پاوربی‌آی یک مزیت بزرگ به دست بیاورید و کسب‌وکار خود را متحول کنید.

🎓 مجید پورکاشانی | هم‌بنیان‌گذار، توسعه‌دهنده سامانه‌های هوش تجاری و مهندس داده در شرکت پردازش و تحلیل داده دقیقه، کارشناسی مهندس برق از دانشگاه شریف و کارشناسی ارشد هوش مصنوعی از دانشگاه علم و صنعت

#دوره_آموزشی_آنلاین

💡 یادگیری یک ابزار قدرتمند: تسلط بر مهم‌ترین ابزار هوش تجاری در دنیا بدون پیش‌نیاز ویژه
💡 یادگیری مهم‌ترین نیاز بازار کار داده: پاسخ به مهم‌ترین نیاز بازار کار داده و افزایش شانس ورود به فعالیت حرفه‌ای هوش تجاری
💡 بهبود عملکرد سازمان و کسب‌وکار: توسعه داشبوردهای هوش تجاری و تحلیل داده،بهترین راهکار برای بهینه‌سازی عملکرد کسب‌وکار

📆 چهارشنبه‌ها ۱۸:۰۰ تا ۲۱:۱۵
🗓 از ۱۹ دی تا ۸ اسفند ۱۴۰۳
⏺️ ۸ هفته ۲۴ ساعت
🎞 با دسترسی به ویدئوی جلسات
🏅 گواهی پایان دوره


برای استفاده از تخفیف بیشتر زودتر ثبت‌نام کنید.

💥این تخفیف ویژه اعضا کانال علم داده می‌باشد.

🙂 کد تخفیف ۲۵% برای پرداخت کامل: dtscpwb25
🙂 کد تخفیف ۱۵% برای پرداخت قسطی: dtscpwb15

اعتبار کدهای تخفیف تا ۳۰ آذر ۱۴۰۳

✍️ثبت نام:
👆https://d-learn.ir/pwbi?utm=datascience

🤙 تماس:
📱 t.me/dlearnsup
📞 02188349244
📲 09103209837

@dlearn_ir

Читать полностью…

علم داده (Data Science)

📱 هفته پر ماجرای هوش مصنوعی

در هفته گذشته حدودا 1000 خبر در حوزه هوش مصنوعی اومد که در کانالمون منعکس کردیم. چون احتمالا وقت نمیکنید همه رو مثل ما مرور کنید، مهم‌ترین هاشو گلچین کردیم براتون.


1- عرض اولیه مدل ویدئوسازی OpenAI به نام Sora

2- رونمایی OpenAI از عامل هوش مصنوعی o1 در پاریس

3- معرفی فناوری جدید فاین تیونینگ هوش مصنوعی با RFT از OpenAI

4- طرح جدید ChatGPT Pro Premium با هزینه ۲۰۰ دلاری در ماه معرفی شد

5- نسل جدید هوش مصنوعی Google: Gemini 2.0

6- ابزار جدید گوگل برای انجام تحقیقات با استفاده از AI

7- پیشرفت جدید DeepMind در دنیای سه‌بعدی با Genie 2

8- پروژه جدید Astra و قابلیت‌های پیشرفته گوگل

9- مدل جدید Llama 3.3؛ پیشرفت در مدل‌های زبان بزرگ از Meta

10- معرفی Copilot Vision: تحولی در تعامل انسان و کامپیوتر

11- مدل جدید Aurora در xAI تصاویر فوق‌العاده واقعی تولید می‌کند

12- معرفی ابزار جدید ElevenLabs برای تولید پادکست با هوش مصنوعی

13- ابزار جدید Midjourney برای ساختن جهان‌های چندنفره

14- عرضه ویژگی دوبله خودکار YouTube برای محتواهای آموزشی

15- آینده‌ای بدون مرورگرهای سنتی به لطف هوش مصنوعی مایکروسافت

16- چالش عاشق کردن ربات AI و جایزه‌های بزرگ

Читать полностью…

علم داده (Data Science)

📊 نقشه ذهنی هوش مصنوعی مولد (Generative AI Mindmap)


مفاهیم اصلی: شامل شبکه‌های عصبی، خودرمزگذارها، مدل‌های انتشار، GANs، و مدل‌های زبان بزرگ.
کاربردها: تولید متن، ویدئو، تصویر، موسیقی، کد و تقویت داده‌ها.
تکنیک‌ها: یادگیری تقویتی، انتقال یادگیری، یادگیری چندنمونه‌ای، و مهندسی پرسش.
مدل‌های محبوب: GPT، Claude، DALL·E، BERT، CLIP، Mistral و Gemini.
منابع داده: دیتاست‌های متن (ویکی‌پدیا)، تصویر (COCO)، صوت (LibriSpeech)، ویدئو (YouTube).
ابزارها و چارچوب‌ها: TensorFlow، PyTorch، OpenAI API، Hugging Face، و Google Colab.
چالش‌ها: تعصب داده‌ای، نگرانی‌های اخلاقی، منابع محاسباتی، مقیاس‌پذیری و مصرف انرژی.
روندهای آینده: محتوای شخصی‌سازی‌شده، خلاقیت هوش مصنوعی، همکاری انسان-ماشین، و مدل‌های چندحالتی.
متریک‌های ارزیابی: امتیاز BLEU، ROUGE، Perplexity، و FID برای ارزیابی کیفیت مدل‌ها.


📊👨‍🏫 @DataPlusScience | @Data➕Science

Читать полностью…

علم داده (Data Science)

🏴 شهادت بانوی دو عالم حضرت فاطمه زهرا سلام‌الله علیها را به تمامی شیعیان و محبان آن حضرت تسلیت و تعزیت عرض می‌نماییم.

@DataPlusScience | @Data➕Science

Читать полностью…

علم داده (Data Science)

📊 مفاهیم اساسی هوش مصنوعی مولد (GenAI)

💡 این فایل به بررسی اصطلاحات فنی، عملیاتی و نظارتی مرتبط با هوش مصنوعی مولد (GenAI) می‌پردازد و مفاهیم پیچیده آن را با زبان ساده و قابل فهم توضیح می‌دهد. این سند به‌ویژه برای کسانی که قصد دارند از GenAI در کسب‌وکارها یا پروژه‌های تحقیقاتی خود استفاده کنند، مفید است.

📄 محتوای فایل:

هوش مصنوعی مولد (GenAI): معرفی و کاربردهای این فناوری در تولید متن، تصویر، موسیقی و ویدیو.
مدل‌های زبان بزرگ (LLMs): توضیح نحوه عملکرد مدل‌هایی چون GPT و PaLM در تولید محتوای متنی و تعامل با کاربر.
مهندسی پرامپت (Prompt Engineering): نحوه نوشتن ورودی‌های بهینه برای دستیابی به نتایج مطلوب در سیستم‌های GenAI.
چالش‌ها و مقررات: بررسی مسائل مرتبط با حریم خصوصی داده، ایمنی، شفافیت و حقوق کپی‌رایت در استفاده از هوش مصنوعی.

این فایل راهنمای جامعی برای درک عمیق‌تر هوش مصنوعی مولد و چالش‌های آن است و به شما کمک می‌کند تا درک درستی از استفاده، پیاده‌سازی و مقررات مربوط به این تکنولوژی داشته باشید.

➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @Data➕Science

Читать полностью…

علم داده (Data Science)

📊 ابعاد رایج کیفیت داده (Common Dimensions of Data Quality)

💡 این تصویر که توسط Gartner ارائه شده است، ابعاد اصلی کیفیت داده را نمایش می‌دهد. این ابعاد برای اطمینان از قابل‌اعتماد بودن و کارآمدی داده‌ها در سازمان‌ها حیاتی هستند و شامل موارد زیر می‌شوند:

کامل بودن (Completeness): تمامی اطلاعات مورد نیاز در دسترس است.
کاربردپذیری (Usability): اطلاعات در قالبی مناسب ارائه می‌شوند.
دقت (Precision): اطلاعات به اندازه کافی جزئی و دقیق هستند.
به‌موقع بودن (Timeliness): دسترسی به اطلاعات بدون تأخیر انجام می‌شود.
صحت (Accuracy): اطلاعات واقعیت‌های دنیای واقعی را منعکس می‌کنند.
عدم تکرار (Non-duplication): داده‌ها فاقد تکرار و کپی هستند.
در دسترس بودن (Availability): اطلاعات در زمان نیاز موجود هستند.
اعتبار (Validity): داده‌ها مطابق با قوانین و قواعد تجاری هستند.
سازگاری (Consistency): داده‌ها با تعریف خود همخوانی دارند.


#کیفیت_داده #مدیریت_داده #گارتنر #DataQuality #Gartner #DataManagement #Analytics

➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @Data➕Science

Читать полностью…

علم داده (Data Science)

📊 معماری داده برای مدیریت و تحلیل

💡 این تصویر معماری داده را نمایش می‌دهد که شامل لایه‌های مختلفی از منابع داده، ذخیره‌سازی، تحلیل، امنیت و نمایش است. با این ساختار، سازمان‌ها می‌توانند داده‌های خود را مدیریت، تحلیل و مصورسازی کرده و استراتژی داده‌ای موثرتری ایجاد کنند:

منابع داده (Data Sources): شامل پایگاه داده‌ها، ویدئوها، تصاویر و حسگرها.
لایه ورود داده (Ingestion Layer): انتقال داده به پلتفرم.
لایه ذخیره‌سازی (Hadoop Storage Layer): HDFS و پایگاه‌های داده NoSQL.
لایه مدیریت (Hadoop Platform Management): ابزارهایی مانند Hive و MapReduce.
موتورهای تحلیل (Analytics Engines): تحلیل آماری، متنی، لحظه‌ای و موتور جستجو.
انبار داده (Data Warehouses): ذخیره و پردازش داده‌های تحلیل‌شده.
لایه امنیت (Security Layer): حفاظت از داده‌ها.
لایه نظارت (Monitoring Layer): نظارت بر عملکرد.
لایه نمایش (Visualization Layer): ابزارهای مصورسازی و تحلیل برای کاربران.

➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @Data➕Science

Читать полностью…
Subscribe to a channel