یه مقاله خیلی جذاب این هفته منتشر شده با عنوان thinking LLM
از NotebookLM خواستم به صورت ELI5 خلاصه اش کنه (چون از پریروز میشه به NotebookLM پرامپت هم داد)
و وااااقعا خوب درش اورده
از کلی تشبیه های دنیای واقعی استفاده میکنه و ادبیات ساده و بدون اصطلاحات فنی پیچده ای داره
فایل خود مقاله ام میزارم توی کامنت ها
@aipulse24
از امروز از طریق وبسایت together.ai میتونید به صورت کاملا رایگان به مدل Llama 3.2 Vison نسخه ۱۱ میلیارد پارامتری دسترسی داشته باشید.
همچنین دسترسی به مدل تبدیل متن به تصویر Flux 1 Schnell هم که قبلا معرفیش کردیم، به صورت کاملا رایگان فراهم شده.
علاوه بر همه اینا، فقط با ثبت نام داخل این وبسایت ۲۵ دلار کردیت رایگان دریافت میکنید که میتونید ازش برای مدل های غیر رایگان استفاده کنید.
@aipulse24
توی چند روز اخیر این خبر درمورد دانشجوهای هاروارد که با عینک متا افراد رو توی خیابون شناسایی میکنن خیلی وایرال شده
نکته مهم اینه که خود عینک متا توی این فناوری نقش خاصی نداره بلکه موتور جستجوهای تشخیص چهره پیشرفته ای که اخیرا زیاد شدن کار اصلی رو میکنن
تنها مزیت عینک متا این هست که شما خیلی تابلو دوربین رو جلوی طرف نمیگیرین توی خیابون و ازش عکس بگیرین
صرفا با عینک عکس میگیرین
🚨🚨مهم🚨🚨
چیزی که کسی راجع بهش حرف نزد اینه که همون گروه دانشجویان هاروارد راهنمایی منتشر کردن تا شما بتونید تصویر خودتون رو از این موتورهای جستجو خطرناک حذف کنید!!
برای موتور جستجوهای شناسایی چهره از این راهنماها استفاده کنید:
Pimeyes
Facecheck ID
یک سری هم موتور جستجو People Search Engine هست که خوبه از اونام خودتون رو حذف کنین:
FastPeopleSearch
Checkthem
Instantcheckmate
اینم یه لیست بلند که نیویورک تایمز درست کرده برای تمام موتورجستجوهای انسانی!
@aipulse24
🎶🎶🎶 خبر داااااریم چه خبررررییییی 🎶🎶🎶
کانال یوتوب AI Pulse رو استارت زدم!!☺️☺️
توی این کانال قصد دارم براتون آموزش های هوش مصنوعی بگذارم که ابزارهای مختلف بیشتر و بیشتر برای همه در دسترس باشن
قرار نیست آموزش هام پر از کدنویسی باشه
تصمیم دارم کار کردن با هوش مصنوعی فراتر از فقط چت با Claude و تولید عکس رو برای کسایی که به کدنویسی خفنی تسلط ندارن، اموزش بدم
راه های ساده ای که حتی شاید بشه با این ابزارها به درامد رسید یا جایگزینی برای ابزارهای پولی پیدا کرد
برای شروع توی اولین آموزش نحوه نصب Flowise و ساخت ابزار چت با PDF رو آموزش میدم.
فلووایز یک فریم ورک مبتنی برای Langchain عه که ویژگی های خوب زیادی داره:
🍭 اوپن سورس هست
🍭 نیاز به کد نویسی نداره و با کشیدن و رها کردن اِلمان های آماده میتونین هر ابزاری بخواین برای خودتون بسازین
🍭 نیاز به کامپیوتر قوی نداره و با سخت افزار عادی هم کارتون راه میافته
کافیه فقط ۲ خط توی cmd ویندوز تایپ کنید و باهاش شروع کنید به کار کردن
حتی template های آماده ای داره که میتونین برای مصارف مختلف ازشون استفاده کنید
اول به همراه این اموزش نصبش کنید
و بعدا اینجا برید تا آموزش نحوه ساخت ابزار چت با PDF رو ببینید
انویدیا اخیراً از انتشار یک مدل زبانی بزرگ (LLM) اوپن سورس به نام NVLM 1.0 خبر داده که گفته میشه عملکردی مشابه با مدلهای اختصاصی شرکت های پیشرو مثل OpenAi, Anthropic, Meta و گوگل داره.
مدل شاخص این خونواده که با نام NVLM-D-72B شناخته میشه ۷۲ میلیارد پارامتر داره. انویدیا ادعا میکنه که مدلهای NVLM در وظایف مربوط به زبان و تصویر، به بهترین سطح دست پیدا کردن و با مدلهای اختصاصی و اوپن سورس رقابت میکنن.
یک تمایز کلیدی که وجود داره اینه که انویدیا قصد داره مدلهای NVLM را به صورت کاملاً اوپن سورس عرضه کنه. برخلاف اکثر مدل های اوپن سورس که فقط Weight هارو منتشر میکنن، انویدیا قراره سورس کد مدل هارو هم در دسترس عموم قرار بده.
@aipulse24
اگه عبارت IMG_1018.CR2 رو به عنوان پرامپت به این مدل بدید یه سری تصویر واقع گرایانه براتون تولید میکنه :))
@aipulse24
⚡️⚡️خبر خیلی مهم برای پیشرفت صنعت هوش مصنوعی⚡️⚡️
فرماندار کالیفرنیا لایحه پیشنهادی مرتبط با هوش مصنوعی که بسیااااار سختگیرانه بود و امکان محدود کردن بسیاری از فعالیت های توی این زمینه رو داشت وتو کرد🎶🎶🎶
از اونجایی که سیلیکون ولی توی کالیفرنیاست به احتمال زیاد لابی های سنگینی توسط شرکت های تک بزرگ برای جلوگیری از تصویب این قانون شده
گوین نیوسام توی بخشی از پیام وتو خودش گفته که :
با وجود اینکه نیتی که این لایحه دنبال میکنه خیرخواهانه است ولی این مسئله که ایا هوش مصنوعی داره توی یه محیط با ریسک بالا کار میکنه و ایا تصمیماتی که میگیره با داده های حساس درارتباطه یا نه رو در نظر نمیگیره و استانداردهای بسیار سختگیرانه ای رو برای ساده ترین فعالیت ها پیشنهاد داده. به نظر من این بهترین رویکرد برای حفاظت از عموم مردم نیست
بالاخره ۱۰۰۰ تایی شدیییییم
🌸🌸🌸
ذوق مرگ میباشم:))
مرسی که هستین 😊😊
بریم واسه ۱۰هزارتایی☺️☺️
خدا شاهده کسی بعد این پست لفت بده میرم به عنوان فعالیت مشکوک به تلگرام ریپورتش میکنم🤨🤨😠😠😠😠
علیبابا کلود به تازگی بزرگترین مجموعه مدلهای اوپن سورس خودش رو معرفی کرده که شامل بیش از ۱۰۰ مدل هوش مصنوعی جدید میشه. این مدلها تحت عنوان Qwen 2.5 عرضه شدن و اندازههای مختلفی از ۰.۵ تا ۷۲ میلیارد پارامتر دارن و از ۲۹ زبان پشتیبانی میکنن. این مدلها برای کاربردهای متنوعی مثل بازی سازی و تحقیقات علمی طراحی شدن.
مدلهای جدید قابلیتهای پیشرفتهای دارن، از جمله یه مدل که میتونه فقط با استفاده از متن، ویدیوهای باکیفیت تولید کنه. مدل Qwen2-VL هم توانایی فهم ویدیوهای طولانی و پشتیبانی از سوال و جواب مبتنی بر ویدیو رو داره.
علیبابا کلود همچنین از دیتاسنترهای نسل جدیدش رونمایی کرده که با تکنولوژیهای جدیدی مثل سیستمهای خنککننده و طراحیهای بهینهشده، برای پشتیبانی از نیازهای روزافزون محاسبات هوش مصنوعی طراحی شدن.
@aipulse24
طبق اطلاعیهای که OpenAI به کاربران ارسال کرده، از دوم اکتبر، این شرکت به صورت پیشفرض از ورژن جدید GPT 4o استفاده میکنه.
از ویژگیهای جدید نسخه جدید اینه که ۵۰٪ برای توکن های ورودی و ۳۳٪ برای توکن های خروجی ارزون تره و همچنین از Structured Data پشتیبانی میکنه. این ویژگی باعث میشه کاربران بتونن خروجی رو به صورت ساختار یافتهای مثل Json دریافت کنن که خصوصا برای دولوپرها اهمیت زیادی داره.
البته این ویژگی قبلا هم کم و بیش وجود داشت اما در نسخه جدید پایداری خیلی بهتری داره.
@aipulse24
مدت ها بود سمت خودکار و کاغذ فیزیکی نرفته بودم به دلایل مختلف
اینکه بیشتر منابعم انلاینن
یا اینکه وقت میبره یادداشت برداری
ولی هربار میرم لوازم التحریر فروشی از ذوق میمیرم و حس میکنم وقتی با دفتر و کتاب فیزیکی کار میکنم یکم از حجم استرس های دائمی ایم کم میکنه ارامش میگیرم
منم یه راه حل خلاقانه پیدا کردم☺️😊
یه پرینتر استیکر inkless کوچیک ارزون خریدم و تصمیم دارم برگردم به نوبت برداری کاغدی واسه بعضی کارهام منتهی برای هر لینکی که نوت برداری میکنم یه QR code درست میکنم و میچسبونم کنار اون نوت
اینجوری هم با لوازم التحریر کار میکنم هم منابع اون نوت ها همیشه همراهشونه:))
میدونم که خیلی 😒عه📱📖
@aipulse24
برنامه mythbusters سال ۲۰۰۹ با همکاری انویدیا اینو درست کردن که تفاوت cpu وgpu رو به ملت نشون بدن
توی حالت cpu هر تسک داره به ترتیب یکی بعد از دیگری انجام میشه و توی gpu تسک ها به صورت همزمان قابل انجامن
واسه همین اولی فقط یه لوله داره واسه پرتاب رنگ و دومی این همه لوله داره تا یه نقاشی کامل رو توی ۱ ثانیه انجام بده
یه راه خیلی ساده و جذاب واسه نشون دادن نحوه عملکرد gpu به افراد غیر تکنیکال
@aipulse24
پیشرفت مدل های تبدیل عکس و متن به ویدیو فوق العاده است.
این کلیپ با minimax ساخته شده و یکی از اصلی ترین مشکلات ویدیوهارو تا حدود زیادی حل کرده!
اونم داشتن احساسات هست
اغلب ویدیوها توانایی منتقل کردن احساسات فرد رو قبلا نداشتن که توی این ویدیو خیلی خوب حل شده
البته به نظر شخصی خودم هنوزم یه جاهایی چشم ها تابلوعه
انگار به یه چیز دوری خیره شدن و به تو نگاه نمیکنن ولی به هرحال توی ۱ سال پیشرفت فوق العاده ایه
کار خاصی هم برای رسیدن به این نتایج انجام نشده
صرفا توی پرامپت اسم اون احساس با حالتی که صورت میگیره در حین اون احساس نوشته شده
یعنی اینطوری:
• Joy - Wide eyes, big smile, raised eyebrows, relaxed facial muscles.
• Sadness - Downturned mouth, furrowed brows, teary eyes, drooping eyelids.
• Surprise - Wide eyes, raised eyebrows, open mouth, slight head tilt.
• Anger - Furrowed brows, clenched jaw, flared nostrils, narrowed eyes.
• Fear - Wide eyes, slightly open mouth, tense brows, rigid jaw,
• Disgust - Scrunched nose, raised upper lip, furrowed brows, narrowed eyes.
• Confusion - One eyebrow raised, slightly open mouth, furrowed brows, head tilt.
• Contempt - One side of the mouth curled up, narrowed eyes, head slightly turned.
• Determination - Tightened lips, narrowed eyes, focused eyebrows, set jaw.
• Shock - Frozen expression with wide-open eyes, slackened jaw, raised eyebrows
• Relief - Closed eyes, small smile, relaxed eyebrows, exhale shown with slightly open mouth.
• Embarrassment - Eyes looking downward, blushing cheeks, sheepish smile, raised shoulders.
@aipulse24
از امروز از طریق وبسایت together.ai میتونید به صورت کاملا رایگان به مدل Llama 3.2 Vision نسخه ۱۱ میلیارد پارامتری دسترسی داشته باشید.
همچنین دسترسی به مدل تبدیل متن به تصویر Flux 1 Schnell هم که قبلا معرفیش کردیم، به صورت کاملا رایگان فراهم شده.
علاوه بر همه اینا، فقط با ثبت نام داخل این وبسایت ۲۵ دلار کردیت دریافت میکنید که میتونید ازش برای مدل های غیر رایگان استفاده کنید.
@aipulse24
هوش مصنوعی روی گوشی بدون نیاز به اینترنت!
کافیه اپ PocketPal AI رو نصب کنید و بعد از منو بالا سمت چپ Models رو انتخاب کنین.
از منوی Llama مدل llama-3.2-3b-instruct q4_k رو انتخاب کنید و دانلود کنید (۲.۲ گیگ هست البته 🤕🤕)
وقتی دانلود شد از تب load مدل رو فعال کنید و به منوی اصلی بگردید
چت رو انتخاب کنید و شروع کنید با مدل کار کردن
@aipulse24
از اونجایی که AGI باید سطحی از هوش انسانی داشته باشه دیگه باید کل ویژگی های انسانی رو هم داشته باشه
خلاصه هوش مصنوعی که overthink نکنه به چه درد میخوره اصن؟!🤷♀️🤷♀️
این شما و این artificial overthinking 😭😭
میتونید اینجا ازش استفاده کنید و... اصولا هیچ جوابی هم نگیرید
@aipulse24
سوژه جدید داریم:)))
طرف به چت جی پی تی گفته ASCII art درست کن برام اولش با ساده شروع شده و کم کم هی گفته پیچیده ترش کن
یهو چت جی پی تی این جمجمه رو تحویل داده گفته بیا اینم یه دونه خیلی ظریفش:)))😊😊
بعدم گفته که ققنوسه!
بعد طرف گفته خوب تحلیل کن واسم چیزی که کشیدی رو آیا پیامی توشه؟
گفته بعله پیامش اینه:
DIE HUMAN🤪🤪🤪
بعد یهو خودش خوف کرده:))
گفته عه ببخشید این چرا توش اینو داشت
اصن ولش کن بیا این یکی طرحو ببین
بعد سریع یه طرح برای طرف کشیده😭😭
اینجا میتونید کل مکالمه رو ببینید
حالا نکته دیگه جالب ماجرا اینکه کلا چت جی پی تی اون طرح رو از یه پیج توی گیت هاب عینا کپی کرده بی ادب:)))
این لینک طرح اصلی
خلاصه که داستان هرچی جلورفته بدتر شده:))
@aipulse24
تیم Black Forest Labs از نسخه ۱.۱ مدل تبدیل متن به تصویر Flux رونمایی کرده که ۶ برابر سریعتر از نسخه قبلی خودش یعنی Flux 1 هست و علاوه بر اون تبعیت از پرامپت ارسالی و کیفیت عکس های خروجی هم بهبود چشمگیری پیدا کرده.
همچنین یک بروزرسانی برای مدل Flux 1 هم منتشر کردن که باعث شده این مدل دوبرابر سریعتر از قبل باشه.
مدل جدید به زودی از طریق API برای عموم در دسترس خواهد بود و استفاده از اون ۴ سنت به ازای هر عکس هزینه داره.
این مدل تو بنچمارک هم عملکرد خوبی از خودش نشون داده که میتونید از اینجا ببینید.
@aipulse24
عزیزان کارگردان، فیلمساز، هنرمند و احیانا قهرکرده از خانواده
بشتابید که شرکت Runway پنج میلیون دلار کنار گذاشته برای کمک به افرادی که قصد ساخت فیلم اورجینال دارن
این ۵ میلیون دلار بین ۱۰۰ فیلم تقسیم میشه و درکنارش بهتون کردیت برای استفاده از سرویس خود runway هم داده میشه که مبلغ کردیت ها ۲ میلیون دلاره .
البته گفته شده احتمال اینکه بودجه ۱۰ میلیون دلار بشه هم هست.
شرکت runway صاحب پلتفرم تولید متن به ویدیو هست که توی چند ماه اخیر کیفیت ویدیوهای تولیدیش بسیار پیشرفت کرده
فیلم ها میتونه مستند، فیلم کوتاه و حتی موزیک ویدیو باشه.
نکته خوب اینه که شرکت runway قصد نداره ادعای مالکیت روی این فیلم های تولیدی با این بودجه بکنه و فقط کافیه فرد هردو هفته گزارش بده که پروژه در چه وضعیتیه
عزیزان "هنرمند" میتونید اینجا اپلای کنید
@aipulse24
شرکتهای بزرگ فناوری مثل متا و اسپاتیفای از اتحادیه اروپا خواستن که قوانین مربوط به هوش مصنوعی رو سادهتر کنه.
اونها در نامهای اعلام کردن که مقررات فعلی میتونه نوآوری و رشد اقتصادی اروپا رو محدود کنه. این شرکتها نگران هستن که قوانین سختگیرانه باعث بشه اروپا در رقابت جهانی هوش مصنوعی عقب بمونه.
حتی برخی شرکتها، مثل متا، به دلیل ابهامات قانونی، عرضه محصولات هوش مصنوعی جدیدشون رو به تعویق انداختن.
منبع
@aipulse24
کلیپ ساخته شده توسط هوش مصنوعی به سبک فیلم های فرانسوی یا عنوان bay area که منطقه معروف سیلیکون ولی هست که اغلب شرکت های تکنولوژی بزرگ توش جمع شدن
@aipulse24
کلیپ توی پروفایل سازنده توی تویتر
اقای مت (خبری که روش ریپلای زدم) مشخص شد که کلا خبر سازی کرده و این همه سرو صدا الکی بوده
درنهایت گفت ببخشینم که متاسفانه نتونست مثل میم دانش اموز اصفهانی دل هارو ببره و دیگه الان اینده اش تو این حوزه تموم شده حساب میشه
اماااااا بشنوید از Openai که نزاشت کفن این بدبخت خشک شه با استفاده از همین رویکرد یه مدل داد بیرون که تو عکس خلاصه ای از نکات مهم اش رو زدم
هم من میدونم هم شما عمرا برید بخونید پس نکات مهمش رو میگم:)
✏️کمتر اشتباه میکنه
✏️قبل حرف زدن فکر میکنه (احتمالا یه مامان ایرانی وارد تیم openai شده)
✏️از همین امروز در دسترس همه است
استفاده کردید تو کامنت ها بگید چطوره
@aipulse24
یه راهنمای کامل برای تولید عکس با میدجرنی
درسته که این راهنما با عنوان میدجرنی معرفی شده ولی اغلب نکاتش قابل استفاده توی بقیه مدل های تولید عکس رایگان هم هست
اینجا میتونین بهش دسترسی داشته باشید
@aipulse24
یه اقای ۵۲ ساله توی امریکا با ساخت گروه های موسیقی فیک ، موزیک فیک و ربات واسه استریم فیک این موزیک ها طی ۷ سال ۱۰ میلیون دلار به جیب زده:)))🍿🍿🍿
ایشون سال ۲۰۱۸ به صاحب یه شرکت هوش مصنوعی ایمیل زده و گفته یه عالمه موزیک نیاز داره مدیر عامل هم شروع کرده هفتگی هزاران فایل موسیقی واسه ایشون فرستادن
این فرد هم موسیقی هارو روی امازون، اپل، اسپاتیفای و یوتوب اپلود میکرده و اسم رندم میساخته به عنوان گروه موسیقی که صاحب این موزیک هاست.
بعد یه عالمه ربات ساخته که برن هی این اهنگ هارو گوش بدن تا اون سرویس ها بابت این پخش اهنگ ها بهش پول بدن
و درنهایت ۱۰ میلیون دلار پول گرفته از این سرویس ها:))))
@aipulse24
ایشون به تنهایی با متد جدیدی یک مدل 70 میلیارد پارامتری اوپن سورس درست کردن که تمام مدل های جهان از جمله کلاد سونت و ChatGPT4o رو توی تمام بنچ مارک ها رد میکنه!!!!!!
مدل از تکنولوژی به نام Reflection Tuning استفاده میکنه که باعث میشه قبل از پاسخ اشتباهات رو خودش پیدا کنه و همچنین برنامه ریزی پاسخش رو هم به عنوان یه مرحله جدا انجام میده که باعث میشه استدلال های قوی تری بده!
مدل روی هاگینگ فیس موجود هست و قراره ApIاش هم به زودی موجود بشه
قراره هفته دیگه مدل ۴۰۵ میلیاردیش هم منتشر بشه که گفته میشه عملکردش با فاصله زیاااد از مدل های عمده بهتره
مت شومر (اقای توی عکس)توی پستی که مدل رو معرفی کرده از Glaive.ai تشکر کرده که حتمالا برای ترین از منابع این شرکت استفاده کرده.
نکته جالب توجه اینه که متدی که ایشون برای ترین این مدل استفاده کرده یعنی اصلاح قبل از ارسال پیام (reflection)، مدل sonnet کلاد برای ساخت سیستم پرامپتش استفاده کرده و حالا این احتمال وجود داره که شاید علت عملکرد قوی کلاد همین متد باشه!
فعلا گمانه زنی درموردش زیاده باید صبر کرد دید مدل ۴۰۵ میلیاردی چطور هست
@aipulse24
با گوگل رایگان برای مصاحبه های انگلیسی تمرین کن!!!
این ابزار سال ۲۰۲۲ توسط گوگل معرفی شده ولی حالا قابلیت های هوش مصنوعی باعث شده خیلی جذاب تر بشه
فرایند کار باهاش خیلی راحت و سر راسته☺️
سوالاتی که میپرسه به چند دسته تقسیم میشن:
Background
Situational
برای یک سری مشاغل سوالات تخصصی (technical) هم می پرسه که این لیست مشاغل هست:
✏️Data Analytics
✏️Digital Marketing
✏️IT Support
✏️Project Management
✏️UX Design
✏️Cybersecurity
و یک گزینه General هم داره
جواب ها به صورت همزمان به متن تبدیل میشن و بعد برای هر جواب بهتون انالیز از ابعاد مختلف میده
و بعد میتونین اونایی که خوب نشدن رو با استفاده ازنکاتی که بهتون گفته مجدد ضبط کنین و نامحدود تمرین و تکرار کنین🤝
اینجا میتونین ازش استفاده کنین
@aipulse24