21724
هوش مصنوعی و برنامه نویسی پایتون؛ مسیولیت هر پست به عهده ادمینی که فرستاده میباشد. AI Admins: @FaRzAhss @Kingeng @Bellman281 Linux: @salvador_immortal تبلیغات و تبادل: @FaRzAhss
مهم ترین نکاتی که در این ویدیو گفته شده :
از اواسط ماه ژوئیه، قابلیت Copilot به طور مستقیم در SharePoint برای تمام کاربرانی که لایسنس Copilot دارن فعال خواهد شد.
همچنین در Purview به منظور DLP می شه ایمیل های خارجی رو از منابع تحت دسترس Copilot مستثنی کرد.
👉 @ai_python ✍️
https://youtu.be/rBEBKTy7HuU?si=5WOrkpoOfCsY2GK4
خلاصه مختصر و مفیدی از دوره (سرتیفیکیت) AI-901 :
👉 @ai_python ✍️
https://youtu.be/a-yuXz_uV30?si=mdMpk_0DsY6a-9ff
بعد از اینکه برخی از مخاطبان لطف کردن و نظرشون رو درباره پست قبلی گفتن، نکته مهمی توجهم رو جلب کرد.
و اونم اینه که درسته که شرکت هایی مثل DeepL یا Black Forest Labs اروپایی هستند، (البته یکی از دوستان هم گفتند HuggingFace که اون اروپایی نیست و از نظر حقوقی یک شرکت آمریکایی محسوب می شه با این که بنیانگذارانش در اصل آمریکایی نبودند) اما توجه کنید که شرکت های معرفی شده در پست قبلی، شرکت هایی هستند که مدل Frontier دارند.
👉 @ai_python ✍️
تقریبن به جز Mistral هیچ شرکتی در اروپا نداریم که مدل Frontier داشته باشه. مدل های Frontier مدل هایی هستند که تقریبن توی تمام بنچ مارک ها رقابت می کنند و از طرف دیگه سرمایه گذاران بسیاری هم دارند. مشخصه اصلی این شرکت ها اینه که برای AGI رقابت می کنند.
با این اوصاف این تفاوت بین آمریکا و اروپا از این نظر بسیار شدید دیده می شه.
حالا بگذریم که خود میسترال هم از نظر ماهیتی تقاوت بسیاری با شرکت هایی که به عرضه مدل های Frontier مشهور هستند داره و بیش تر مشتریانش Enterprise هستند.
اینترنت تنها چیزی است که به معنای واقعی کلمه تولید ناخالص داخلی کل کشور را افزایش میدهد.
هر کشوری که با استارلینک قرارداد امضا کند، یک زیرساخت اینترنتی موازی دریافت میکند.
هر کشوری که تأخیر کند، بیشتر عقب میماند.
🖥 @elonfact 🙄
The internet is the one single thing that literally lifts an entire country's GDP
Every country that signs with Starlink gets a parallel internet infrastructure
Every country that delays gets left further behind
تغییرات در نسخه تازه Claude Code
👉 @ai_python ✍️
X
در حال حاضر سه راه اصلی برای ایجاد محدودیت خواندن داده ها برای Agent های هوش مصنوعی در SharePoint وجود داره.
👉 @ai_python ✍️
نکته مهم درباره راه سوم اینه که نیاز به لایسنس اضافه داره.
جزئیات آسیب پذیری کشف شده در Ollama :
👉 @ai_python ✍️
Ollama Out-of-Bounds Read Vulnerability Allows Remote Process Memory Leak
معرفی بنچمارک جدید ProgramBench : سخترین آزمون مهندسی نرم افزار برای LLMها
بنچمارک ProgramBench یه بنچمارک خیلی جدی و متفاوت برای ارزیابی توانایی LLMها در ساخت نرمافزار از صفره. ایدهی اصلیش اینه که ببینه آیا مدلهای زبانی واقعاً میتونن فقط با داشتن یک executable و documentation، دوباره کل یک برنامه رو بازسازی کنن یا نه.
توی هر تسک، Agent فقط به فایل اجرایی برنامه و مستنداتش دسترسی داره؛ نه Source Code رو میبینه، نه اجازهی decompile کردن داره و نه حتی اینترنت در اختیارشه. یعنی مدل باید دقیقاً مثل یه مهندس نرمافزار واقعی، رفتار برنامه رو بررسی کنه، Architecture طراحی کنه، Language انتخاب کنه، کل Source Code رو بنویسه و حتی Build Script هم بسازه.
این بنچمارک حدود ۲۰۰ تسک مختلف داره؛ از ابزارهای سبک command-line مثل jq و ripgrep گرفته تا پروژههای سنگین و پیچیدهای مثل PHP، FFmpeg و SQLite.
نکتهی مهم اینه که ProgramBench هیچ ساختار آمادهای به مدل نمیده. خبری از method signature، class skeleton یا حتی توضیح دربارهی ساختار فایلها نیست. Agent خودش باید تصمیم بگیره برنامه چطور modular بشه، چه abstractionهایی تعریف بشه و interfaceها چه شکلی باشن. همین باعث میشه این بنچمارک بیشتر از اینکه صرفاً coding رو بسنجه، توانایی واقعی software design و system architecture رو اندازهگیری کنه.
بعد از اینکه Agent برنامه رو تحویل میده، یه test suite خیلی بزرگ رفتار نسخهی ساختهشده رو با برنامهی اصلی مقایسه میکنه. این تستها با agent-driven fuzzing تولید شدن و در مجموع بیشتر از 248 هزار behavioral test روی ۲۰۰ تسک اجرا میشه. فقط وقتی همهی تستها پاس بشن، اون تسک «حلشده» حساب میشه.
یکی از جذابترین بخشهای ProgramBench اینه که عمداً جلوی shortcutها و cheating گرفته شده. Agentها داخل sandbox اجرا میشن، اینترنت ندارن و حتی دسترسی read به binary هم ندارن؛ یعنی ابزارهایی مثل decompiler، disassembler یا objdump عملاً کار نمیکنن. هدف اینه که benchmark واقعاً توانایی “building from scratch” رو اندازه بگیره، نه سرهم کردن کدهای decompiled.
امتیازها فعلاً خیلی پایینن، ولی این خودش نشون میده مسئله چقدر سخت و واقعی طراحی شده. با اینکه مدلها روی خیلی از تسکها partial progress دارن، ولی هنوز ساخت کامل و بدون نقص نرمافزارهای بزرگ برای AI یه چالش جدیه.
در کل، ProgramBench الان یکی از جدیترین بنچمارکها برای سنجش توانایی واقعی AI Agentها در Software Engineering محسوب میشه؛ جایی که فقط code generation مهم نیست، بلکه planning، architecture، debugging و understanding رفتار سیستم هم نقش اصلی رو دارن.
🔗 لینک سایت ProgramBench
👑 توضیحات در مورد دوره منتورینگ
🏆 نحوه ثبتنام در دوره منتورینگ
🤝 تجارب موفق قبلی بچهها از منتورینگ
@reza_jafari_ai
گوگل کروم هم قابلیت Skills اضافه کرده
👉 @ai_python ✍️
X
این دوتا ربات با کمک هم اتاق رو مرتب می کنن.
شرکت Figure
👉 @ai_python ✍️
لینک توییت : https://x.com/Figure_robot/status/2052770982214172892?s=20
قدرت دیپ فیک هر روز خطرناک تر از قبل شده و این لزوم آگاهی بخشی، به خصوص به کودکان رو چند برابر می کنه.
👉 @ai_python ✍️
منبع ویدیو :
https://x.com/Patrick_Proemer/status/2050212718368424214
مدل Gemini Embedding 2 برای استفاده عرضه شد. این مدل از امبدینگ متن، تصویر، ویدیو و صدا، پشتیبانی می کند.
👉 @ai_python ✍️
OC3 2026 | The Weakest Link in AI: Hardening MCP Servers with CC with Pawan Khandavilli
👉 @ai_python ✍️
https://youtu.be/Ostt7zjVDb4?si=rccrKz-XxLQDqavU
Does Microsoft AI Train Models on my Data and Interactions?
👉 @ai_python 🦁 ☀️
https://youtu.be/LKA9U9T7_t0?si=a0yPZv3ZjivU5eER
رباتی که پت سیتری هم بلده 💓
👉 @ai_python 🦁 ☀️
For an industrial robot built for the rigors of factories and power plants, tidying up a living room may seem like a light day at the office for Spot. Yet, this demonstration represents the promise of AI models in robotics. In this case, @GoogleDeepMind's visual-language model (VLM) Gemini Robotics-ER 1.5 was empowering Spot with embodied reasoning.
Go behind the scenes and watch the full demo in our blog: https://bosdyn.co/483K9JM
📎 Boston Dynamics (@ BostonDynamics) (https://x.com/BostonDynamics/status/2044069050347561172)
خب می بینم که ایلان ماسک به جای این که فوکوس بذاره روی برنامه نویسی خالص، می خواد کمی هم روی DevOps و کنترل زیرساخت، فوکوس کنه که بلکه Grok Build بتونه سری میون سرها دربیاره ...
🖥 @elonfact 🙄
نظر شما چیه؟
وقتی از ربات اطلس می خوای که برات یه نوشیدنی بیاره :
👉 @ai_python ✍️
Y
واقعن چرا؟ دلیلش دو تا مورد می تونه باشه به نظر من :
👉 @ai_python ✍️
1 - بوروکراسی شدید در اروپا
2 - احزاب سیاسی ای که کوکورانه بر ضد تمام انواع سرمایه داری هستند
ایلان ماسک گفته که فقط الگوریتم X بین شبکه های اجتماعی منتشر می شه و همه می تونن ببینن.
🖥 @elonfact 🙄
این درحالیه که بقیه مخفیانه الگوریتم هارو دستکاری می کنند.
برخی معتقد هستند که این از نظر فنی دقیقن درست نیست. چون برای مثال وزن های مدل Ranking در رپوی گیت هاب منتشر نشده. و ایراداتی از این قبیل. که البته من خودم چک نکردم و اطلاع ندارم.
اما در هر صورت ایلان ماسک امروز لینک گیت هاب جدید ترین الگوریتم رو به اشتراک گذاشت :
Elon Musk auf X: „The latest 𝕏 algorithm has been published to GitHub https://t.co/ZCOm51uxmh“ / X
قبلن در چانال به این موضوع اشاره کرده بودیم که اجنت های هوش مصنوعی به قدری در اکوسیستم Microsoft اینتگریت شدن که حتی در محصولی مثل Entra ، همون دسترسی هایی که به کاربران معمولی می دیم برای اجنت های خودکار هوش مصنوعی هم وجود داره و قابل تعریف هستند.
👉 @ai_python ✍️
حالا سوال اینجاست که دیتاهای ما چگونه باشند تا اجنت ها، موثر تر بتوانند آن ها را بخوانند و نتایج قابل اتکا تری به ما ارائه کنند؟ برای مثل در SharePoint ساختار مناسب برای داده ها چگونه است؟
این پست وبلاگ مایکروسافت درباره همین موضوع است :
Unlocking knowledge through intelligence: Lessons learned using SharePoint agents at Microsoft - Inside Track Blog
متدهای رایج تغییر رفتار مدل های زبانی :
👉 @ai_python ✍️
How to change model behavior! Context engineering, fine-tuning and more
https://youtu.be/oqbKWwUhh4Y?si=qr81Br44pflBK-i4
آقای Corey Lynch در این باره خاطر نشان کردن که :
To be clear, there's no explicit messaging between these robots, they coordinate their actions fully visually, e.g. head nods.
ادیت و تدوین ویدیو با استفاده از Claude AI نسخه دسکتاپ به راحتی آب خوردن ...
👉 @ai_python ✍️
منبع ویدیو برای دیدن محتوای بیش تر :
https://x.com/LouiseDSadeleer/status/2051652715617378655
لینک Skill معرفی شده در این ویدیو در گیت هاب :
https://github.com/louisedesadeleer/clipify
به نظر می رسه که انتروپیک اداپتری به نام Introspection Adapters معرفی کرده که بهمون کمک می کنه مثل یک اسکن مغزی متوجه بشیم، مدل دقیقن از درون داره چیکار می کنه و چطور تصمیم می گیره
👉 @ai_python ✍️
لینک توییت :
https://x.com/bigsuey/status/2050002421259104281
در حالی که مدت زیادی هست که هواپیماها با اینترنت استارلینک به پهنای باند بالا متصل هستند، حکومت امام زمان از ترس مردم (الناس) کشور، اینترنت را برای مدت 54 روز است که قطع کرده است.
🖥 @elonfact 🙄
قابلیت های هوش مصنوعی Azure PostgreSQL و نحوه استفاده آسان از آن ها :
👉 @ai_python ✍️
https://youtu.be/daDtYv94bN8?si=TVZM2vW-3Q1Xd0VC
نحوه استفاده از Agent Skills ها در Visual Studio Code جهت افزایش کارایی
👉 @ai_python ✍️
https://youtu.be/fabAI1OKKww?si=Wk_hbLjMDG1NVbXx
با ویژگی btw که البته مخفف همون By the way هست، خیلی راحت می تونید وقتی که Claude Code داره کارش رو انجام می ده یه دونه /btw بذارید و ازش سوالات دیگه بپرسید :
👉 @ai_python 🦁 ☀️
https://x.com/trq212/status/2031506296697131352