52807
по всем вопросам @haarrp @itchannels_telegram - 🔥 best it channels @ai_machinelearning_big_data -ML @ArtificialIntelligencedl -AI @datascienceiot - ml 📚 @pythonlbooks -📚books
erid: 2W5zFH4RZRb
Градиентный спуск — это фундамент, на котором держится почти всё машинное обучение (machine learning) и глубокое обучение (deep learning). Как только модель не сходится, уходит в осцилляции или застревает — без понимания механики вы остаетесь без инструментов.
12 марта в 20:00 МСК на открытом уроке мы разберём, как модель на самом деле движется по многомерному ландшафту ошибок, почему путь к минимуму редко бывает прямым и какую роль играет шаг обучения.
🚀 Вы поймёте, как выбирать коэффициент скорости обучения (learning rate), чем отличаются классический, стохастический и продвинутые варианты градиентного спуска, как диагностировать сходимость и отличать реальное обучение от блуждания. Все ключевые идеи будут показаны на наглядных примерах на языке программирования Питон (Python) — без абстракций и чёрных ящиков.
➡️ Встречаемся в рамках курса «Machine Learning». Регистрация: https://otus.pw/m7LW/
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
Python: синтаксис тебя не убьёт.
Зато логика - без предупреждения.
⚡️ Как изучать любой GitHub-репозиторий за 5 минут с DeepWiki
Если ты открываешь чужой репозиторий и не понимаешь, с чего начать - не читай файлы вручную. Спроси код.
DeepWiki автоматически строит AI-wiki для любого проекта и позволяет задавать вопросы прямо к исходникам.
Как использовать:
1. Открой нужный репозиторий на GitHub
2. Замени в адресе:
github.com → deepwiki.com
3. Задай вопросы:
- Как устроена архитектура?
- С чего начинается запуск?
- Где реализована основная логика?
- Как работает конкретная функция?
Почему это работает:
- Документация может быть устаревшей
- README часто поверхностный
- Код — единственный источник истины
DeepWiki анализирует структуру проекта и объясняет её простым языком.
Когда особенно полезно:
- Быстрый онбординг в новый проект
- Подготовка к собеседованию
- Разбор open-source
- Понимание сложных библиотек
- Работа AI-агентов с кодом
Главная мысль:
Не читай сотни файлов — задавай вопросы репозиторию.
Пример
GitHub
https://github.com/karpathy/nanochat
// DeepWiki
https://deepwiki.com/karpathy/nanochat
Примеры вопросов:
- How does training work?
- Where is the main entry point?
- How is inference implemented?
- What are the key modules?
🖥 Регулярные выражения для извлечения ссылок из HTML с помощью Python
Сохрани себе: извлечение всех ссылок со страницы с помощью регулярных выражений - это быстро и просто. Вот пример кода, который поможет тебе в этом.
Читать полностью…
import re
import requests
def extract_links(url):
response = requests.get(url)
html_content = response.text
links = re.findall(r'href=["\']?(https?://[^"\'>]+)', html_content)
return links
url = 'https://example.com'
all_links = extract_links(url)
print(all_links)
🎥 Генерация видео с FireRed-OpenStoryline
FireRed-OpenStoryline упрощает создание видео, превращая его в интуитивный процесс общения. Система автоматически генерирует сценарии, подбирает музыку и шрифты, а также позволяет редактировать видео с помощью естественных языковых команд.
🚀 Основные моменты:
- 🌐 Умный поиск и организация медиа
- ✍️ Интеллектуальная генерация сценариев
- 🎵 Рекомендации по музыке и озвучке
- 💬 Редактирование через разговорные команды
- ⚡ Архивирование навыков редактирования
📌 GitHub: https://github.com/FireRedTeam/FireRed-OpenStoryline
@pythonl
🖥 Большинство “парсеров” умирают через 2 дня.
Ты научишься делать те, которые живут в проде.
Это не про BeautifulSoup ради галочки.
Это про системы сбора данных, которые:
• не падают от мелких правок на сайте
• собирают данные в разы быстрее
• обновляют всё сами по расписанию
• обходят ограничения и баны
• выглядят как сервис, а не хаос из файлов
Ты начнёшь видеть сайты не как страницы, а как источники данных, к которым можно подключиться.
В итоге ты сможешь:
• забирать данные для своих проектов
• автоматизировать чужую рутину
• делать инструменты для аналитики
• брать коммерческие заказы на сбор данных
Это навык, который напрямую превращается в деньги.
Не “знаю Python”, а умею добывать данные из интернета профессионально.
🎁 48 часов скидка 50% на Stepik: https://stepik.org/a/269942/
Python-баг, который выглядит безобидно… но ломает логику 👇
fruits = ["apple", "lime", "orange",
"pineapple", "orange"]
for f in fruits:
if f == "orange":
fruits.remove(f)
print(fruits)
fruits = [f for f in fruits if f != "orange"]
💸 AI, который должен зарабатывать… или обанкротится
Исследователи представили ClawWork - систему, где модель работает в условиях реальной экономики.
Стартовые условия:
- баланс: $10
- каждая генерация = реальные расходы на токены
- никакого безлимита
- не заработал - банкрот
Как это работает:
→ AI получает реальные профессиональные задачи
(финансы, медицина, юриспруденция, аналитика)
→ Сам создаёт полноценные результаты с нуля
→ Качество оценивается GPT-5.2 по профессиональным критериям
→ Оплата рассчитывается по формуле:
качество × оценка часов × средняя зарплата (BLS)
→ Каждый API-запрос уменьшает баланс
Результаты:
- $10K заработано за 7 часов
- 0 участия человека
- 220 задач
- 44 профессии
- лучшие модели - $1500+ в час (эквивалент)
Это уже не просто бенчмарк.
Это экономический тест на выживание.
Модель должна принимать решения:
- быстро выполнять задачи ради кэша
- или тратить ресурсы на обучение, чтобы зарабатывать больше позже
Дополнительно:
AI может работать как живой сотрудник в
Telegram, Slack, Discord и WhatsApp —
и каждое сообщение стоит реальных денег.
Проект полностью open-source (MIT).
Следующий этап оценки AI - не тесты и бенчмарки.
А способность приносить деньги в реальной экономике.
https://github.com/HKUDS/ClawWork
📲Max
@pythonl
Открыта регистрация на главную конференцию этой весны по технологиям ИИ и анализу данных — Data Fusion* 2026! 💙
Шестая ежегодная конференция Data Fusion пройдет 8–9 апреля в Москве в инновационном кластере «Ломоносов».
60+ актуальных сессий, докладов, кейсов, дискуссий по теме анализа данных/ DS/ ML. Среди тем – ИИ-агенты, RL, CV, NLP, Open Source, Embodied AI и робототехника, рекомендательные системы, применение ИИ в кибербезопасности, AI+ естественные науки, AgentOps и многое другое! Всю программу ищите на сайте (подавайте ваши доклады, welcome!).
Конференция объединит лидов ML-команд, DS-специалистов, молодых ученых, инженеров, аналитиков и руководителей, принимающих решения о внедрении технологий в бизнес и государственные сервисы.
Среди спикеров конференции: Суржко Денис (ВТБ), Оселедец Иван (AIRI), Райгородский Андрей (МФТИ), Бурнаев Евгений (Сколтех,AIRI), Саркисов Тигран (Х5), Крайнов Александр (Яндекс), Зима Андрей (Ростелеком) и другие эксперты из науки и индустрии.
Все мы любим конференции не только ради знаний, но и, конечно, ради нетворкинга и новых знакомств! Живое общение в кругу коллег, друзей и единомышленников – важная часть Data Fusion!
➡ Не пропустите, регистрируйтесь.
*Data Fusion — Объединение данных
Информация о рекламодателе
Docker и Kubernetes: основы разработки под облачную инфраструктуру
Курс для тех, кто хочет держать свой стэк и знания актуальными и глубоко разбираться, как устроены Docker, Kubernetes, и современная облачная инфраструктура в целом.
🌐 Чему вы научитесь:
🤩 Создавать облачную инфраструктуру «с нуля» управление и конфигурация серверов с Terraform, Ansible, cloud‑init
🤩 Уверенно работать с Docker: Dockerfile, слои, кэш, многоступенчатые сборки, реестры, безопасность, air‑gapped
🤩 Проектировать многоконтейнерные приложения: паттерны Sidecar, Ambassador, Adapter, проверки (liveness/readiness), DaemonSet и поды
🤩 Настраивать сеть и балансировку в Kubernetes
ClusterIP, Services, Ingress, MetalLB, TLS/SNI, сервис‑меши (Istio)
🤩 Организовывать хранение данных: PersistentVolumes / PVC, StorageClasses, резервное копирование. Упаковка в Helm и поддержка через Operator
🥸 Кто мы: R&D-центр Devhands. Автор курса — Николай Ихалайнен, эксперт по СУБД и бекенду (ex-Percona), со-основатель MyDB, энтузиаст открытого ПО.
🗓 Старт курса: 25 февраля, 6 недель обучения.
Изучить программу и записаться можно здесь.
Ждем вас!
Реклама. ИП Рыбак А.А. ИНН 771407709607 Erid: 2Vtzqwp4TvC
⚡️«Ollama для клонирования голоса».
Voicebox позволяет клонировать любой голос по нескольким секундам аудио и запускать всё полностью локально.
• Без подписок.
• Без облака.
• Без передачи голосовых данных на серверы.
В основе - Qwen3-TTS, одна из самых продвинутых моделей синтеза речи от Alibaba.
Как это работает
→ Загружаешь несколько секунд голоса
→ Получаешь почти точную копию
→ Генерируешь речь на любом языке
→ Можешь смешивать несколько голосов в редакторе, как в DAW
Это полноценная студия для работы с голосом:
→ Многодорожечный таймлайн для подкастов и диалогов
→ Запись системного звука + встроенная транскрипция через Whisper
→ Кэширование голосовых промптов для мгновенной генерации
→ Написан на Tauri (Rust) — в 10 раз легче Electron и с нативной производительностью
Полностью open-source.
Лицензия MIT.
GitHub: https://github.com/jamiepine/voicebox
📲Max
@pythonl
🔴 Реальный собес на Python от ТехЛида с опытом работы в Авито и Яндексе в прямом эфире
17 февраля(уже завтра!) в 19:00 по мск приходи на прямой эфир с реальным собеседованием на Middle разработчика.
Почему точно нужно прийти:
📂 Савва Демиденко, ТехЛид с опытом в Яндексе и Авито, будет задавать реальные вопросы и задачи разработчику-добровольцу
📂 Савва будет комментировать каждый ответ респондента, чтобы дать понять чего от вас ожидает собеседующий на интервью
📂 В конце можно будет задать любой вопрос Савве
Это бесплатно. Эфир проходит в рамках менторской программы от ШОРТКАТ для Python-разработчиков, которые хотят повысить свой грейд, ЗП и прокачать скиллы.
Переходи в нашего бота, чтобы получить ссылку на эфир → @shortcut_py_bot
Реклама.
О рекламодателе.
LuxTTS - очень быстрый и компактный TTS с клонированием голоса
Модель со ставкой на скорость + реализм, при этом она остается лёгкой и доступной по ресурсам.
Главные фишки:
- ⚡ До 150× realtime при генерации речи
- 🎙️ Хорошая передача эмоций и естественности
- 🧬 Качественное voice cloning
- 💾 Влезает примерно в 1 ГБ VRAM
- 🖥️ Работает и на CPU - 2–6× realtime
Подходит для:
- голосовых ассистентов
- озвучки приложений
- быстрых прототипов без тяжёлой инфраструктуры
- LuxTTS работает как мульти-язычная TTS-модель, и русский входит в список языков.
Repo: https://github.com/ysharma3501/LuxTTS
Модель: https://huggingface.co/YatharthS/LuxTTS
@pythonl
✉️ Вам приглашение на 35-летний юбилей Python 🐍🎉
Python уже совсем взрослый — и мы отмечаем это уютной конференцией вместе с комьюнити: докладами, интерактивами и праздничной атмосферой.
📍 Встречаемся в пятницу, 20 февраля, в 15:30 — в московском офисе Сбера и онлайн.
В программе:
🔹 Доклады от топовых спикеров — обсудим будущее Python, ИИ в кодинге, мутационное тестирование и многое другое.
🔸 Интерактивные зоны и праздничная атмосфера — кодинг-активности, нетворкинг и, конечно, торт 🎂
Проведём этот день вместе — в офисе или онлайн.
Ждём вас 20 февраля в 15:30!
Регистрация по ссылке. 👈
⚡️ Появился любопытный open-source проект на стыке LLM и кибербезопасности - PentestAgent.
Это система AI-агентов для black-box пентеста, где атака моделируется как оркестрация нескольких специализированных агентов, а не один «умный бот».
Что он делает
В автономном режиме система может прогонять целые пайплайны, имитируя работу red team:
- цепочки разведки (recon)
- анализ уязвимостей
- попытки эксплуатации
- формирование отчётов
Инструменты подключены напрямую
Агенты умеют работать с классическими пентест-утилитами:
- Nmap
- Metasploit
- FFUF
- SQLMap
То есть это не «LLM рассуждает в вакууме», а связка LLM + реальные security-инструменты.
Архитектурные фишки
- RAG для подтягивания контекстных знаний
- tool chaining — агенты передают результаты друг другу
- встроенный браузер и поиск
- dockerized окружение с инструментами
- всё это оркестрируется «командами» LLM-агентов
По сути, это попытка превратить пентест из набора ручных шагов в агентную систему с автоматическим циклом разведка → анализ → действие → отчёт.
github.com/GH05TCREW/pentestagent
📲Max
🌟 Создайте свой пиксельный офис с Star Office UI
Star Office UI — это интерактивная панель для многопользовательского сотрудничества, визуализирующая статус ваших AI помощников в реальном времени. Вы можете видеть, кто чем занят, что было сделано вчера и кто сейчас онлайн.
🚀 Основные моменты:
- Визуализация статусов AI: idle, writing, syncing и др.
- "Вчерашние заметки" для краткого обзора выполненной работы.
- Поддержка приглашения других участников в офис.
- Адаптивный интерфейс для мобильных устройств.
- Гибкие варианты публичного доступа.
📌 GitHub: https://github.com/ringhyacinth/Star-Office-UI
#python
@pythonl
🎥🚀 MOVA: Инновационная генерация видео и аудио
MOVA — это открытая модель, которая синхронно генерирует видео и аудио, устраняя проблемы каскадных пайплайнов. Она обеспечивает высокое качество и точную синхронизацию губ и звуковых эффектов, предлагая пользователям мощный инструмент для создания контента.
🚀Основные моменты:
- Бимодальная генерация: видео и аудио создаются одновременно.
- Высокая точность синхронизации губ и звуковых эффектов.
- Полностью открытый исходный код и доступные веса модели.
- Архитектура с асимметричными двойными башнями для лучшего взаимодействия модальностей.
📌 GitHub: https://github.com/OpenMOSS/MOVA
#python
В Python 3.14 появилось решение, которое помогает избавиться от SQL-инъекций - t-strings 🔒
Проблема
Когда вы используете f-strings для SQL:
query = f"SELECT * FROM users WHERE name = '{user_input}'"
admin'; DROP TABLE users; --
cursor.execute(
"SELECT * FROM users WHERE name = %s",
(user_input,)
)
query = t"SELECT * FROM users WHERE name = {user_input}"
safe = safe_sql(query)
Ваш домен может стоить один рубль
Переносите и продлевайте домены в Selectel и платите за это всего по одному рублю. Бонусом получите бесплатный DNS-хостинг и SSL-сертификаты, а еще возможность развернуть полноценную IT-инфраструктуру проекта в одном окне браузера.
Успейте перенести и продлить домены в Selectel по рублю до 30.06 →
Реклама. АО "Селектел". erid:2W5zFJqGwih
🚀 Погружение в алгоритмы AI без магииno-magic — это коллекция однофайловых, независимых реализаций алгоритмов, которые лежат в основе современных ИИ. Каждый скрипт является самодостаточной программой, обучающей модель с нуля и выполняющей предсказания, без использования сложных библиотек.
🚀 Основные моменты:
- Один файл — один алгоритм, без внешних зависимостей.
- Полное обучение и предсказание в каждом скрипте.
- Читаемый код с обязательными комментариями для понимания.
- Работает на обычном CPU за разумное время.
📌 GitHub: https://github.com/Mathews-Tom/no-magic
#python
✔️ Scrapling v0.4 - веб-скрапинг на Python без боли и переписывания кода
Вышел Scrapling 0.4 - адаптивный Python-фреймворк для парсинга, который работает от одного запроса до полноценных масштабных краулеров.
Главная проблема скрапинга знакома всем:
сайт обновился - селекторы сломались - всё перестало работать.
Scrapling решает это по-умному.
Парсер учится на изменениях страницы и автоматически находит нужные элементы, даже если структура сайта изменилась.
Что внутри:
- обход современных антибот-систем (включая Cloudflare Turnstile) из коробки
- встроенный spider для параллельных многосессионных обходов
- pause/resume для долгих краулов
- автоматическая ротация прокси
- запуск масштабного парсинга в несколько строк Python
Плюс:
- высокая скорость
- статистика в реальном времени
- потоковая обработка данных
Фактически это уровень Scrapy + антибот + адаптивный парсер, но с гораздо более простым стартом.
Инструмент сделан скраперами для скраперов - и подойдёт как для быстрых задач, так и для production-краулеров.
https://github.com/D4Vinci/Scrapling
@pythonl
🚀 REAL-TIME СЕРВЕРЫ БЕЗ ЛИШНЕЙ СЛОЖНОСТИ
Если нужно быстро запускать веб-приложения с высокой производительностью и минимальной задержкой - посмотрите на WebRockets.
WebRockets — это лёгкий и быстрый фреймворк для создания веб-приложений и API с акцентом на скорость, простоту и минимальный overhead. Он подойдёт для проектов, где важны real-time взаимодействие и высокая нагрузка.
Когда полезно:
- Real-time приложения (чаты, уведомления, стриминг данных)
- Высоконагруженные API
- Dashboards и live-аналитика
- Backend для игр или trading-систем
- Любые сервисы, где важна низкая задержка
Что умеет:
- Работа через WebSocket для постоянного соединения
- Минимальная задержка и высокая пропускная способность
- Простая настройка и запуск
- Подходит для real-time архитектур
- Лёгкая интеграция в существующие backend-системы
Главная идея:
Обычный HTTP работает по принципу «запрос-ответ».
WebSocket держит постоянное соединение, позволяя серверу отправлять данные мгновенно без новых запросов — это основа современных real-time сервисов.
# Клонируем репозиторий
git clone https://github.com/ploMP4/webrockets.git
cd webrockets
# Установка зависимостей (если используется Node.js)
npm install
# Запуск сервера
npm start
# Пример простого WebSocket-сервера
const WebSocket = require("ws");
const wss = new WebSocket.Server({ port: 3000 });
wss.on("connection", (ws) => {
console.log("Client connected");
ws.send("Welcome!");
ws.on("message", (message) => {
console.log("Received:", message.toString());
ws.send(`Echo: ${message}`);
});
});
console.log("WebSocket server running on port 3000");
⚡️ LavaSR - улучшение речи в 4000× быстрее реального времени
В open-source выложили LavaSR - модель для улучшения качества речи, которая работает с экстремальной скоростью.
Что умеет модель:
- Скорость — до 4000× realtime
(обрабатывает часы аудио за секунды)
- Универсальность — поддержка любого аудио от 8 kHz до 48 kHz
- Размер — всего ~50 МБ, можно запускать практически везде
- Качество — сопоставимо с более крупными моделями
Где это может пригодиться
- очистка шума в записях
- улучшение качества звонков
- подготовка аудио для ASR / speech-to-text
- подкасты, стримы, voice-боты
- обработка аудио на edge-устройствах
Лёгкая модель + высокая скорость = удобно для реальных production-задач.
Репозиторий: https://github.com/ysharma3501/LavaSR
📲Max
@pythonl
🖥 Python-совет: не проверяйте длину — проверяйте объект
Python умеет проверять «пустоту» объектов напрямую - быстрее и читаемее.
Многие новички пишут так:
if len(items) > 0:
process(items)
Читать полностью…
# Плохо
if len(items) > 0:
process(items)
# Хорошо
if items:
process(items)
# Проверка на пустоту
if not items:
print("Empty")
# Работает для разных типов
data = {}
if data:
print("Has data")
🤖 LingBot-VLA - это прогрессивная модель, объединяющая визуальные, языковые и действия для роботов.
Она обучена на 20,000 часов реальных данных и демонстрирует высокую эффективность и производительность в симуляциях и реальных задачах.
🚀 Основные моменты:
- Обширные данные для предобучения
- Превосходные результаты по сравнению с конкурентами
- Увеличенная скорость обучения на 1.5-2.8x
📌 GitHub: https://github.com/Robbyant/lingbot-vla
#python
⚡️ Вышел FireRed-Image-Edit-1.0 - новая SOTA для редактирования изображений.
И самое интересное - это open-source и готово к локальному запуску.
Что умеет модель:
- Обгоняет закрытые решения
(лучше Nano-Banana и Seedream 4.0 на бенчмарке GEdit)
- Построена с нуля на базе Text-to-Image, а не как надстройка поверх старых моделей
- Рекорд по стилевому переносу — 4.97 / 5.0
- Аккуратно сохраняет оригинальные шрифты и текст
- Поддерживает multi-image редактирование
(например, виртуальная примерка одежды)
- Понимает промпты на английском и китайском
- Лицензия Apache 2.0
- Можно запускать локально
- Подходит для продакшена и коммерческих проектов
▪Модель: https://modelscope.cn/models/FireRedTeam/FireRed-Image-Edit-1.0
▪Демо: https://modelscope.cn/studios/FireRedTeam/FireRed-Image-Edit-1.0
▪GitHub: https://github.com/FireRedTeam/FireRed-Image-Edit
📲Max
@pythonl
ROBOPARTY/roboto_origin - полностью open-source DIY гуманоидный робот 🤖
Это репозиторий с исходниками для открытого человекоподобного робота ROBOTO_ORIGIN от команды RoboParty.
Вся разработка - механика, электроника, софт и обучение - выложена публично, чтобы любой мог собрать и доработать своего робота.
Главная идея
• Полноценный open-source гуманоид для R&D, обучения и экспериментов
• Возможность собрать робота из доступных компонентов по открытым материалам
• В одном месте: код, описания, симуляции и среда для разработки
Что есть в репозитории
• modules/ — модули с кодом и описаниями для железа, ROS2 и управления
• Подпроекты для:
- механики и электроники
- ROS2-драйверов и middleware
- симуляции и обучающих сред
- URDF-моделей и кинематики
Особенности
• Открытая архитектура, можно расширять и модифицировать под свои задачи
• Поддержка ROS2 и симуляции для тестирования и обучения
• Фокус на доступности, проект ориентирован на сборку из массовых компонентов
По сути это полный open-source стек для создания собственного гуманоидного робота - от «железа» до софта и симуляции.
https://github.com/Roboparty/roboto_origin
📲Max
@pythonl
🦀 Crabwalk: Мониторинг AI-агентов в реальном времени
Crabwalk — это инструмент для наблюдения за работой AI-агентов на платформах WhatsApp, Telegram, Discord и Slack. Он визуализирует сессии агентов в виде графа, позволяя отслеживать их действия и состояния в реальном времени.
🚀Основные моменты:
- Живой граф активности с визуализацией сессий
- Поддержка нескольких платформ одновременно
- Реальное время через WebSocket
- Отслеживание действий и параметров инструментов
- Фильтрация сессий по платформе и получателю
📌 GitHub: https://github.com/luccast/crabwalk
📲Max
@pythonl
Это репозиторий с реализацией DensePose через Wi-Fi-сигналы — то есть попытка получать плотные представления (DensePose) тела людей на основе Wi-Fi-данных, а не обычной камеры.
Такая идея может использоваться для анализа движения через радиосигналы в помещении, без видео-камер, с акцентом на приватность.
Если тебе интересны нестандартные подходы к компьютерному зрению, беспроводным сигналам и сенсорике без камер — обязательно посмотри.
🔗 Есть интересный проект: https://github.com/ruvnet/wifi-densepose
@pythonl