6202
Топ-10 интеграторов и разработчиков ИИ России. Рассказываем о реальных проектах с ИИ, ML, DS, CV, LLM, RAG. Без новостей о новом ChatGPT и ответов на вопрос «Заменят ли нейросети человека». Наш сайт: https://r77.ai Приемная: @savinvlad
AI-ассистент для разработчиков — кейс для "АльфаБанк".
Разбираем:
— pipeline RAG (LLM + vector DB + retrieval)
— где теряются релевантные документы
— почему top-k не спасает
— как embeddings влияют на поиск
— что даёт перефраз запроса
— кейсы, где chunking делает только хуже
Плюс:
— реальный фейл: система не отвечает на очевидный вопрос
— пошаговый разбор, где именно всё ломается
Для тех, кто уже делал RAG и понял, что "что-то не работает", ну или будет делать)
https://youtu.be/LnNkMMb9jT8
https://vkvideo.ru/video-228941334_456239067
Че кто был, как вам, что запомнилось?)
Читать полностью…
Выпускник МФТИ собеседует студента "Центрального Университета" на ML-инженера, такого вы не видели...😵
Сходили в "Центральный университет" для публичного собеседования студента. Спасибо "ЦУ" и Кариму за смелость и экспертность — очень радостно видеть таких умных молодых ребят. Вот его резюмешка кстати.
https://youtu.be/cK72w0P2W-E
https://vkvideo.ru/video-228941334_456239066
RPA vs ИИ-агенты: как выбрать архитектуру автоматизации под задачу.
Обещали по нашему вебинару с Альфой (/channel/r77_ai/320) про RPA и агентов шпаргалку:
Где лучше использовать роботов, а где — ИИ. Разобрали ключевые отличия, примеры и критерии, чтобы быстрее принять решение по автоматизации:
https://docs.google.com/presentation/d/1vDtvUffRsqEaQlI6yCrX7DdlcWgE7wjfdME4g6r3_BQ/edit?usp=sharing
Подпишитесь еще на авторов, там полезный корпоративный контент про ИИ:
http://t.me/nokiddingpartners
/channel/baldvanya
AI-ассистент для разработчиков Альфы — вебинар!
Всем привет, давайте 2 апреля разберем, как делали ассистента (справа внизу) https://developers.alfabank.ru/ и с технической и с бизнесовой стороны.
Что покажем:
• Как устроен RAG-пайплайн (BM25 + эмбеддинги + YaGPT)
• Guardrails: как не дать боту «галлюцинировать»
• Live-демо: токены, вебхуки, ошибки, кейсы из реальной документации
• Архитектуру (FastAPI, Docker, RAG)
• Гибридный поиск и перефразирование запросов
• Разделение индексов (FAQ vs документация)
• LLM-as-a-Judge и оценку качества
• Ограничения MVP и roadmap (rerank, adaptive RAG, self-hosted LLM)
2 апреля, четверг, в 16-00 у нас на канале @r77_ai
Добавляйте в календарь https://calendar.app.google/VkLVvwqUTBuyDvEbA
А тут компютер вижн на Целлюлозно-бумажном производстве!
Ставили камеры напротив грузовиков, чтобы понять сколько бревен загружены. Разобрались, что такое баланс, пачка, штабель, раскатка, коэффициент полнодревесности.
Вот что получили:
100% точность определения сорта древесины
99%+ точность разделения на пачки
98%+ определение КПД vs. оператор
90%+ определение КПД vs. раскатка
Кейс
А как думаете почему нельзя было просто взвесить?)
ТЗ для AI
Ребят, у нас много новых подписчиков — повыкладываем полезные посты, которые вы возможно не видели
Сделали простую и понятную таблицу, по которой можно быстро собрать внятное техническое задание на AI.
Подходит и тем, кто только начинает, и тем, кто внедряет серьёзные корпоративные решения.
Вы конечно можете просто обратиться к нам, чтобы мы сделали ТЗ, но для своих нужд будет очень полезно)
Зачем нужен:
— Понять, как пишется ТЗ и не тратить время на его придумывание и разработку.
— Чтобы зафиксировать задачи, метрики, ограничения.
— Чтобы не забыть про данные, пользователей, интеграции.
— Чтобы быстрее согласовать проект с подрядчиком или внутри команды.
Что внутри:
— Все ключевые разделы: от целей и сценариев до архитектуры, данных и рисков.
— Примеры формулировок — чтобы проще было писать.
— Подходит для всего: от автоматизации одного процесса до больших AI-систем в компании.
Пишите что еще бы добавили)
https://docs.google.com/spreadsheets/d/1fF-lVtNaULAfSQI7tqPUnxjYmLAnOJ2rGoEDX4thNrQ/edit?usp=sharing
Вебинар "AI-ассистент для портала Alfa API".
Давайте расскажем в понедельник в 16:00 про то, как разрабатывали AI-ассистент, немного про бизнес-показатели и много про техничку:
— RAG-архитектуру с гибридным поиском (BM25 + эмбеддинги) и почему она сработала лучше альтернатив.
— почему выбрали стек Яндекса (YaGPT) и какие ограничения это дало.
— как перефразирование запросов и раздельные индексы (FAQ / доки) влияют на качество.
— какие подходы пробовали и выкинули (HyDE, чанкинг, дообучение).
— как устроены guardrails, чтобы ассистент не галлюцинировал.
В понедельник 2 марта в 16:00 у нас на канале @r77_ai
Добавляйте в календарь: https://calendar.app.google/ok6VFfRv34DqY11A7
Ребят, сегодня дедлайнимся по хакатону /channel/r77_ai/316 — пишите, если интересно поучастовать в роли постановщиков задач — @savinvlad , участников попозже наберем)
Читать полностью…
Ребят, спасибо – мы собрали 171 буст!
вот напоминаю, откуда это /channel/r77_ai/312
Это прямо в раз 10 больше, чем нам надо было – очень приятна такая поддержка – она мотивирует нас продолжать делать контент)
Большинство поддержавших решили остаться инкогнито (напишите, если что я добавлю вас в пост @savinvlad), а вот герои, которых не будем скрывать:
Ребята запускают мобильные приложения для ecom за месяц. В канале рассказывают про нюансы мобильного ритейла — /channel/cartiomobile
__
Мы (Антон Горохов и Гена Фомин) сейчас активно занимаемся голосовыми агентами для колл-центров небольших сетей вет-клиник. Сайт наш fongstudio.ru, там про другое но что-то понять о нас можно! Так что если у вас есть вет-клиника - обращайтесь! @genfom
__
Борис Крюк — CTO Strevio, руководитель первого мульти-агентного ИИ-проекта Engentica для правительства Гонконга, тимлид проектов для компаний из списка Fortune 500. Автор более 10 научных публикаций уровня Q1/Q2/Core A/Core B и создатель фреймворков Deep Workflow Orchestrator, Gradient Focal Transformer, ELENA, MorphBoost, POSEIDON. Студент Гонконгского университета науки и технологий (HKUST), спикер первого научного потока AI Journey. — https://kriukboris.com/
__
@denisova_ludmila Денисова Людмила, создаю бизнес игру про внедрение ИИ
__
Катрин, дизайнер из Вышки 🎓 Делаю сайты, геткурсы, презы для онлайн-школ и экспертов EdTech — /channel/kateti_katrin001
__
О презентациях как инструменте коммуникации — /channel/effectiveprez
__
@boringmarketer — канал основателя рекламного агентства про B2B маркетинг, управление и вайбкодинг от неразработчика)
__
Крутые штатные QA/AQA, DevOps, Vue, Node для ваших проектов на аутстафф по хорошим ценам - пиши @dmingazov — iqdev.digital
__
нерегулярно веду канал про инструменты лидгена для b2b, пишу о том как я разошелся с партнерами и в одного взращиваю агентство по лидгену для b2bшников — @zagitov_yaris
__
НКБТех - компания физтехов, занимается разработкой систем с компьютерным зрением. Активно развивает Edge AI направление для автономных систем. Для связи писать СЕО - @alex_physic
__
@cloudstrategist – Белорусский облачный айтишник, который укрощает железо и не даёт ему объедаться деньгами. 😁
__
🙂 funtech - для продактов и маркетологов про продуктовую геймификацию, метрики, эффективные механики и тренды.
И, кстати, собрали самую большую библиотеку проектов с геймификацией в России
__
Макс накидывает нестандартные мыслишки о жизни и иногда об айтишке. Без кружочков, спама и нейропостов
Ребят, спасибо!
Unlearning в рекомендательных системах — выложили запись вебинара!
К нам приходил Никита Зелинский хард спец с хард каналом /channel/datarascals директор по машинного обучения и исследования данных в MTS Web Services
обсудили:
• постановку задачи unlearning и реальные кейсы (GDPR, DMCA, bot traffic, data poisoning)
• почему удаление данных из логов не означает, что модель «забыла» пользователя
• влияние коллаборативных связей и seq-паттернов в рекомендациях
• как проверяют unlearning через Membership Inference Attack
• почему полный retrain плохо работает в multi-stage recsys
• основные подходы: subset retraining, embedding perturbation, shard-архитектуры и существующие benchmark’и
https://vkvideo.ru/video-228941334_456239064
https://youtu.be/5NThiIhSVnk
Рома Доронин — Наши ML инженеры все ещё конкуренты на мировом AI-рынке? И про мед стартапы.
Смотрите новый подкаст с крутейшим Ромой Дорониным, вот его регалии:
Founder EORA.ru (2016)
co-founder&creator AIorNot.com (2024)
co-founder Bioptic.io - Agentic AI для поиска новых лекарств и ускорения biotech индустрии
Ну и любимый нами канал про жесткий AI и ML — @romaeora
Обсудили бизнес и стартапы AI в медицине:
— Наши ML инженеры все ещё конкуренты на мировом AI-рынке?
— Почему детекция AI-контента (deepfake, синтетические изображения, клоны голосов) — это новая «гонка вооружений»
— Можно ли обогнать Big Tech за счёт скорости, а не ресурсов
— Как из поиска похожих картинок прийти к поиску похожих молекул
— Почему разработка лекарства занимает 8 лет — и как ИИ может это радикально ускорить
— Что происходит с клиническими испытаниями и где главный bottleneck
— Насколько наши ML-инженеры по-прежнему конкурентоспособны на мировом рынке
— И что вообще сегодня значит строить AI-компанию вне Big Tech
https://youtu.be/fwhLw5-ByNo
https://vkvideo.ru/video-228941334_456239063
Дисквалифицировали из-за лицензии Ultralytics
Всем привет, на связи Руслан из R77 AI @dantetemplar.
В ноябре участвовал в Студенческом Хакатоне по компьютерному зрению от Роснефти. Формат - онлайн, 48 часов, сотни участников по России. Я занял 4ое место в лидерборде, но призовых не получил.
Задача и датасет были шикарными, ощущались как лаба по CV. По картам месторождений нужно было автоматически выделять контуры участков с разными схемами размещения скважин; Если честно я сам вообще не понял, как это размечать (попробуйте сами, картинки прилагаю к посту). То самое чувство, когда решил задачу ИИ, не понимая её сам. Отмечу отдельно репрезентабельное отношение между трейн-тестом: в трейне были изображения 640х640, на тесте 3000х3000, что усложняет инференс стадию, однако данные реально были соотносимыми, так что алгоритм в итоге дал 0.973 MAp Score.
Я собрал решение на YOLO-стеке и улучшил инференс «нарезкой» больших карт на куски - Sliced Aided Hyper Inference, но своими руками. Можно прогнать без нарезки, но на 3000×3000 будут результаты не очень, со специфическими "квадрантами" на маске сегментации.
А теперь поучительная история: меня дисквалифицировали из-за лицензии Ultralytics — она не подходит под свободное использование в коммерческих продуктах. Плюсом к этому качество кода Ultralytics и их политика это просто ужас. Всем советую не использовать ultralytics несмотря на его относительное удобство. Вместо этого можете использовать MIT библиотеку MultimediaTechLab/YOLO, возможно когда-нибудь я и сам сделаю свой YOLO-сборник, кто знает...
Кстати, я часто участвую в хакатонах с командой @one_zero_eight, может найдёте что-нибудь интересное.
👁 RPA, масштабирование через скрипты, масштабирование персонализации с Альфой через 5 минут
Подключайтесь пока, а мы стартанем в 16-00! Без смс, vpn и регистрации — https://www.twitch.tv/r77_ai
Задавайте вопросы под этим постом и на твиче)
👁"Unlearning в рекомендашках" вебинар. Присоединяйтесь уже сейчас через 5 минут стартанем
Без смс, vpn и регистрации — https://www.twitch.tv/r77_ai
че с людьми ахаххах
собрали 10к на ролике-собесе в ЦУ LLM-инженера (гляньте людям очень заходит) и вот такие комменты еще
весна?
Конкурс по проектам ИИ на 5 млн)
Ребят, наши друзья и партнеры портал Qubu (в честь запуска) и премия "Гравитация" запускают конкурс по моделям и ИИ-проектам. Вы можете загрузить свой проект на сайт и выиграть до 1,5 млн рублей за первое место, например.
Также ищем большие компании, которые готовы дать задачки по ИИ на хакатон, чтобы ИИ-интеграторы решили ваши задачи.
Участие и для разработчиков и для заказчиков бесплатно.
Вот тут подробнее:
https://qubu.ai/landing
Залейтайте очень крутую тему ребята делают, можно и приз выиграть и прорекламиться хорошо)
👁AI-ассистент для разработчиков Альфы — вебинар через 5 минут!
Пока заходите без смс и регистрации https://live.vkvideo.ru/r77_ai
Что покажем:
• Как устроен RAG-пайплайн (BM25 + эмбеддинги + YaGPT)
• Guardrails: как не дать боту «галлюцинировать»
• Live-демо: токены, вебхуки, ошибки, кейсы из реальной документации
• Архитектуру (FastAPI, Docker, RAG)
• Гибридный поиск и перефразирование запросов
• Разделение индексов (FAQ vs документация)
• LLM-as-a-Judge и оценку качества
• Ограничения MVP и roadmap (rerank, adaptive RAG, self-hosted LLM)
Бывает вот просыпаешься и ты в Forbes...
А тут как раз новость, как мы стали первыми, кто получил грант от Яндекса на свой продукт:
https://www.forbes.ru/tekhnologii/557743-yandex-b2b-tech-vydelit-biznesu-500-mln-rublej-na-razrabotku-i-vnedrenie-ii-agentov
Как понять, что свинюшка готова к любви? Определяем через ML
Наш самый известный, интересный и любимый кейс. Для него мы даже отрисовали иллюстрации, чтобы эта была история любви...
О проекте:
Свинки, как и люди, не всегда беременеют с первого раза. Нам надо было найти лучший момент для их осеменения, чтобы знать, какая из них точно даст потомство.
Для этого мы пускали хряка по коридору и смотрели реакцию свиноматок, а потом по камерам определяли поведение: активна она или нет, как близко подходит к хряку, трется ли задней частью об ограждение, навостряет ли ушки.
Метрики было две. Первая — метрика обнаружения, которая показывала, насколько точно мы определяем свинок в их загоне. Доля правильно найденных свиней должна быть 0,95+. Вторая метрика — точность определения поз свиней, требование к ней должно быть 0,90+.
Вот тут подробнее. А нас до сих пор чаще всего узнают по этому кейсу и всегда с улыбкой))
А вот наш самый сложный кейс про оптимизацию ферросплавов.
Пришлось самим становиться металлургами, потому что без окунания в сферу чисто математикой ничего не сделать.
Нам угрожали, что если система неправильно нарекомендует, то они отправят сотни тонн бракованной стали к нам в офис в Москву – там вообще все бруталити)
https://r77.ai/cases/tpost/i5p3ca7fd1-rekomendatelnaya-sistema-dlya-zavoda-po
Агенты не работают — и это нормально
Разобрали с Иваном Александровым и у руководителя группы продуктов Ксенией Рязанцевой как делать, чтобы работали)
Что внутри:
— почему агентные системы почти не доезжают до продакшна
— где LLM дают реальную пользу, а где просто увеличивают косты
— как выглядит рабочая связка: RPA + LLM workflow
— почему при масштабировании всё уходит в скрипты и классический ML
— и как считать эффективность не «на человека», а на единицу контента
https://vkvideo.ru/video-228941334_456239065
https://youtu.be/RDbS5wSe2xo
Сегодня у нас в гостях #Типичный_айтишник Ярослав Шмулев — фаундер AI-консалтинга и человек, который внедрял ML в сортировку алмазов, на свинофермы и в металлургию.
Кто ты и чем занимаешься?
Меня зовут Ярослав Шмулев. Я выпускник МФТИ. Занимаюсь машинным обучением и AI с 2017 года. В 2022 открыл свою компанию R77.ai (ReML). Делаем заказную ML-разработку, строим AI-консалтинг и внедряем ML в реальный бизнес.
Как ты начал заниматься тем, что делаешь сейчас?
Я вообще выбирал кафедру, чтобы не программировать 😅 В школе прогал круто, а на первом курсе так «повезло» с семинаристом: пока другие группы писали реально клевые штуки, мы прогали только машину Тьюринга. Я решил, что не судьба мне быть программистом и выбрал физику.
Пошёл в радиолокацию, занимался цифровой обработкой сигналов.
Но там у меня появились мысли: а нафига я так круто учился, если на обработке сигналов у нас используются максимум ряды Фурье, и ничего поинтереснее нет. И тут на одном курсовом проекте товарищ предложил мне попробовать использовать нейронки. Я сделал голосовой замок на MATLAB, который открывался только на нужную фразу. Честно, не понимал, как он работает, просто тыкал наугад параметры. Но он работал, и я такой: блин, это реально круто, хочу этим заниматься.
Так я ушёл в Data Science. Потом понял, что научка не моё, бигтех тоже не зажёг, пошёл в SAP-консалтинг. Потом в 2022 году я понял, что больше не хочу заниматься сервисным бизнесом и перешел на позицию CPO в B2B Joom. Там я достиг успехов и отвечал за продукт с многомиллиардной выручкой. Уже после этого я полностью вышел из найма и основал свою компанию.
Сейчас нас почти 40 человек, делаем заказную ML-разработку для клиентов вроде Альфа-Банк, Яндекс, Сбер и других. Плюс делаем свой LegalTech-продукт для проверки договоров.
Что самое интересное в работе?
Мы, как внешний исполнитель часто работаем с задачами типа «0-1» — это задачи, которые появляются, когда ничего еще нет, даже идей решения, и вообще непонятно, как подступиться.
Например: посчитать ежесуточный прирост поросят по видео. Или распознавать коров. Или оптимизировать процессы в металлургии.
Тебе нужно быстро переключаться между доменами, погружаться в новый домен, общаться с бизнесом, придумывать решение. И иногда ты сам не до конца понимаешь, получится или нет. А потом оно начинает работать. Вот этот момент — вау.
А что самое неприятное, сложное?
Мы внешняя команда и часто присутствует фаза «сближения» с внутренними командами, которая может проходить сложно. Еще мы нас не всегда могут допустить вглубь бизнеса и его проблем. Иногда — бюрократия, доступы выдаются по месяцу.
Бывает и такое, что заказчику как будто меньше надо, чем тебе, и ты всех пинаешь, чтобы проект ехал. Это тоже очень сильно бесит.
Расскажи веселую историю с работы
Их было много — вот такая вот жизнь в AI-консалтинге.
Когда ехал внедрять ML на сортировку алмазов в АЛРОСА, представлял супер-завод как у Tesla. В реальности же обычная комната, приходишь, надеваешь белый халат и ждешь, пока принесут мешок алмазов, высыпят его на стол. А остальные придут с совочками, зачерпнут алмазов и отнесут к себе на столы сортировать.
А на свиноферме перед входом нужно было полностью раздеться для обеззараживания. С заказчиком в таком тесном формате проекты раньше не обсуждал
Дашь совет «успешного успеха»?
Не бояться рисковать. Брать задачи, которые немного страшно брать. Брать ответственность и фигачить. И тогда успех неминуем
P.S.: Канал в тг у нас тоже есть, @r77_ai, подписывайтесь😉
AI-хакатон для разных отраслей
Ребят, привет это Влад Савин кофаундер R77 AI. Я с партнерами запускаю AI-портал (пока секретик, что там будет) через месяц и хотим на открытие провести онлайн-хакатон на его онлайн инфраструктуре.
Призовой фонд выделяем — 5 млн — все серьезно. Это на 5 или 10 команд.
Сейчас я ищу корпорации, у которых есть задачи на AI, и они хотели бы их решить с помощью хакатона из различных отраслей.
Наша задача: показать что в различных отраслях с помощью AI можно решать задачи.
Условия:
- Все бесплатно;
- Вы корпорация;
- У вас есть задача для AI;
- У вас есть материал, с которым можно работать — Датасет, набор документации или еще что-то, что мы будем обрабатывать.
Что получаете вы:
- Решение вашей задачи (ну если у команд получится);
- Мы пройдемся еще по СМИ вместе с вами;
- Крутой движ.
Пишите мне до конца этой недели, буду рад: @savinvlad
Пентагон перестал сотрудничать с Antropic
Последнее время нас все чаще начали звать в газеты и "телевизор" по вопросам ИИ. Причем зовут обсуждать как ИИ влияет на политику, законодательство и даже войны — нас самих это интересует, ведь в том числе от этого зависит куда ИИ будет развиваться.
Вот тут нас позвали на RTVI и наш head of AI Стас Округ высказался об Antpropic и разрывом отношений с пентагоном и наоборот дружбу с Open AI.
Посмотрите, наше честное мнение:
https://youtu.be/JfvwXXvZJX4?t=2018
Ребят, у нас подрос канал и кончились бусты, чтобы делать сторисы на какой-то редкий классный контент.
Будем рады, если вы нас поддержите и бустанете, а мы сделаем пост с теми, кто нас бустанул с ссылками и кратким описанием на ваш канал или сайт или может просто имя или еще что-либо, а может вы хотите поддержать нас без упоминаний)
Это бесплатно, но у вас должен быть pro-аккаунт в телеграме — вам выдаются бусты для поддежки каналов.
Напишите мне плиз в личку, если бустанули нас и хочется попасть в этот пост @savinvlad
Вот ссылка для буста:
/channel/boost/r77_ai
Ребят, потыкайте, что мы сделали для Альфы — справа внизу. Такой хелпер по API)
https://developers.alfabank.ru/
Вчера в новой редакции договора на разработку ПО с крупным клиентом заметил два новых пункта, делюсь:
1️⃣ :
в частности, указывать, что ПО/составные элементы ПО созданы с использованием искусственного интеллекта
ПО работает корректно и защищено от «галлюцинаций» искусственного интеллекта (т.е. ответов, сгенерированных ИИ, представляющих собой (или содержащих) ложные или вводящие в заблуждение сведения, представляемые как факт). <...> В случае, если Заказчик понесет убытки от «галлюцинаций» Исполнитель обязуется возместить такие убытки.
Агенты нерабочая история — не всегда готовы принять качество LLM. Выход - RPA с LLM...
При масштабировании надо использовать скрипты...
Рост производительности не на 1 человека, а на единицу контента - масштабирование персонализации...
Вот такие страшные штуки завтра обсудим онлайн у нас на канале с ребятами из Альфа Head of AI Products Иваном Александровым и у руководителя группы продуктов Ксении Рязанцевой.
18 февраля, среда, 16-00, у нас в канале. Тут можете добавить в календарик https://calendar.app.google/oMinHTef3kbSm98V7
Unlearning в рекомендашках завтра
Ребята, завтра в 18 поговорим на вебинаре с Никитой Зелинским директором по машинному обучению и исследованию данных в MTS Web Services про рекомендательные системы, а точнее про:
Unlearning в рекомендашках — постараемся вместе разобраться о чем речь, куда удалось продвинуться и почему до нашей индустрии это пока не докатилось.
Подпишитесь кстати на его канал — очень крутой, там про жесткий DS в корпах @datarascals
Ссылка на трансляцию будет у нас в канале, а напоминалку можете добавить в календарь: https://calendar.app.google/7rrdX5SmZgeXcqdRA