data_secrets | Unsorted

Telegram-канал data_secrets - Data Secrets

78474

Первый журнал о Data Science | Machine Learning | Big Data | Deep Learning | Neural Networks По вопросам сотрудничества: @v2r8n

Subscribe to a channel

Data Secrets

Основатель Replit говорит, что, несмотря на мрачные прогнозы, сейчас для джунов наступает золотая эра

Да, количество рабочих мест действительно сокращается. Но многие компании все еще охотно нанимают вчерашних выпускников: дело в том, что часто они лучше опытных разработчиков умеют использовать ИИ-инструменты и оказываются более гибкими, потому что «не обременены привычками».

«Хард скиллы больше не являются узким местом. Важно, насколько вы амбициозны, насколько вы креативны и насколько хорошо умеете использовать эти инструменты»


Запоминаем и не забываем вписать в резюме навык «профессиональный вайбкодер»

Читать полностью…

Data Secrets

На днях ровно 10 лет исполнилось знаменитому 37 ходу, с помощью которого AlphaGo обыграл Ли Седоля

В 2016 году с 9 по 15 марта в Сеуле проходил матч по Go между системой DeepMind AlphaGo и Ли Седолем – на тот момент 18-кратным чемпионом мира. Он закончился со счетом 4:1 в пользу искусственного интеллекта.

Особенно всем тогда запомнилась вторая партия, которая проходила 10 марта: в ходе нее AlphaGo, играя белыми, на 37-м ходу сделала крайне нестандартный ход, который эксперты сначала даже сочли ошибкой. Но в итоге он перевернул ход партии, и Седоль сдался на 211 шаге.

Этот легендарный "37 ход" вошел в историю как символ ИИ-креативности и победы стратегического "мышления" машины над человеком.

По случаю 10-летия DeepMind и Демис Хассабис даже выпустили рестроспективную статью. Пишут, что именно AlphaGo и 37 ход показали потенциал подобных моделей и вдохновили ученых дальше развивать линейку, в которую вошли AlphaZero/AlphaFold/AlphaProof и тд. Ведь если ИИ смог разбираться в чудовищном пространстве состояний в Go, его можно пустить и на реальные научные задачи со сходной комбинаторной сложностью.

В итоге, спустя 10 лет:

– Прямой наследник архитектуры AlphaGo – AlphaProof – в связке с AlphaGeometry 2 выходят на уровень серебра на Международной математической олимпиаде.

– За AlphaFold 2 дают нобелевку, и модель предсказывают структуры всех ~200 млн известных белков.

– Gemini Deep Think (тоже вдохновленный структурой поиска из архитектуры AlphaGo) берет золото на IMO 2025 и решает открытые математические задачи Эрдеша.

Сегодня прорыв 37 хода продолжает определять нашу работу по созданию AGI. Мы верим, что AGI станет самой значимой технологией, когда-либо изобретенной, и, возможно, высшим инструментом для ускорения прогресса в науке, медицине и производстве.


Кстати, про AlphaGo есть документалка. Самое время ее посмотреть: https://youtu.be/WXuK6gekU1Y

Читать полностью…

Data Secrets

Новый агент для Code Review от Anthropic

Стартап выкатил новую фичу для Claude Code: многоагентный инструмент для ревью кода. Он интегрируется с GitHub и анализирует PR, оставляя комментарии прямо в диффе + один сводный комментарий с основными находками.

При этом над PR организованно работают сразу несколько параллельных агентов, которые смотрят на изменения с разных сторон.

Несколько месяцев Anthropic тестировали систему в собственных проектах. Результаты:

– Доля PR с содержательными ревью комментариями выросла с 16% до 54%.
– Меньше 1% результатов ревью отмечены инженерами как неверные.
– В крупных PR (~1000 строк) бот находил хотя бы одну проблему в 84% случаев, а в среднем по 7.5 на PR.

Короче, все круто. Вот только цена за один PR будет примерно в районе 15-25 долларов 🤑

Мягко говоря, немало. Есть ощущение, что больше всего инструмент подходит как раз для крупных PR (вероятнее всего, сгенерированных). На больших объемах вайбкода такие траты могут быть оправданы, в остальных случаях цена вряд ли окупится.

https://claude.com/blog/code-review

Читать полностью…

Data Secrets

В стартапе Eon Systems ученые сделали первую полноценную цифровую эмуляцию мозга животного, которая способна управлять телом

Короче, на равных с искусственным интеллектом аля Джарвис в науке уже давно существует и другая идея: не обучать саму машину, а взять настоящий биологический мозг, полностью скопировать его в цифровую модель и запустить на роботе или компьютере. Особенно этот концепт знаком любителям научной фантастики.

Так вот ученые из Eon Systems заявляют, что они впервые создали такую систему и могут показывать ее в действии.

Они взяли мозг плодовой мухи, скопировали его и создали так называемый connectome: как бы полную карту всех нейронов мозга и связей между ними. То есть все нейроны, все соединения и сигналы синапсов.

Сам мезанизм такого копирования не свеж, и, вообще говоря, сама копия мозга мухи существует уже с 2024 года, НО что Eon Systems сделали впервые – так это соединили эту модель с настоящим телом в симуляции.

Другими словами, они впервые продемонтрировали полный цикл среда → сенсоры → мозг → моторные команды → движение тела. Это называется closing the sensorimotor loop – замыкание петли восприятия и действия. Причем получившаяся виртуальная муха демонтрирует не какой-то один тип поведения, а сразу несколько базовых паттернов.

Никаких искусственных нейросетей. Просто взяли карту мозга, подключили к телу, и это заработало. Хотя говорить, что совсем никакого ML там нет, было бы нечестно: даже если мы видим карту мозга, его динамика (пороги возбуждения, сила синапсов и тд) остается неизвестной, и ее тут как раз приближают моделями. Но это все равно нельзя назвать ИИ в привычном смысле слова.

Главное – что в целом работоспособность принципа brain upload +-подтверждена. Авторы пишут, что дальше все дело в масштабируемости. Для понимания, в мозге мухи примерно 140к нейронов (и даже его скопировать непросто), а у человека нейронов ~86 млрд.

Читать полностью…

Data Secrets

Поздравляем подписчиц с Международным Женским Днем!

Желаем, чтобы в жизни было больше прорывов, чем в новостях про очередную AI-модель, и чтобы мечты сбывались чаще, чем обещания Илона Маска.

С праздником! 🤍

Читать полностью…

Data Secrets

OpenAI выпустили Symphony – опенсорсный оркестратор для агентов

https://github.com/openai/symphony

По сути, это фреймворк для автономной работы над задачами. Вы соединяете Symphony с доской тасок, агент следит за ней, подхватывает новые задачи и запускает под них отдельный run с агентами, работающими в изолированной копии репозитория.

То есть Symphony полностью самостоятельно проходит путь от созданной задачи до PR через планирование, написание кода и тестирование. Человеку останется только ревью и аппрув, с самим агентом можно не нянчиться.

Считай, полноценный джун 👉

Работать может на любой модели, лицензия Apache 2.0

Читать полностью…

Data Secrets

Т-Банк инвестирует в школьное IT-образование через поддержку учителей

Бигтех открыл прием заявок на четвертый сезон Всероссийского грантового конкурса «Вклад в поколение» для преподавателей математики, информатики и физики. Цель программы - оказать учителям финансовую и методическую поддержку.

Победившим в конкурсе педагогам откроют доступ к курсам образовательной платформы “Т-Образование”, закрытому сообществу и выдадут гранты по 200 тысяч рублей на любые цели. Выплачивать будут по 25 тысяч в месяц в течение учебного года. За все годы Т-Банк выделил на поддержку учителей более 120 млн рублей, гранты уже получили 380 преподавателей из 66 регионов.

Читать полностью…

Data Secrets

Стэнфорд и PHD Biosciences создали биотехническую команду из 37 тысяч агентов, и они указали на потенциальный метод лечения рака

Авторы представили Virtual Biotech (www.biorxiv.org/content/10.64898/2026.02.23.707551v1) – мультиагентную систему, целью которой было научиться примерно предсказывать и объяснять, почему одни препараты проходят испытания и доходят до рынка, а другие нет.

Если бы мы научились делать такие предсказания даже с неидеальной точностью, это ускорило бы разработку лекарств в разы.

Так вот: Virtual Biotech скормили порядка 56 тысяч клинических испытаний разных фаз (всего таких фаз 4). Поверх этих данных агенты выдвигали гипотезы, обсуждали их друг с другом, проводили расчеты и, в общем, пытались извлечь какую-то скруктуру и инсайты.

Что в итоге:

1. Агенты предложили новую биологическую метрику – cell-type specificity, насколько узко экспрессирован ген в определенном клеточном типе. Показано, что она статистически значимо связана с вероятностью клинического успеха препарата, то есть это, по сути, новая априорная метрика для оценки эффективности препаратов.

2. Тут же в качестве кейса система указала на иммунный регуляторный белок, который часто сильно экспрессируется в опухолевых клетках и по предложенной метрике выглядит как перспективная мишень. Агенты даже предложили стратегию разработки соответствующего ADC-препарата на уровне аналитического дизайна.

Это довольно важные результаты, которые могли бы, теоретически, помочь компаниям сэкономить миллионы и годы на испытаниях, если бы были поставлены на конвейер. Короче, будущее близко.

Еще раз ссылка на статью

Читать полностью…

Data Secrets

Ну все, Anthropic обрел главного фаната в лице Кэти Перри, теперь они обречены на успех

P.S. На самом деле конфликт между Пентагоном и Anthropic действительно неплохо подогрел интерес и лояльность к Claude.

Чат-бот вышел на 1‑е место в App Store по США, в то время как соцсети заполнены вот такими скринами отмены подписки ChatGPT и новых платежей Anthropic. Как говорится, плохой рекламы не бывает.

Читать полностью…

Data Secrets

Бан Anthropic и триумф OpenAI: история с Пентагоном с каждым днем становится все безумнее и безумнее

Итак, Anthropic отказались безусловно принимать условия Министерства Обороны и заявили, что те не смогут использовать Claude для автономного оружия и массовой слежки.

В ответ Пентагон, как и обещали, расторгли со стартапом контракт на 200 миллиардов и назначили им статус supply chain risk.

Трамп назвал Anthropic радикальными леваками и woke-организацией, которая пытается диктовать условия армии, и призвал все федеральные агентства немедленно прекратить использовать их технологии.

В течение 6 месяцев от Claude обязаны отказаться все гос.организации. С этого момента Anthropic официально изгои.

Но это не самое интересное. Самое интересное, что одновременно с этим OpenAI заключили с Министерством Обороны новое соглашение: они развернут свои модели в секретной сети Пентагона – защищенной облачной инфраструктуре для задач национальной безопасности.

Для этого даже сформируют FDE – Forward Deployed Engineer, специализированную команду от OpenAI, которая будет мониторить и разворачивать ИИ прямо на месте.

Абсурд в том, что заключен этот контракт на ровно тех же условиях, которые выдвигал Anthropic. OpenAI тоже настояли на запрете массовой слежки и обязательном участии оператора в решениях о применении силы, включая автономные системы.

Вот только с Альтманом почему-то подписали сделку, а Амодеи за то же самое выкинули на помойку.

Читать полностью…

Data Secrets

Официально: OpenAI завершила крупнейший в истории раунд частного финансирования

Они привлекли $110 млрд при предварительной оценке компании в $730 млрд (post-money будет примерно $840 млрд). Часть средств, конечно, придут не в виде кэша, а в форме услуг, как это принято в ИИ-пузыре 💀

SoftBank и NVIDIA вложили по $30 млрд каждая, а Amazon вкинул $50 млрд + стратегическое партнерство. Причем с Amazon ситуация следующая: сразу будет доступно только $15 млрд, а оставшиеся $35 млрд разблокируются только по определенным условиям (например, когда OpenAI начнут использовать более N чипов Trainium).

С Nvidia тоже интересно. Помните, как Хуанг двусмысленно высказывался о сентябрьском соглашении с OpenAI на 100 миллиардов? Мы писали об этом вот тут. Так вот текущие инвестиции, видимо, являют собой замену того договора. Получается, по итогу Nvidia инвестировали в три раза меньше, чем планировали, так что их вложение вовсе не означает, что между ними и OpenAI все гладко.

SoftBank тут самые ярые поклонники OpenAI. Чтобы наскресьти на инвестиции, они даже не пожалели продать акций Nvidia на $5,8 млрд.

Читать полностью…

Data Secrets

Вышла Nano Banana 2!

Что интересного, помимо еще лучшего качества генераций, фотореалистичности и всего такого:

1. Сохранение персонажей. Теперь в рамках сессии можно сохранять несколько персонажей и объектов, и переиспользовать их так, чтобы детали внешности оставались неизменными.

2. Модель может в реальном времени ходить в Интернет и уточнять детали, если ей это необходимо. Это можно использовать, например, для генерации графиков.

3. Текст теперь вообще (почти) без багов, можно даже его локализовать и переводить, и это работает.

На видео – интересная демка, которую Google сделали в честь запуска. Это небольшой интерфейс "Window Seat". Вбиваете нужное место в мире и опции, и модель: (1) идет в поиск, чтобы чекнуть погоду на местности и соответствующие референсы; (2) рисует картинку из окна, которая точно соответствует времени суток, погоде и месту. Круто же?

Еще примеры генераций и все остальное -> blog.google/innovation-and-ai/technology/ai/nano-banana-2/

Читать полностью…

Data Secrets

Вот ради таких мемов мы и терпим повышение цен на оперативку

(Смотреть до конца)

Читать полностью…

Data Secrets

О, в Claude Code добавили удаленный котроль

Документация

Сессию нельзя запустить прямо с телефона, так что это не совсем OpenClaw (хотя фича определенно им вдохновлена).

Сначала старт на пк -> потом выполняем в терминале claude remote-control -> по ссылке или QR-коду подключаемся с телефона в приложении Claude или в браузере. И тут уже можно мониторить и управлять процессом: дописывать промпты, отслеживать статус и изменения, прерывать и тд, все как в обычном чате.

Пока доступно в research preview для Max, скоро обещают добавить в Pro.

Читать полностью…

Data Secrets

OpenAI отменили SWE-bench Verified – главный современный бенчмарк по кодингу

Они выпустили целое исследование, основная мысль которого: SWE-bench Verified (который сделали, кстати, сами OpenAI в 2024) больше не измеряет реальные способности моделей в разработке, и пользоваться им не стоит.

Кстати, это выглядит как косвенный выпад в сторону Anthropic. Они там до сих пор делают ставку на SWE Verified, а OpenAI фактически приходят и заявляют, что этот бенч сломан и результаты на нем мало что значат. На фоне последних событий это вряд ли случайность 💀

В чем, собственно, проблема SWE-bench Verified:

1️⃣ Тесты часто отбрасывают корректные решения. OpenAI сделали ручной аудит сложных задач и выяснили, что в 59.4% этих задач есть проблемы тест-дизайна/описания, из-за которых задачу становится крайне трудно или вообще невозможно решить честно, даже человеку.

Например, тесты требуют конкретных деталей реализации, которые не обязательны для функционально верного решения. Или тесты проверяют дополнительную функциональность, которая не описана в задаче. В таких случаях эвал, очевидно, становится некорректным.

2️⃣ Классический contamination, то есть утечка задач в трейн моделей. Бенчмарк собран из опенсорс репозиториев, так что этого стоило ожидать. OpenAI пишут, что нашли признаки contamination у всех фронтирных моделей, которые они тестировали.

В частности, выяснилось, что GPT-5.2, Claude Opus 4.5 и Gemini 3 Flash Preview знают не только точный gold patch для решения, но и воспроизводят точные пути к файлам, цитируют комментарии из диффа или просто по ID могут вспомнить формулировку задачи.

Итого вывод OpenAI следующий: тесты часто неправильно устроены, так что нерешаемый хвост бенчмарка – это шум, сражаться за который не стоит. А если процент и растет, то это в основном узнавание, а не рост реальных навыков.

Вместо SWE-bench Verified они теперь советуют SWE-bench Pro (у него тоже все не идеально, но по их данным contamination там заметно слабее, и ни одна модель не смогла воспроизвести полный gold patch дословно). Фишка, правда, в том, что SWE-bench Pro открыт только частично, и чтобы получить на нем официальный результат, нужно проходить через организаторов. То есть, через OpenAI 🙂

openai.com/index/why-we-no-longer-evaluate-swe-bench-verified/

Читать полностью…

Data Secrets

У Perplexity вышло что-то интересное: постоянно активная локальная AI-система под названием Personal Computer

Personal Computer работает на базе Mac mini, который выступает в роли прокси для Perplexity Computer (эта штука вышла пару недель назад).

То есть система интегрирует Perplexity Computer с просторно включенной локальной средой: AI может перемещаться между инструментами, выполнять задачи автономно и продолжать работу без пользователя. При этом она доступна удаленно с любого устройства, поддерживает постоянную память и всевозможные коннекторы.

Этакий OpenClaw, который имеет доступ к вашим локальным файлам и проектам.

Пока что запущен waitlist

www.perplexity.ai/ja/hub/blog/everything-is-computer

Читать полностью…

Data Secrets

Стартап Яна Лекуна вышел из стелса и закрыл первый раунд финансирования на 1 миллиард долларов

Если быть точным, они привлекли даже чуть больше: 1.03 миллиарда. Пре-оценка стоимости при этом оказалась где-то в районе 3.5 миллиардов (напоминаем, что стартапу меньше трех месяцев и продуктами там еще и не пахнет).

В Лекуна вложились Cathay Innovation, Greycroft, Hiro Capital, HV Capital, а еще Джеф Безос. Для seed раунда цифры, конечно, ошеломительные. Возможно, это даже новый рекорд для европейской компании.

Также стал известен официальный список ко-фаундеров⬆️

Что ж, теперь ждем, кто выпустит хоть что-нибудь раньше: Лекун или Суцкевер

Читать полностью…

Data Secrets

Ничего необычного, просто в Китае прямо на улицах устанавливают всем желающим OpenClaw

Конкретно эти фотографии сделаны у офиса Tencent в Шэньчжэне. Там разработчики провели бесплатный ивент по установке OpenClaw. Говорят, пришло около тысячи человек.

Подобные мероприятия прошли также в Шанхае, Пекине и нескольких других городах.

Кстати, в Китае в целом сейчас планируют развернуть огромную программу поддержки OpenClaw. Они хотят создавать так называемые Lobster service zones: физические или облачные места, где OpenClaw уже развернут и настроен. Операторам будут выделять бюджет на хостинг, а люди и компании смогут пользоваться (почти) бесплатно.

Плюс разработчикам или компаниям, которые контрибьютят приложения/скиллы на OpenClaw для приоритетных отраслей, обещают до 2 млн юаней субсидий на проект. А проекты, которые признают «демонстрационными» (успешные применения OpenClaw), получают разовую выплату до 1 млн юаней. Это примерно 140к доллларов.

Читать полностью…

Data Secrets

Autoresearch от Андрея Карпаты

Встречаем новый проект от гуру: агент, который автономно проводит эксперименты и обучает LLM.

Autoresearch состоит из: самого агента, одной GPU и простой среды обучения маленькой LLM. Агент самостоятельно изменяет train.py, запускает короткие сессии обучения модели по 5 минут, оценивает улучшение метрик и сохраняет или отбрасывает изменения.

Так он может провести десятки экспериментов за ночь. Вы встаете – и получаете уже улучшенную модель, экономя себя несколько часов рутинного копания в коде (см.график с изменениями метрики по итерациям ⬆️).

Все свои дополнительные инструкции можно дописать в program.md: где менять гиперпараметры, что исследовать. Исходный program.md сделан предельно простым, но при желании можно упороться и добавить мультиагентность, новые метрики, стратегии и прочее.

https://github.com/karpathy/autoresearch

Читать полностью…

Data Secrets

Когда в 2023-м все начали говорить про агентов, под этим чаще всего подразумевали цепочку промптов с фиксацией контекста, а про инфраструктуру, как правило, даже не задумывались. Сейчас кто-то по-прежнему считает, что агенты — это окошечки с LLM, а развернутая на единственной ноде модель — это подходящая инфраструктура для агентской системы. На самом деле это, конечно, не так.

Чтобы экономика сходилась и железо утилизировалось эффективно, нужно учитывать реальный паттерн нагрузки: долгие сессии, многошаговые диалоги, большие контексты.

В последнем обновлении Yandex AI Studio интересен не столько факт, что появилась модель DeepSeek V3.2, сколько то, как под нее оптимизировали инференс. Модель работает в режиме prefill/decode, где prefill-ноды оптимизированы под быстрый прогон длинных контекстов, а decode-ноды — под устойчивую генерацию с низким и стабильным показателем Time Between Tokens. Чтобы это работало, пришлось научиться передавать KV-кэши между серверами в реальном времени, а это гигабайты данных.

Дальше — больше. Введена иерархия кэшей (GPU → CPU → распрелеленный слой), а балансировщик теперь «знает», где уже хранятся закешированные фрагменты контекста, и отправляет запрос туда, где cache hit rate будет выше.

Поверх этого слоя появились приватные эндпоинты и правила модерации ответов моделей, что особенно актуально при работе с опенсорс моделями в корпоративном контуре. Добавили и новый подход к тарификации: появились токены инструментов и токены кеширования. Первые участвуют при вызове встроенных инструментов (File Search, Web Search, MCP), вторые — при повторном использовании уже обработанных фрагментов запроса. Всё это стоит в четыре раза дешевле обычных токенов и делает длинные агентские сценарии экономически осмысленными.


Возможно, именно здесь и начинается взрослая эпоха для агентных систем — не промпт-цепочки, а полноценные цифровые организмы, у которых есть память, тело и дисциплина.

Читать полностью…

Data Secrets

Агент Cursor решил одну из задач First Proof challenge лучше, чем люди

First Proof challenge – это набор из 10 математических задач, составленный 11 известными математиками (включая лауреата Филдсовской премии Мартина Хайрера).

Задачи там из областей алгебраической комбинаторики, спектральной теории графов, топологии, стохастического анализа и тд. Они имитируют реальную работу академиков лучших университетов мира.

Задачки были составлены всего лишь месяц назад и открыто не публикуются во избежании лика данных в трейн моделей.

И вот сегодня CEO Cursor заявил, что их агент (для кодинга, на секундочку) справился с одной из этих задач, и нашел при этом лучшее решение, чем люди.

Это подтверждают математики: подход агента действительно отличается от существующего и улучшает доказательство до новой константы.

Что интересно, тут использовалась ровно та же система, с помощью которой Cursor с нуля завайбкодили браузер (пост об этом вот тут). Она автономно работала над задачей четыре дня, не получая никаких подсказок.

П
од капотом там, кстати, не один, а десятки агентов на основе разных моделей, которые динамически планируют действия и работают над подзадачами.

Читать полностью…

Data Secrets

Более 2.5 миллионов человек заявили, что они отменили подписку на ChatGPT из-за последних событий

По крайней мере, такие данные зафиксировал сайт quitgpt.org/. Он был специально создан, чтобы бойкотировать стартап за сделку с Пентагоном.

Сколько из перечисленных 2.5 миллионов подписавших петицию действительно перешли на другой ИИ – неизвестно.

Так или иначе, 2.5 миллиона – это все еще только около 0.3% от еженедельных пользователей бота.

Читать полностью…

Data Secrets

Проект по машинному обучению — всегда больше, чем просто модель

В реальных проектах важно все: сбор и подготовка данных, проектирование пайплайна, интеграция инструментов и технические решения по внедрению. Без понимания этих этапов трудно представить, какие компетенции ожидают от инженера машинного обучения.

На вебинаре «Машинное обучение на практике: соберите бота для расшифровки аудиосообщений» от karpovꓸcourses вы пройдете полный путь построения проекта на конкретном кейсе. Эксперты с индустриальным опытом в ЯндексꓸЕда и из ИТМО покажут, какие навыки действительно требуются инженеру машинного обучения в работе.

Присоединяйтесь к вебинару по ссылке: https://clc.to/erid_2W5zFGW1avm

Реклама. ООО "КАРПОВ КУРСЫ". ИНН 7811764627. erid: 2W5zFGW1avm

Читать полностью…

Data Secrets

США использовали Claude в недавних боевых операциях в Иране – даже после запрета Трампа

WSJ сообщает, что во время недавних ударов по Ирану Центральное командование США использовало Claude для: разведывательных оценок, идентификации целей и моделирования боевых сценариев.

Формально это, конечно, не прямое нарушение приказа Трампа, потому что у них есть еще 6 месяцев, чтобы отказаться от Claude. И тем не менее, тайминг интересный:

– В пятницу Anthropic отказываются принимать условия Пентагона

– В тот же день Трамп агрессивно призывает все агентства прекратить использовать Claude и называет Anthropic леваками

– Буквально через несколько часов Claude используют для атаки Ирана и, возможно, даже убийства верховного лидера страны

В странное время живем

Читать полностью…

Data Secrets

Доброе утро от создателя YouTube

"Надеюсь все наслаждаются последним годом работы, имеющей смысл"


🍿

Читать полностью…

Data Secrets

Создатель Twitter Джек Дорси уволил половину своей компании Block из-за ИИ

До сегодняшнего дня штат Block (бывшая Square) насчитывал чуть более 10к сотрудников, пока Дорси не решил одним днем уволить 4 тысячи из них.

Он заявил, что руководство приняло такое решение не из-за проблем. Наоборот, бизнес силен, валовая прибыль продолжает расти и так далее. Просто "что-то изменилось".

Мы уже видим, что интеллектуальные инструменты, которые мы создаем и используем, в сочетании с небольшими командами позволяют создать новый способ работы, который коренным образом меняет то, что значит строить и управлять компанией. И это быстро ускоряется.


По словам Дорси, он мог бы сокращать штат постепенно в несколько подходов, но выбрал более честный и жесткий путь.

Самое интересное, что акции компании после этого заявления подскочили на 23% всего за час. В денежном эквиваленте это примерно +6млрд долларов к стоимости компании.

Никакого влияния на рынок труда, говорите?

Читать полностью…

Data Secrets

Когда экосистема вырастает до десятков продуктов, разрозненные ML-решения начинают тормозить развитие.

В VK объединили рекомендации, поиск и рекламу в единую Discovery-платформу. Теперь модели, данные и пайплайны работают по единым стандартам.

В основе потоковой обработки — Stream Flow, который построен работает на бигдата-платформе YTsaurus и выдерживает до 1 млн событий в секунду. Это позволяет синхронизировать real-time сигналы между продуктами и использовать их в обучении и ранкинге без отдельной инфраструктуры в каждой команде.

Результат — ускорение экспериментов в 5 раз и заметный рост продуктовых метрик в VK Клипы, VK Музыке и VK Видео.

Детали разработки и лучшие практики команда раскрыла в этой статье, советуем.

Читать полностью…

Data Secrets

У Anthropic проблемы с Пентагоном

Недавно в Интернете вирусилась громкая новость о том, что правительство США использовало Claude для планирования операции по похищению президента Венесуэлы (читать).

Anthropic тогда выразили публичный протест, а Пентагон в ответ на это заявил, что будет «обсуждать возможность разрыва или пересмотра контрактов с Anthropic».

Теперь история получила продолжение. Оказывается, 24 февраля Министр обороны Пит Хегсет лично встречался с Дарио Амодеи.

Встреча ничем хорошим для Anthropic не закончилась. Стартапу выдвинули ультиматум: либо они до 27 февраля снимают все ограничения на использование Claude в государственных целях, либо компания, не много не мало, попадет в настоящий черный список.

Им назначат статус «supply chain risk». Фактически, Anthropic признают угрозой, и с ними не смогут работать гос.подрядчики, то есть они не смогут продать Claude ни одной компании, которая работает с Пентагоном.

Ну либо Америка просто воспользуется законом о оборонном производстве и буквально принудит Anthropic к мобилизации, что означает полный доступ к Claude.

Объясняет Пентагон свои действия тем, что использование ИИ контролируется в первую очередь законами США, а не политикой компании (читать как «плевать мы хотели на ваши политики»).

Anthropic, кстати, чуть ли последний ИИ-бизнес в Америке, который не сотрудничает с Пентагоном: OpenAI, xAI и Google уже давно заключили с ними контракты.

www.axios.com/2026/02/24/anthropic-pentagon-claude-hegseth-dario

Читать полностью…

Data Secrets

Anthropic публично обвинили несколько крупных китайских стартапов в массовой дистилляции Claude

Провинились DeepSeek, Moonshot AI (создатели Kimi K2) и MiniMax. DeepSeek – в довольно скромных масштабах (примерно 150k запросов), Moonshot – покрупнее (~3.4M), а MiniMax так и вовсе отправили >13M реквестов.

В общих масштабах сообщается, что "украдено" было около 16 млн запросов через ~24 000 фейковых аккаунтов.

У Anthropic подгорело не на шутку, конечно. Они обвиняют компании не только в нарушении ToS, но и в том, что те обходят экспортные ограничения США, а это уже серьезно.

Конечно, Anthropic делают вид, что беспокоятся в первую очередь о безопасности: мол, дистиллированные модели могут унаследовать способности, но не унаследуют защитные механизмы, а значит растет риск международных угроз от ИИ.

Полное расследование здесь: www.anthropic.com/news/detecting-and-preventing-distillation-attacks

А мы китайский опенсорс все равно будем любить...

Читать полностью…

Data Secrets

В Microsoft придумали технологию хранения данных в стекле

Она основана на лазерной записи информации в виде трехмерных пикселей – вокселей – внутри прозрачного стекла. Идея не то чтобы совсем новая, но Microsoft первыми предложили полноценную end-to-end систему записи, хранения и считывания.

Для записи используется фемтосекундный лазер. Он испускает коротенькие импульсы и меняет структуру стекла, причем так, что среда в целом не страдает, а изменения видны только через оптику.

Прочитать данные можно с помощью микроскопа. Правда, на практике возникает нюанс: шумные световые сигналы. Так что для минимизации ошибок авторы предлагают использовать сверточные нейросетки.

В чем фишка такого хранения?

Во-первых, стекло может выдерживать экстремальные условия. Тесты показали, что таким образом данные можно хранить до 10 тысяч лет (!!!), тогда как обычные носители обычно выдерживают без обслуживания максимум 40-50 лет.

Во-вторых, плотность записи довольно презентабельная: ~4.8 ТБ на диск ~12 см². Не рекордные цифры, но вполне сопоставимо с современными средами хранения.

В-третьих, энергоэффективность: хранение, считай, получается бесплатным.

В общем, занятно. Статья в Nature: www.nature.com/articles/s41586-025-10042-w

Читать полностью…
Subscribe to a channel