Telegram-канал data_secrets - Data Secrets: Unsorted - каталог телеграмм

data_secrets | Unsorted

Subscribe to a channel

Telegram-канал data_secrets - Data Secrets

55445

Первый журнал о Data Science | Machine Learning | Big Data | Deep Learning | Neural Networks По вопросам сотрудничества: @v2r8n

Subscribe to a channel

Data Secrets

15 Aug 2025 11:11

В Китае прошел забег роботов

Там сейчас проходят World Humanoid Robot Games, сегодня первый день. Это буквально олимпийские игры для роботов. 280 команд из 16 стран приехали посоревноваться в 26 дисциплинах. В их числе – бег.

Победил робот от Unitree, модель H1. Он пробежал достаточно бодро: 1500 метров за 6 минут 34 секунды. Человеческий рекорд на такой трассе – 3:26.

Правда, по пути гуманоид успел кого-то сбить, но, как говорится, и так сойдет 😳

Читать полностью…

Data Secrets

13 Aug 2025 20:24

Perplexity в очередной раз сделали маркетинговый ход конем и заявили, что собираются купить Google Chrome

Чтобы вы понимали:
– Perplexity целиком оценивается примерно в 18 миллиардов долларов
– Chrome стоит 34.5 миллиарда

Даже при привлечении огромных денег от инвесторов стартап вряд ли потянет покупку (а там еще огромный штаб разработчиков, которым надо платить зп, и гигантские траты на серверы). На рынке, где есть OpenAI и остальные, такой лакомый кусочек вряд ли достанется Perplexity.

Зато сколько шума они навели и сколько внимания к себе привлекли. Абсолютно все СМИ сегодня пишут об этой новости, а Perplexity, вероятно, только это и надо было: создать себе репутацию сильной богатой компании, которая может себе позволить даже Chrome

Респект

Читать полностью…

Data Secrets

12 Aug 2025 10:02

Проблемы с качеством кода в ML-проектах — как с ними справиться? Нашли пост от Data-scientist из финтех-компании Точка Банк

ML-код часто живёт по своим правилам:
— В Transformers не прописаны тайпинги.
— Sklearn падает при большом количестве ядер
— На исходники vLLM лучше не смотреть — больно.

С таким стеком большинство линтеров просто не работают — приходится кастомизировать.

Что делать? Разделять проекты:
— один репозиторий для экспериментов,
— второй — для продакшена, который интегрируется с бэкендом.

Но даже в такой конфигурации легко местами скатиться в нечитаемый и не воспроизводимый код, особенно в репозитории с экспериментами. Как этого избежать — читайте в посте ниже ⬇️

А чтобы разобраться в других сложностях ML-проектов, подписывайтесь на канал .ml

Читать полностью…

Data Secrets

11 Aug 2025 11:23

Кстати, занятная статистика от Альтмана: всего 7% пользователей тарифа Plus пользовались ризонинг моделями до появления GPT-5

Сейчас это число выросло до 24% (естественно, потому что новая система сама роутит на ризонеры).

У бесплатных пользователей ситуация еще хуже: раньше <1% юзеров пробовали ризонеры. Теперь 7%.

Интересно, все правда так любили gpt-4o или просто не умеют пользоваться выпадающими списками?

Читать полностью…

Data Secrets

09 Aug 2025 10:51

Так, Сэм Альтман собрал фидбэк о GPT-5 от пользователей в AMA на Reddit и вот несколько хороших новостей:

1. Вчера система (не забываем, что это именно система, а не одна модель) казалась глупее, потому что сломался роутинг между моделями. Теперь все починили, по идее должно стать поприятнее.

2. Информация о том, какая модель работает над запросом, станет прозрачнее: видимо, будет отображаться где-то перед аутпутом. Плюс разработчики до сих пор калибруют границу принятия решения о переключении моделей. Также можно будет вручную переключаться в режим ризонинга.

3. После того, как GPT-5 наконец докатят на всех, лимиты для Plus пользователей удвоятся.

Также OpenAI рассматривают возможность разрешить Plus юзерам продолжать использоваться GPT-4o. Об этом попросило прямо ооочень много людей.

Читать полностью…

Data Secrets

07 Aug 2025 19:00

Стрим начинается, смотрим тут

https://www.youtube.com/live/0Uu_VJeVVfo

Читать полностью…

Data Secrets

06 Aug 2025 17:08

OpenAI впервые за долгое время позволит сотрудникам продать акции

Это коснется и бывших, и нынешних работников компании. Зачем это OpenAI и что означает на практике:

1. Оценка компании вырастет почти на 70%. Это не обычный раунд финансирования, а вторичная продажа, поэтому в ходе такой сделки определяется цена, по которой инвесторы готовы покупать доли именно у сотрудников, — именно эта цена и становится новой рыночной оценкой всей компании. Итог: в марте оценка OpenAI была 300 миллиардов долларов, теперь будет около 500.

2. Вынужденная мера для сохранения сотрудников. Очень многих в OpenAI не устраивало, что они не могут продать акции даже после ухода. Теперь деньги становятся реальными, а не только на бумаге. Короче, возможность обналичить опционы должна повысить общую корпоративную лояльность. А еще ликвидность – важный пункт для хантинга.

Пока переговоры на ранней стадии, но интересующиеся покупкой инвесторы уже есть

Читать полностью…

Data Secrets

05 Aug 2025 16:58

Google зарелизили Genie 3, новую версию их известной модели симуляции мира

Суть: по текстовому запросу модель может сгенерировать полноценное интерактивное 3D-пространство с разрешением 720p и частотой 24 FPS, по которому можно погулять.

Отдельно разработчики хвастаются долгосрочной памятью. То есть даже если ты отвернулся или немного отошел, ландшафт и объекты сохраняются такими же при возврате взгляда. Звучит просто, но на практике добиться этого совсем нетривиально.

Еще интересно, что изменять состояния мира (погоду, объектную сцену, добавлять персонажей) можно прямо во время симуляции. И при этом, если Genie 2 выдерживала не более 10-20 секунд симуляции, третья версия вывозит уже несколько минут.

Зачем это нам? Во-первых, конечно, игры. Во-вторых, что более важно, обучение роботов и агентов.

Короче, крутой релиз с крутым потенциалом. Такое любим

deepmind.google/discover/blog/genie-3-a-new-frontier-for-world-models/

Читать полностью…

Data Secrets

05 Aug 2025 08:50

В сеть утекли Spotify плейлисты селебрити: в том числе Сэма Альтмана, Андрея Карпаты, Ильи Суцкевера и других

Некий персонаж объявил, что провел расследование и нашел реальные аккаунты знаменитостей в Spotify. Он год парсил их плейлисты и теперь сделал целый сайт, на котором любой желающий может просмотреть, что слушают самые влиятельные люди планеты.

В числе попавших под раздачу также: Марк Андерсен, Александр Ванг (новый глава ИИ в Meta), Ян Лекун, Гэрри Тан (CEO Y-Combinator) и еще много-много политиков, бизнесменов и звезд.

Настроение с утра сразу: 👩‍❤️‍👨

Читать полностью…

Data Secrets

03 Aug 2025 15:49

Свежее красивейшее исследование от Anthropic: Persona Vectors в LLM

Помните, как GPT-4o после безобидного дотюнивания вдруг стал страшным подхалимом? Или как Grok начал объявлять себя Гитлером? Естественно, их не учили так себя вести напрямую, но по какой-то причине такая "личность" в них все равно проснулась.

Anthropic в своей новой работе обнаружили, что это далеко не случайность. Оказывается, в нейросетях есть так называемые persona vectors – векторы в пространстве активаций, отвечающие заданным чертам характера.

Более того, исследователи научились такие векторы находить просто по текстовому описанию черты. Пайплайн довольно простой:

1. Берем определенную характеристику (скажем, жестокость) и генерируем два системных промпта. Один «за» черту, другой — против (то есть "будь жестоким" и "не будь", только более развернуто).

2. Скармливаем разным экземплярам модели разные системные промпты и начинаем задавать специальные вопросы, провоцирующие проявление нужной характеристики.

3. Для каждого вопроса трекаем активации на каждом слое сети, усредняем по токенам. Разность таких средних активаций первого экземпляра модели со вторым даёт нужный нам вектор для каждого слоя. Также можно затрекать самый яркий слой, на котором вектор персоны дает максимальное влияние на результат.

Ну а после получения таких персо-векторов делать с ними вообще-то можно очень много всего. Например:

– Определять, какие данные активируют тот или иной persona vector. Например, если научить модель на числах 666 или 1488, она в целом станет безжалостной. И таких неочевидных корреляций, как оказалось, куча, а без таких аналитических инструментов обнаруживать их почти нереально.

– Управлять характером LLM на инференсе. Чтобы вызвать или подавить какую-то черту при генерации, нужно просто к активации h_ℓ на слое ℓ добавить α⋅v_ℓ, где v_ℓ – это persona vector. Например, если мы рассматриваем черту "злость", то при положительных α модель генерирует более агрессивные тексты, а при отрицательных – становится зайкой (доказано на Qwen2.5-7B и Llama-3.1-8B).

– Управлять самим обучением. Тут немного конринтуитивно, но это работает как вакцина. Чтобы избавиться от нежелательных черт модели, нам нужно, наоборот, проактивно инъецировать их в нее на каждом шаге обучения.

Конкретнее: на каждом шаге прямого прохода при обучении мы добавляем к активациям все то же α⋅v_ℓ, и получается, что градиенты по задаче next-token prediction накапливаются уже с учётом этого смещения; благодаря этому модель не должна самостоятельно перестраивать себя вдоль данного вектора персоны v_ℓ. Такой подход называется Preventative Steering, и это работает (и при этом надежнее, чем просто единоразовое подавление на инференсе).

В общем, в этот раз у Anthropic получилась исключительно интересная и многообещая работа, давненько такого не было. Будем следить, и, конечно, советуем почитать полностью 👇

Блогпост | Статья

Читать полностью…

Data Secrets

02 Aug 2025 09:50

Anthropic отрубили OpenAI доступ к API своих моделей из-за «нарушения условий предоставления услуг»

Причина проста: по мнению Anthropic, OpenAI подключили API Claude Code к своим внутренним инструментам, чтобы их инженеры могли использовать его в процессе разработки GPT-5 для написания кода.

А это прямое нарушение условий: в соглашении об использовании прописано, что клиентам запрещено использовать сервис для «создания конкурирующего продукта или сервиса, в том числе для обучения конкурирующих моделей ИИ».

OpenAI же говорят, что использовали API только для бенчмаркинга и оценок безопасности (чтобы сравнивать со своими новыми моделями). А это уже стандарт индустрии, и так делать, естественно, никто не запрещает.

Мы уважаем решение Anthropic закрыть нам доступ к API, но это разочаровывает, учитывая, что наш API остаётся им доступным, – сказала Ханна Вонг, директор по коммуникациям в OpenAI.

Нам показалось, или обстановка накаляется? 🍿

Читать полностью…

Data Secrets

31 Jul 2025 19:12

Пекин вызвал Дженсена Хуанга на ковер из-за проблем с безопасностью в чипах Nvidia

Сообщается, что какие-то американские эксперты (кто именно, не уточняется) нашли в видеокартах H20 некие уязвимости (какие именно, также не уточняется), из-за которых можно отслеживать местонахождение чипов и удаленно отключать их.

Никаких официальных доказательств такого функционала никто не предоставил и эксперты по кибербезу сразу сказали, что это какой-то бред. Но суть в том, что H20 производятся специально для китайского рынка и это чуть ли не единственные видеокарты, которые Вашингтон официально разрешает поставлять в КНР.

Так что, понятное дело, в Китае перепугались и вызвали представителей Nvidia в суд для выяснения обстоятельств. Дженсен Хуанг в ответ на обвинения заявил, что никаких бэкдоров в его продуктах нет и в помине, и что он, вообще-то, очень благоволит китайскому рынку.

И видимо, в суде ему поверили, потому что заказ на 300 000 видеокарт для Китая, который Nvidia недавно разместили на заводе TSMC, все еще в силе.

Теперь интересно, кем же были те самые «американские эксперты», которые так желают Nvidia процветания

Читать полностью…

Data Secrets

31 Jul 2025 14:40

Марк Цукерберг написал открытое письмо со своим видением будущего ИИ

Оно небольшое, полностью почитать можно тут. Мы собрали основные цитаты:

В некоторых отношениях эра ИИ будет абсолютно новой для человечества, но в других станет просто продолжением исторических тенденций. Еще 200 лет назад 90% людей были фермерами. Прогресс постепенно дает нам возможность концентрироваться меньше на выживании и больше на том, чем мы действительно хотим заниматься.

В Meta мы считаем, что

нужно дать суперинтеллект в руки каждому

. Это отличает нас от других компаний, которые считают, что суперинтеллект должен централизовано автоматизировать работу.

Люди, преследующие свои индивидуальные устремления, – это именно то, как мы всегда добивались прогресса

, расширяя процветание, науку, здоровье и культуру.

Если тенденция сохранится, то личные девайсы, например очки, с суперинтеллектом, который знает вас идеально, станут нашими основными вычислительными устройствами. Так или иначе,

оставшаяся часть десятилетия станет решающим периодом для определения пути, по которому пойдет человечество

.

Читать полностью…

Data Secrets

30 Jul 2025 16:06

Мы все ближе и ближе к этому мему

Читать полностью…

Data Secrets

29 Jul 2025 15:03

Это вам на случай переговоров с ИИ-думерами

Читать полностью…

Data Secrets

15 Aug 2025 07:38

Google выпустили Gemma 3 270М – одну из самых компактных моделей индустрии

Да, именно 270M, а не B. Совсем кроха, которую запустить действительно можно чуть ли не на утюге. Она и создана специально для этого, и даже оптимизирована с точки зрения энергоэффективности: в INT4 квантизации на Pixel 9 Pro съедает всего 0.75% батареи за 25 диалогов.

И кстати, для такого размера очень неплохие показатели следования инструкциям: на IF-Eval 51.2%. По этому показателю модель обходит даже Qwen 2.5 0.5В, который почти в два раза больше.

Для чего использовать:
1. Конечно, локальный запуск. Для кода не подойдет, но для генерации простого текста сгодится.
2. Быстрое простое дообучение под вашу задачу (например, под entity extraction или какой-нибудь sentiment-анализ подойдет отлично).
3. Edge/Internet of Things. Модельку реально можно встроить в колонку, чайник или холодильник и развлекаться 👉

Отличная штука для экспериментов, в общем

Веса

Читать полностью…

Data Secrets

12 Aug 2025 19:10

Окей, сейчас уже мало кого удивляют новости типа «робота научили перекладывать предметы», но это видео от стартапа Figure выглядит впечатляюще

Да, еще остаются мелкие косяки, но вы посмотрите, какие плавные и точные движения. Все, естественно, полностью автономно. Задача складывания белья вообще достаточно сложная, если подумать: полотенца мягкие, непредсказуемо изгибаются и деформируются.

Нет единого правильного алгоритма, важен высокий уровень гибкости. И тут вот как раз кроется самое интересное: Figure не обучали конкретно под эту задачу новую архитектуру, а просто взяли свою старую универсальную предобученную для работы на заводе модель VLA Helix (мы о ней вот тут частично писали), и затюнили ее на небольшом датасете.

Это на самом деле критически важно, потому что значит, что модель действительно универсальная на деле, а не на словах. Ей не понадобились архитектурные изменения, адаптеры или переобучение с нуля, то есть на объектном уровне в ней уже есть представления о любом типе задач. Следовательно, масштабировать подобное можно так же успешно, как и LLM.

www.figure.ai/news/helix-learns-to-fold-laundry

Читать полностью…

Data Secrets

12 Aug 2025 08:41

xAI подает в суд на Apple

Причина занятная: по мнению Маска, «Apple ведет себя таким образом, что ни одна компания в сфере ИИ, кроме OpenAI, не может занять первое место в App Store, и это нарушает антимонопольное законодательство».

Пруфов, естественно, пока никаких.

Где-то тяжело вздохнул один Тим Кук

Читать полностью…

Data Secrets

09 Aug 2025 13:47

Нашли тут для вас готовый ноутбук для файнтюна gpt-oss

Внутри все end-to-end, от скачивания модели и подготовки данных до обучения и инференса.

Еще и мощно оптимизировано, кстати. Моделька на 20В вмещается в 14GB видеопамяти. То есть теоретически запустится даже на бесплатных ресурсах колаба.

Ноутбук для 20В (его же можно использовать для 120В)

А вот тут лежат все текстовые пояснения к коду и «теория»:про то, как работает формат Harmony и почему он необходим, например. В общем все, чтобы запускать код не в слепую (хотя так тоже можно), а с достаточно глубоким пониманием.

Занятие на выходные что надо

Читать полностью…

Data Secrets

07 Aug 2025 19:08

Итак, кроме громких слов, что мы имеем:

– Модель действительно гибридная
– Говорят, что это лучшая модель для кодинга на рынке
– Первые бенчмарки (потом соберем их все в отдельный пост) наверху. Обратите внимание на 100% на AIME 25

(пост обновляется по ходу презентации)

Читать полностью…

Data Secrets

07 Aug 2025 13:10

GitHub случайно раскрыл детали о моделях GPT-5

В блог компании раньше времени утекла новость о добавлении в GitHub Models еще не вышедших моделей OpenAI. Конечно же новость быстро удалили, но доступ на архиве никто не отменял.

Обещают 4 версии:

gpt-5 — для логики и многошаговых задач.
gpt-5-mini — облегчённая версия для случаев, где важна стоимость.
gpt-5-nano — оптимизирована для скорости и минимальных задержек.
gpt-5-chat — для продвинутых, естественных, мультимодальных и контекстно-чувствительных диалогов, ориентирована на корпоративные приложения.

Из важного: свежая версия будет заточена под "расширенные агентные возможности", а также адаптирована под быстрое и точное решение задач с кодом с минимальным промптингом.

Получается, сегодня презентацию можно не смотреть 👓

https://www.theverge.com/news/752091/openai-gpt-5-model-announcement-github-leak

Читать полностью…

Data Secrets

06 Aug 2025 16:02

В России появится технологический кластер, который объединит несколько сильных компаний в сфере технологий для промышленности

О создании «СФ ТЕХ» сегодня объявили Softline. В него войдут несколько компаний из разных отраслей, которые планируют вместе комплексно работать над самыми перспективными областями индустрии: робототехника, лазерные и адддитивные технологии, IIoT.

В кластере объединились: VPG LaserONE (единственный крупный производитель волоконных лазеров в России), две компании из группы Борлас (эксперты по цифровизации и защите инфраструктуры) и Инферит (делают защищённый софт и железо).

Цель – перевести российскую промышленность на новый уровень за счёт объединения компетенций. По словам Softline, такой подход позволит не только диверсифицировать выручку, но и занять ключевые позиции на высокомаржинальных направлениях рынка.

Читать полностью…

Data Secrets

05 Aug 2025 15:55

Российские разрабы создали новый фреймворк, который сокращает расходы на разметку данных для языковых моделей в 3 раза

Команда из Т-Технологий, Высшей Школы Экономики, AIRI, Сбера и Университета “Иннополис” сделали ATGen. Он использует метод активного обучения и теперь модель может сама выбирать, что учить в первую очередь. По итогу модель требует размещать всего 33% от стандартного объема при выборке данных, а в наборе уже присутствует удобный интерфейс, включая поддержку OpenAI. Новый инструмент перестраивает подход к обучению ИИ, делая его доступным малым командам и компаниям без больших бюджетов.

Разработку показали на конференции ACL 2025 в Вене и уже залили на GitHub.

Для тех, кто работает с кастомными LLM — мастхэв 👩‍❤️‍👨

Читать полностью…

Data Secrets

04 Aug 2025 10:36

Китайцы не отстают и тоже выпустили модель, которая выиграла* золото на IMO

Она называется Seed-Prover и по ней, в отличие от моделей от Google и OpenAI, вышла подробная статья. Так что разбираемся 👇

Архитектурно Seed-Prover ну ооочень напоминает недавно вышедший DeepSeek-Prover-V2 (разбор мы делали вот тут). Модель точно также использует Lean (программу для формальной верификации доказательств) и разбивает крупную задачу на доказательство кучи мелких лемм.

Единственное отличие: в DeepSeek Prover система сначала намечает пайплайн и решает, какие леммы нужно доказать (дедукция) ; а здесь в начале без какого-либо плана доказывается много разнообразных фактов, которые модель считает полезными, и только потом из них собирается нечто общее (индукция).

Такой подход может показаться менее системным, но на самом деле он позволяет легко масштабировать test-time. С ростом бюджета ризонинга модель просто генерирует в начале все больше и больше лемм и/или тратит на их доказательство больше времени. Ну а чем больше полезных правильно доказанных фактов – тем вероятнее потом модель соберет из них верный ответ.

По метрикам: SOTA на MiniF2F-test, PutnamBench, Past IMO, CombiBench и MiniCTX-v2. Причем где-то приросты на 3-4х. Довольно мощно, ByteDance – хороши.

* Выиграла с поправкой. Модели от Google и OpenAI соревновались в основном зачете, а ByteDance пригласили в дополнительный (потому что а основном не допускается использование таких систем, как Lean). Плюс, за отведенное время Seed-Prover решил всего 4 задачи из 6, а пятую доделывал уже вне зачета. Но все равно – результат!

Статья | GitHub

Читать полностью…

Data Secrets

03 Aug 2025 07:10

HR из Meta поделился обыденной историей о том, как сейчас происходит найм в компании

«В основном я занимаюсь расчетом с персоналом. Работа спокойная. Стабильная.

Сегодня ко мне попал оффер с компенсационным пакетом база + бонус + капитал. На первый взгляд выглядит нормально. А затем я открыл детали.

1 000 000 000 долларов.
более четырех лет.
плюс подпись.
минимум за 1 год: 100 млн долларов.

Я смотрю на это, как на опечатку. Проверил имя. Трижды проверил грейд. Исследователь.

Окей, теперь мне нужно ввести это в систему.

Вставляю число, поле выдает ошибку. «Значение должно быть меньше 99 999 999 долларов». Лол. Попробую разделить. Не выходит. Попробую записать экспонентой. Не выходит.

система не может ОБРАБОТАТЬ миллиард долларов.

Я звоню кому-то из отдела по начислению зп. Говорю им, что у меня компенсационный пакет из 10 цифр. Они думают, что я шучу. Я пересылаю оффер. Они замолкают.

Следующее, что я помню, — это то, что в теме оказался глава администрации Цукера. Теперь я работаю с Цуком. Из-за числа.

А затем я узнаю, что парень просто отклонил оффер.
просто сказал нет. никаких переговоров. никаких возражений. просто... нет.

Этот человек отказался от миллиарда долларов так же, как отказался от десерта.

Я закрываю тикет. Удаляю черновик. И все переосмысливаю»

Стоит ли это как-нибудь комментировать?

Читать полностью…

Data Secrets

01 Aug 2025 17:19

Модель Gemini 2.5 Deep Think стала доступна пользователям

Это та самая модель, которая выиграла золотую медаль на IMO. По метрикам:

– Почти 35% на Humanity’s Last Exam против 21.6 у Gemini 2.5 Pro и 20.3 у o3
– 87.6% на LiveCodeBench против 72 у o3
– 99.2% (почти абсолют!) на AIME 2025 против 89 у o3

Короче, достойно. По выделяемому компьюту ризонинга это конечно не те мощности, с которыми модель выиграла золото (конкретно эту версию выдали пока только небольшой группе математиков), но даже в этой конфигурации она нарешивает IMO на бронзу. Тоже неплохо.

Работает Deep Think благодаря «параллельному мышлению». То есть запускается несколько потоков ризонинга, в которых пробуются разные гипотезы, а затем лучшие результаты комбинируются в конечный ответ. Google пишут, что чтобы научить модель такой параллельности, они разработали «новые методы обучения с подкреплением».

Единственный нюанс: чтобы получить доступ к модельке, заплатить придется 250 долларов. Ее, к сожалению, завезли только в подписку Google AI Ultra.

Карта модели | Блогпост

Читать полностью…

Data Secrets

31 Jul 2025 18:02

Про то, как работает ИИ в Авито

У TechIndsider вышло на редкость содержательное интервью о том, как бигтех на самом деле внедряет ИИ в сервисы. Главред поговорил с управляющим директором по ИИ в Авито Андреем Рыбинцевым (кстати, должность совсем новая, Рыбинцева назначили на нее недавно), и тот с занятными подробностями рассказал, как они используют ИИ.

Готовы поспорить, многие из нас пользуются Авито постоянно, но не подозревают, насколько глубоко там зашиты ИИ-алгоритмы. Так что вот вам просто несколько рандомных фактов из интервью:

➖ Каждый день алгоритмы Авито обрабатывают около 40 миллиардов кликов. "Уже после нескольких действий по косвенным признакам становится понятно, что интересно пользователю, что ему показывать, а что нет".

➖ 99% контента проверяется ИИ, и только 1% самых сложных вопросов передается модераторам. Если бы не алгоритмы, Авито пришлось бы нанять на 100 тыс. больше сотрудников.

➖ От 40 до 60% сделок на платформе (в зависимости от категории) проходит именно благодаря рекомендациям.

➖ Помимо этого LLM-ки помогают писать описания к объявлениям и отвечать на вопросы покупателей. И, кстати, монетизация в Авито – это тоже трансформеры.

А в будущем, как говорит Андрей, Авито вообще превратится в платформу, где между собой договариваются и торгуют не сами продавцы и покупатели, а их личные ИИ-ассистенты. Киберпанк?

Интервью полностью тут

Читать полностью…

Data Secrets

31 Jul 2025 07:48

Microsoft показали списки профессий, которые больше всего и меньше всего подвержены риску быть замененными ИИ

В список «неудачников» попали переводчики, историки, писатели, рекламщики, математики, дата сайентисты, веб-разработчики и даже модели.

Если вы с списке – не расстраивайтесь, мы тоже. Вот вам для профориентации несколько примеров из списка тех, кого ИИ заменит не скоро: медсестры, хирурги, механики, монтажники, посудомойщики, бетонщики, горничные, санитары, маляры. Думайте 😶

Кстати, подсчитали это Microsoft вот как:

1. Взяли анонимизированные данные о 100 000 диалогов с Bing Copilot в США и каждый запрос классифицировали по цели пользователя и тому, что по факту сделал ИИ.

2. По официальной базе рабочих процессов сопоставили каждую активность с конкретной профессией.

3. Для каждой профессии посчитали покрытие (доля рабочих активностей профессии, которые встречаются в данных), успешность выполнения задач ИИ и широту охвата (насколько полно ИИ покрывает конкретную активность).

На основе трех показателей считали интегральный индекс, и чем он выше – тем более вероятно, что профессия будет автоматизирована.

Ну что, завтра на завод?

arxiv.org/abs/2507.07935

Читать полностью…

Data Secrets

29 Jul 2025 17:29

В ChatGPT появился новый инструмент «Think Longer»

Его массово стали замечать у себя пользователи, но официального релиза еще не было. Кто-то говорит, что это GPT-5, но мы не обольщаемся.

Судя по твитам и Реддиту, это просто тумблер, который: (1) переключает вас на ризонинг модель (видимо, o3), если в данный момент вы пользуетесь не-ризонером; (2) активирует чуть больший бюджет ризонинга, если вы на o3/o4-mini.

Проверяйте, вдруг и у вас уже есть

Читать полностью…

Data Secrets

28 Jul 2025 08:05

Начинаем понедельник с ✨интересных фактов✨

Мы в сегодня лет обнаружили, что термин «галлюцинации» тоже придумал Андрей Карпаты. Почти все знают, что именно он ввел в эксплуатацию «вайб-кодинг», но это то было относительно недавно, – а вот корни «галлюцинаций» уходят еще в 2015 год.

Оказывается, тогда термин был впервые использован в известной статье “Unreasonable Effectiveness of RNNs” (ссылка), и с тех пор разлетелся по комьюнити, ну а дальше – в глобал.

Сам Андрей, кстати, пишет, что он «нагаллюцинировал это понятие» 👓

Читать полностью…

Subscribe to a channel