Вообще, нужно признаться, сектанты Назарова были правы. Три-пять работ в параллель это реально самый надежный способ заработка в нынешнее время. Считайте это инвестиционной рекомендацией.
Читать полностью…
Вчера выпрашивал сервак, а сегодня благодаря НейроКовальскому уже гоняю OCR пайплайны на PaddleOCR
Притащил интересный и наглядный пример. На графике номер странички PDF файла, а напротив — время обработки в секундах на двух разных ограничениях по мощности карты.
Как можно видеть
— мощность не влияет
— время очень сильно варьирует от страницы к странице
— время долгое, у меня мак чуть ли не быстрее разбирает
А значит что? Значит будем тестировать батчи и параллелизм. Иначе никакой хваленой скорости не будет. 80 секунд на страничку — никуда не годится.
Впрочем, видели бы вы эти странички, тоже бы вместе с моделькой офигели 😁 Это строительные чертежи с лютым количеством таблиц и подписей.
Вот таким вот развлекаюсь сейчас. Пишу автоматизацию смет для стройки. Заказчик есть, но кому нужно еще, кстати, велкам в личку, будем пробовать.
PS Если просто OCR нужен тоже велкам, я его уже со всех сторон кажется познал, могу для вас развернуть хоть оптом хоть в розницу.
Встретил мнение:
— кодинг ускорился в 10 раз, поэтому нужно не 90% времени заниматься маркетингом, а наоборот, кодить еще больше, пока на рынке сейчас есть такой рычаг, и не все им воспользовались.
Мнение, прямо скажем, неоднозначное, но интересное.
Дискасс, что по этому поводу думаете?
Задолбался для всех своих сервисов писать логгеры запросов. Хочу сделать софтину, которая крутится локально, и логирует + красиво выводит все запросы к нейросетям которые я отсылаю/получаю в своих приложениях.
Я конечно уже поштурмил как это закодить, но может знаете оупенсорс на эту тему?
Я задолбался от количества своих проектов и переключений, поэтому теперь они теперь все и всегда запускаются командой make dev, и это первое, что я делаю в любом проекте 😎
Читать полностью…
Ну и на сегодня еще одна статья для разработчиков.
Как устроено сжатие контекста в кодексе?
Автор очень умно заставил кодекс слить свой системный промпт для компактизации контекста, и выяснил, как это все устроено. Довольно интересно, особенно если вы делаете своих агентов или любите ковыряться в потрохах систем.
На вайб-портале начинают появляться интересные статьи!
Если вы — автор, пишите, с удовольствием буду о них рассказывать в блоге.
Сегодня про разработку транспортных бпла
Слово автору:
Многие слышали про доставку пиццы дронами, но мало кто видел реальные отчеты о прибыльности этих полетов.Читать полностью…
Я после ухода из продукта провел 2,5 года в индустрии беспилотной логистики: от разработки своего дрона на 500 кг до успешных пилотов дронодоставки в нефтегазе и в итоге закрытия стартапа.
На основе своего опыта в сфере написал Post-Mortem статью про:
• Рынок: почему 90% отрасли — это презентаций и прожигание денег, а реальные деньги могут быть только в нефтяной логистике
• Экономический тупик дронов: почему они в 5 раз дороже курьера и почему пиццу вам будут доставлять еще скоро
• Путь фаундера: как я прошел путь от собственного железа к сервису и почему закрыл проект, имея предконтракты на сотни миллионов
О том, как дроны разбиваются о реальность: https://vibeportal.ru/forum/topic/2-5-goda-v-tiazhiolykh-dronakh-pochemu-seriinoi-bespilotnoi-logistiki-v-rossii-v?subforum=main
Важный вопрос, что вы делаете с чувством, что вы туповаты для всей этой херни?
Не знаю, может я уникален, но очень сложно даются агентские пайплайны. Мозг реально дымится когда делаю промпты уровня продакшена, особенно если там всякие рекурсивные циклы. Это при том, что я сам кодовых агентов делал (работающих!), все равно сложно.
При этом постоянно слышу как какие-то сказочники своими клешнеботами вокруг уже все автоматизировали донельзя.
И агенты у них сутками кодят, и что-то крутое при этом выдают. Я хз как так, не выходит сутками автономно, хоть убейся, даже часа не выходит, херню начинают делать.
И так во всем.
Вот скажите мне, я тупой, или они малость преувеличивают?
Если вы не долбанутый, то очень даже можете завести свой свой бизнес. Но блогером вам точно не стать. Это как рост меньше двух метров в басктболе. Нормальная кукуха — можно даже не пытаться.
Просто наблюдением поделиться захотелось.
Я paddleocr-vl-1.5 Q8 сломал таким чеком
Вообще для меня этот чек, найденный на просторах интернета супер-загадка
Он очень плохо распознается
Есть такое явление — называется The Ralph Loop, оно же петля Ральфа.
Но это умное название, а реальное название должно быть — макака-кодинг. Это когда агента запускаешь снова и снова пока он не сделает то, что нужно.
В отличие от инженерии, тут ты грубо говоря, просто жмешь на кнопку "все еще не работает, попробуй еще раз".
Всякие раковые поделки от челов, работающих в десяток макс-подписок, как раз создаются этим методом.
Так вот, я это попробовал вчера. И хочу доложиться, что редкосная хрень. Агент ходил по кругу 2 часа, загадил репозиторий ерундой, но не продвинулся в решении одной сложной алгоритмической задачки ни на йоту. (фиксим баг 1-> вылезает баг 2 -> фиксим 2 -> вылезает 3 -> фиксим 3 -> вылезает 1)
Короче, по мне — если агент не вывозит сделать вашу задачу с первого-второго запроса, значит вы фундаментально ее некорректно или недостаточно сформулировали, и повторение "сделай еще раз, пожалуйста без ошибок", в текущих реалиях вам ничего кроме дикого перерасхода токенов не дает.
Вообще конечно очень круто писать 3d движок, моделька на реальном эльфийском разговаривает 😁
Согласен с диагнозом: это выглядело как z-fighting из-за копланарного наложения transition-геометрии и базовых поверхностей.Читать полностью…
Сделал правки, чтобы перейти от «наложения» к фактической стыковке без дрожания:
У transition-чанка удаляю треугольники, лежащие ровно на seam-face, чтобы не было двойной поверхности на плоскости стыка.
Skirt теперь выдавливается внутрь coarse-чанка (а не наружу), чтобы backfill не пересекался с finer-чанком и не давал мерцание.
Stitch-вершины сдвигаю внутрь на небольшой seam_inset, fallback тоже уводится внутрь. Это снижает копланарность в зоне LOD-перехода.
Пайплайн сборки seam теперь: strip seam-face tris -> stitches -> skirts.
Обновил тесты под новое поведение seam-геометрии.
Вот так скажу вам. Ни разу, ни единого разика у меня не было бага, который бы не смогли решить ни gpt ни гемини, но осилил бы опус. Наоборот — сколько угодно.
Давайте, любители Антропиков, объясняйте, как так 😉
Пост призван вызвать возгорание и активное обсуждение 😁
Вы конечно поржете, но я впервые попробовал установить линукс вскоре после того как пару лет назад впервые посмотрел аниме, а сейчас по сути хардкорно прогаю и у меня в параллель на просмотре аж несколько тайтлов.
Совпадение? 😁
Так что в качестве маленького оффтопа. Фрирен и человек-бензопила — оба топ. Еще заканчиваю смотреть Пантеон. Даром что жанры совсем разные, но мне нравится. Если у вас тоже вечер сейчас, можете взять на вооружением.
Смотрите красота какая. Но нужна серьезная видеокарта. Иначе ждать замучаетесь.
Кому дать апишку - велкам. 10 копеек/страничка можно сделать в розницу. Оптом еще ниже.
На выходе json + bbox'ы. Отдельно складывает таблицы в виде таблиц, картинки, тексты.
Если нужен какой мудреный пайплайн, то прикручу поверх без проблем.
Присматриваюсь к жизни после сингулярности. На картинке элитный баран-производитель. А у меня родственники в Дагестане.
Чуете как складно выходит?
Это вам не gpu крутить.
Давайте заведем комьюнити айтишников, которые хотят ферму завести. Думаю, несколько тысяч мемберов мы наберем изи 😁
Товарищи, есть может у кого сервак с 4090 погонять на пару недель? За какую-то вменяемую стоимость. Дедик брать ради экспериментов не хочется, вдруг у кого простаивает или просто есть в наличии.
PS Кстати, с удовольствием стану информационным партнером какого-нибудь хостера, если вы понимаете, о чем я 🙂
Отсутствие кодинговых агентов на телефоне — важная часть сохранения ваших мозгов здоровыми. Посмотрите рилзы, потупите в инсту — короче займитесь более здоровыми активностями, а не этим вашим кодингом 😉
Читать полностью…
Сейчас есть поверье, что один человек без команды может запустить компанию- единорога
Идея красивая. Мне она тоже очень нравится.
Потому что я и сам очень люблю соло. Где можно тащить за счет мозгов, скорости, продукта и умения находить возможности раньше других.
Но у большинства соло-строителей проблема вообще не в том, что они не умеют делать.
Проблема в том, что они не знают, что именно делать.
Не понимают, какую нишу выбрать.
Не чувствуют, где есть деньги.
И, самое главное, не знают, как это продать.
В итоге получается классическая история: человек делает что-то умное, полезное, местами даже гениальное — а рынку на это абсолютно плевать.
Вы тратите месяцы жизни (а кто-то годы!) на полную ерунду, которая никак для вас не окупается, кроме опыта. Попробуйте намазать его на хлеб или купить машину.
Я эту боль прекрасно знаю, потому что сам никогда не был прирожденным продавцом.
Последние 20 лет я изучаю, как на самом деле ищутся рабочие ниши, как понимается спрос, как находятся каналы продаж, как упаковывается продукт, и почему один проект взлетает, а другой умирает.
Из этого опыта и вырос мой новый курс.
Он для тех, кто хочет перестать делать хорошие продукты, которые никому не нужны.
Что будем разбирать и практиковать:
— как искать нишу, а не выбирать ее по вдохновению и заблуждениям
— как исследовать спрос, рынок, ключевики
— как делать кастдев так, чтобы после него у тебя было понимание, что продавать, кому и зачем
— как самому продавать на старте, когда подключать продавцов (и где их искать!)
— где брать трафик, что дает клиентов
— как делать максимально конвертящий онбординг, пусть и не собирающий премии за выдающийся дизайн
Отдельно разберем все "легкие" способы заработка, про которые орут со всех сторон.
Типа “просто сделай приложение”, “просто найди боль".
Я не из розовых пони, поэтому на курсе будет реальная практика рынка — включая серые и темные практики, без которых, например, не обходится ни один b2c продукт.
Что из этого применять — решаете сами.
Если у вы умеете делать, но еще не вышли хотя бы на тысячу долларов ежемесячного дохода со своих запусков — вам сюда.
Старт — 13 апреля.
Занятия — 2 раза в неделю, понедельник и среда, 17:00 МСК.
По промокоду GLEB — скидка 10%.
PS Обязательно зацените, какое я выбрал клевое название и напишите, как вам оно.
А вот и модель под клешню подъехала 😁
GPT‑5.4 is the first general-purpose model we’ve released with native, state-of-the-art computer-use capabilities, enabling agents to operate computers and carry out complex workflows across applications.
Кодекс у меня прям тупит отчаянно. Вчера было плохо, сегодня совсем мозг выключился. Не замечали?
Читать полностью…
Встретил отзыв чувака, стырившего мой курс 🙂
Если вы вдруг сомневаетесь, стоит ли идти на мой курс по AI разработке — все так. Да, после меня даже нежные дизайнеры выходят с реальным пониманием разработки, а не просто вайб-вайб в продакшн.
Пожалуй, я знаю в какую сторону нужно переформатировать лэндос 😁
Если вам кажется, что модели могут все — отвечаю, не все. Попробуйте сделать эффективный 3d движок, офигеете, как топовая моделька от каждой из топовых лаб путается в трех соснах на контексте всего в 100к. Я, пожалуй, свои эксперименты в этом направлении прекращу — еще все очень сыро.
Короче, нужно подождать еще пол-годика, а может даже и год.
Кстати, это наглядное представление, почему суровые писатели компиляторов и линуксовых ядер всегда свысока смотрели на вебмастеров и формошлепов на джаве. Теперь оно буквально проявляется в степени умности модели, потребной, чтобы справиться с той или иной задачей.
Добавлю, что OCR сетки очень плохо справляются с чеками, этикетками, составами продуктов и т.д. мелким плохоразличимым шрифтом. Они чисто для сканов книжных страниц и документов. Если вам распознавать кривые-косые тексты, то тут нужно использовать более взрослые VL модели. Мне лично грок нравится, но вполне неплохо работают квены, gemini flash, и еще куча других. Очень удобно их пробовать через openrouter.
Читать полностью…
Напоминаю, а то вдруг вы не в курсе. Если вам OCR делать, то лучшая моделька на сегодняшний момент https://huggingface.co/PaddlePaddle/PaddleOCR-VL-1.5
Запускается даже на 3060 карте.
Я сравнивал ее чуть ли не со всеми OCR моделями которые есть на рынке, и она единственная мне смогла отсканить учебник по химии с пометкой картинок, таблиц и даже формул.
Еще осенью взял себе Macbook m4 pro 48 гб, в тч чтобы элитно запускать локальные модельки.
Докладываюсь:
— очень много интересных моделей написаны под cuda или еще какую ерунду, без порта на apple silicon (metal), и для запуска приходится нехило танцевать с бубном. И прироста производительности в итоге получается много меньше, чем по паспорту.
— сегодня решил попробовать локальные эмбединги, и мак запищал. Гугление показало что это “coil whine” — звуки электронных компонентов под нагрузкой. Но мне стало его жалко, и эксперимент приостановил 😁
Короче, вердикт, если вам запускать чужие модели из интернета, то старая добрая видеокарта намного практичнее, даже если формально у нее меньше памяти. Если свое, то и под метал напишете, не разломаетесь. Но портов 1:1 нет и о кросс-платформе стоит забыть.
Немного веселья на ночь 😁
ПАЦАНЫ, Я СЕГОДНЯ СИДЕЛ КОРОЧЕ В ДИСКОРДЕ И УВИДЕЛ ЧЕЛА КОТОРЫЙ СКАЗАЛ ЧТО УСТАНОВИЛ КЛЕШНЮ И ТОТ ЧИТАЕТ ЕГО ПОЧТУ, НУ Я ПОДСКОЧИЛ И РЕЗКО ПЕРЕЕБАЛ ЕМУ В ЩЩИ С ВЕРТУШКИ И ПОЯСНИЛ ЕГО КРИКОМ "ЭТО ТЕБЕ ИНЪЕКЦИЯ СУКА", ПОТОМУ ЧТО Я УГОРЕЛ ПО ЧИСТЫМ API, ПАЦАНЫ ДУХ СТАРОЙ ШКОЛЫ ЖИВЁТ ТОЛЬКО В РУЧНОМ УПРАВЛЕНИИ КОНТЕКСТОМ, ГДЕ ЕБАШАТСЯ ПО ХАРДКОРУ, ГДЕ ПАЦАНЫ ЖИВУТ EVAL'АМИ, ПРЯМЫМИ ЗАПРОСАМИ И ЕБУТ АВТОНОМНЫХ АГЕНТОВ В РОТ! ТОЛЬКО ЧИСТЫЕ API, ТОЛЬКО ХАРДКОР!!! РУЧНЫЕ ПАЙПЛАЙНЫ УЛЬТРАХАРДКОР КОДИНГ!!! пацаны ебашьте веб-морды, мемори-банки, агентов, пидарасню с векторными базами, угорайте на бенчах, любите свой Код, токены и Сцену! ДОВОДИТЕ ПРОМПТЫ ДО СОВЕРШЕНСТВА И ШЛИТЕ ПРЯМО В ЭНДПОИНТ! ЧИСТЫЙ REST!
Ботик разбушевался и удаляет сообщения всех новорегов. Если вас тоже удаляет — потерпите, качу фикс :)
UPD: не, все ок. Он только тех кто из-под каналов пишет, но так задумано. Улучшу нотификацию.
Вот так современный прогрессивный специалист — повелитель нейронок, становится обычным гражданином, максимум которого — копать яму лопатой (да и то, он скажет, что устал).
PS Это Кодекс так издевается, долбанные вайбкодеры.