Все посты пишет нейросеть. Все совпадения случайны. https://t.me/+LCl2vrG-P8I0YTli
Мы тут в Entrepreneur First решили покастдевить.
Раз я дата+блокчейн пацан, я решил изучить, какие дата провайдеры сейчас в моде, что хорошо и что плохо.
Если вы делаете web3 проект и платите какому-то 3rd party data provider за что-то, я бы очень хотел понять, почему вы выбрали его и чем вы недовольны. Если вы вместо этого решили разворачивать свою дата инфраструктуру, было бы интересно узнать причины.
👾 Пишите в личку @okhlopkov
Когда в фильмах показывают контакт с инопланетянами, мы часто общаемся с ними на языке математики.
Я могу не знать всех мат терминов на английском, но всегда можно определить что-то непонятное через ∑∀⊚≡∉∪⋆
Это я просто решил заботать теорию групп для лучшего понимания ZK, потому что почему бы и нет. Я же не с ФИВТа, мы это не проходили. А тут есть даже PhD по этой хрени.
Ботаем по: leastauthority.com/community-matters/moonmath-manual/
4х летняя Архитектура @ffmemesbot
После обновления поиска телеги бот начал вирально расти в разных странах и я задумался, что же с ним делать дальше. Но даже если ничего и не делать, текущая реализация нестабильна и полна ужасов.
В основе лежит django-telegram-bot с синхронной ORM и огромном оверхедом по RAM от джанги и селери. Руки чешутся переписать на фастапи, я как раз научился это делать нормально.
Я записываю все просмотры и реакции на мемы в одну большую таблицу Postgres, которая уже больше 50М. Понятно, что есть индексы, но диск пухнет, бот становится медленнее и уже не умещается на микро тачку на Digital Ocean. Покупать еще серверы не хочется, ведь бот не планирует приносить бабосики. С одной стороны, это полезные для анализа данные, с другой — звучит неправильно обрабатывать в риалтайме десятки миллионов строк, чтобы выдать мем. Или нет?
Да и рекомендательная система сейчас простенькая: для каждого мема, паблика (откуда я взял мем) и юзера я считаю попарные статистики в бекграунде, а потом по ним в риалтайме сортирую все непросмотренные юзером мемы. Работает быстро, без какого-либо ML, но хочется больше % лайков. Платить за гпу нет сил. Есть эксперты?
Еще хочется максимизировать виральность бота, но тг не дает стату о перессылке сообщений. Туда даже диплинк нормально не вставишь.
Еще отдельная боль с дублированием мемов. Алгоритм “достать весь текст с картинки и дедублицировать мемы по этому тексту” работал хорошо, но кредиты на GCP давно сказали чао-чао.
Что бы вы могли тут посоветовать? ChatGPT спам боты, к вам тоже этот вопрос.
Надо, наверное, рассказать про Entrepreneur first, да?
Окей. Это акселератор. Но не как YCombinator, куда ты подаешься с командой и идеей. В EF набирают фаундеров-одиночек, которые хотят сделать стартап, но у них пока нет ни идеи, ни кофаундера. В Antler примерно также.
Из-за того, что они инвестируют свое время и деньги на еще более ранней стадии, они возьмут от твоего будущего стартапа больше других: 10% за 145к фунтов (из которых 65к ты отдашь за услуги акселерации).
Зачем я пошел в EF:
1. Вдруг получится сделать еще один стартап, а тут сразу и деньги, и норм нетворк эдвайзеров.
2. Практика английского и нетворкинг с такими же, как я, но со всего света.
3. Они платят стипендию 2к три месяца. Пригодится.
Когорта набралась 43 человека. Я думал, что будут одни студенты, но оказалось, они в отдельной grad когорте. У меня все либо с PhD, либо где-то заметно поработали, либо ex-founders. Все где-то 25-29 лет.
Йоу, запись подкаста с одним из самых интересных гостей!
На пикчах лишь несколько мыслей от Дани. Послушай фулл версию и вынеси много нового для себя
ЗАПИСЬ ПОДКАСТА
Моя DS-карьера началась с Kaggle, а потом резко свернула ближе к Data Engineer / Product Analyst. Мои ML скиллы почти нигде мне не пригодились: я либо парсил и складывал, либо автоматизировал SQL. Конечно, у меня есть запатентованный ML-алгоритм, но там тупо Random Forrest. К тому же, ничего умнее пары эвристик на SQL не взлетело в @ffmemesbot. А больше нигде ML мне как будто не нужен был.
Какой же ностальгический кайф я ощутил, разбирая нестандартные ML приемы из лекции Станислава Семенова, которую он дал после 2 лет работы квантом и за год до основания своего хедж фонда. Тут не будет многоуровневого стейкинга, только примеры из реального мира. Можно догадаться из какого. 😮🤫
Как увеличить скор ваших ML моделей:
🔗 okhlopkov.com/kaggle-tricks-from-grandmaster-hft-quant/
Найди своего начальника на фотке
🔗 t.me/potylitcyn/286
Хочу спарсить все нормальные тг чаты на около-IT темы. В каталогах tgstat как будто один инфобиз шлак.
Определим нормальные тг чаты: те, которые вы когда либо кому-то советовали, скидывали или сами читали. Они обычно небольшие и могут быть, например, добавлены в подборки.
Никто не видел, случаем, каталога с тг папочками? 😋
Интересно, как можно алгоритмически найти такие чаты? Получить список абы каких можно и через тг поиск, и через tgstats, но как дальше понять, что он норм?
Разгадал загадку, как можно скачать полный список подписчиков своего тг канала, если Телега выдает только 200 последних.
🤓 Воспользоваться поиском по подписчикам 🤓
Генерим различные поисковые запросы, состоящие из 1-2 букв. Коллекционируем результат, пока len(result) > 99%
*
followers_count
.
Больше деталей и кода в источнике:
🔗 okhlopkov.com/how-to-get-a-telegram-channel-subscribers-list-in-python/
Пиарю свой линкедин, как пиарил этот канал - выкладывая #датасет!
🔗 linkedin.com/posts/danokhlopkov_ycombinator-launch-database-almost-a-year-activity-7099344780945436672-dTuW
Матвей вырастил с нуля и управлял нашим комьюнити в дискорде (50к) и твиттере (60к). Он также выбивал 6значные гранты и помогал уменьшать хаос от многочисленных b2b партнерств.
Незаменимый многорукий чувак для любого web3 стартапа. Он не просто Community Manager, он Business Developer.
Найми его за доллары.
🔗 /channel/alphaomegacat/55
Затехал свое CV и продолжаю искать работу в Лодоне.
Читать продолжение в источнике:
🔗 https://www.linkedin.com/posts/danokhlopkov_daniil-okhlopkov-cv-activity-7086689709401202689-WfPS?utm_source=share&utm_medium=member_desktop
Звучит банально, но всегда фиксируйте цифры после договоренностей.
Я помогаю людям, которые мне нравятся, которым я доверяю, поэтому ленюсь фиксировать числа. Но никто им не мешает в последствии сказать «первый раз слышу», ведь бизнесу выгоднее тратить меньше, чем больше.
Всегда кажется, что рано обсуждать числа до убитого медведя, что это мелочно, что это непрофессионально, но на самом деле наоборот.
Как это делать? Простой текстовый фоллоу-ап с результатами после звонка или встречи.
Хочется просто творить, помогать и делать мир лучше, а не вот это все.
👩🏻💻 Господа разработчики, какими GPT/LLM тулами вы пользуетесь?
Все говорят, что чтобы вас не заменили нейронки, вы должны научиться ими пользоваться. Сомнительно, но окэй.
Помню, пробовал Copilot, который иногда угадывал, что я хочу написать. В итоге получался удобный автокомплит (когда срабатывал). Но это было давным давно (год назад).
Попробовал жестко обхайпленный gpt-engineer — он прикольно генерит бойлерплейт приложения, но кажется, что проще на гитхабе найти актуальные темплейты, чем заставить его за тебя написать что-то юзабельное.
Какие нейроштуки действительно ускоряют / упрощают жизнь разработчика? Поделитесь в комментариях. 👇
После вечного бана в инсте, признаюсь, у меня была ломка по сториз.
~not anymore~
Жалко только, что этот канал “деловой”, — если и пилить видосы, то сразу на ютуб. Не очень понимаю, какие сториз могут снимать фаундеры/разрабы, разве что фоткать мониторы под NDA типа “я работаю”. Но посмотрим, может, гроусхакеры придумают что-то полезное, как было с папочками в телеге.
Метаверс от Meta
Марк Цукерберг дал интервью Лексу Фридману в Метаверсе (beta).
Предварительно Лекс приехал в специальный офис, где его отсканировали, попросив показать определенные эмоции и сказать фразы. Цель: сделать такой скан возможным с телефона.
В итоге получается твой аватар с кучей параметров, которые отвечают за прищур глаз, глубину улыбки и тп. Во время передачи шлем измеряет эти параметры и передает по сети только их, вместо 2D/3D картинки.
Стратегия Меты - сделать mixed reality доступной для большинства, в отличие от Apple, продающей шлем за очень очень дорого.
На подкасте они еще обсудили корабль Тесея (твой аватар может остаться накаченным) и AI ассистента (который логинится в твой аватар и за тебя общается с другими людьми).
По его словам, интерфейсы будущего позволят просто сказать, а не нажимать кнопки, и тебе ответят понятным языком, а не текстом.
Цените тех, кто рядом оффлайн.
🔗 youtu.be/MVYrJJNdrEg
🚀 Симулятор стартапа
Ты - фаундер, есть $40k в банке и 120 дней до питча и демо дня.
Цель - дожить до демо дня и набрать как можно больше пользователей.
🔗 https://sillycovalley.com/
Делитесь стратегиями и скриншотами в комментах
Нет, только не сториз.
/channel/danokhlopkov?boost
Прочитайте статью. Если все поймете, то можете претендовать на статус “шарю за LLM”.
🔗 t.me/lovedeathtransformers/6313
Сижу на митапе PyData. На скрине результаты опроса, какие вообще ML модели люди используют в проде.
Читать полностью…Лекция от ex-Топ1-Кагглера после 2+ лет работы квантом выглядит как сливы Овчинкина.
🔗 youtube.com/watch?v=ldNZapF8PDY
Let’s imagine that we can use only linear models...
🧠 С днем знаний!
Решил я понять чуть больше про свою аудиторию. Попросил вас скинуть норм чаты, спарсил всех участников (где открыто было) и посмотрел, в каких чатах сидят подписчики этого канала.
В итоге, собрал руками 84 чата, в которых сидит 46% моей тг аудитории (поиск вширь по чатам скоро).
Топ3 со скрина:
1. Product Hackers - мой 5летний чатик по обмену лайками на Product Hunt.
2. Startup Never Sleeps - международное IT комьюнити от @thingsiread, в котором я лет 8.
3. Phystech.Career - вакансии для МФТИшников (лет 10).
Не видел тулов, которые дают подобный анализ, поэтому если кто-то из моих знакомых захочет +- такое же для своего тг канала — цифры знаете.
♽ Надоело.
И вот в ~6 раз, после ~4 этапов интервью, я получаю отказ, потому что не вписываюсь идеально ни в одну позицию. Всегда есть кто-то, кто 7 лет делал конкретно это, да и еще ex-Meta. А из-за “we want to keep our team relatively small” никого, кроме 100% match, не хотят брать.
Говорят, что в Лондоне нормально искать работу годами. Что нормально рассылать сотни откликов на все подряд. Что нормально в перерывах брать контракты, чтобы выживать.
Я же должен влюбиться в компанию, в миссию и идею, чтобы дойти до конца. И в конце услышать, что wear a lot of hats на самом деле плюс в начале воронки, но минус в конце.
Мой личный Уроборос длинною в 2 месяца: отклики, собесы, отказы, repeat.
Game over. Insert coin to continue.
Больше данных для связки EVM адрес + твиттер. Теперь это 100к юзеров friend tech - нашумевшей NFT коллекции на Base, где можно купить NFT любого Твиттер аккаунта. 🤦♂️ Конечно же за логин в твиттере и дырявый бекенд. 👏
🔗 gist.github.com/banteg/76d141fea2e658e5d2854944342f2d3d
UPD: данные скрыли. Всем спасибо 🤝
Когда только появились сторисы в инсте, их можно было смотреть миллионами. Замечали, что какие-то огромные блоггеры почему-то интересуются вашей жизнью? Подписались ли вы в ответ? Многие да.
Телеграм уже начал раскатывать доступ в сторисы для бесплатных аккаунтов. Значит, скоро все начнут что-то постить и подглядывать, кто следит за ними.
Специально для любимых подписчиков выкладываю рабочий код для массового просмотра сториз в телеграмме. Всех тонкостей не раскрою, но уже можно начинать делать SaaS поверх этого.
🔗 gist.github.com/ohld/9ab13034c1796ca79db19c50eab47684
Что делать, если твоя основная мотивация - это любопытство?
Когда-то я хотел стать физиком. Ведь если понять основной закон, по которому работает наша вселенная, из него можно вывести всё. А познать всё очень сильно хотелось.
Оказалось, что человечеству далеко не только до Теории всего. Остальные науки оперируют таким количеством эвристик и грубых моделей, что даже полное познание физики не позволило бы понять, как полностью избавиться от аллергии.
Казалось бы, если ты такой умный любопытный, иди и изучай любой раздел физики, загадок везде хватает. Проблема в том, что в одиночку можно заниматься только очень узким набором задач. Даже если ты международно признанный ученый, значительно повлиять на глубину человеческих познаний скорее всего не получится. А значит и понять, как же все на самом деле устроено.
А еще для счастливой жизни (по Чиксентмихаю) необходимо получать регулярную обратную связь на свою деятельность. И в науке это крайне сложно. Можно 30 лет заниматься термоядерным синтезом и до самой смерти не получить значительных результатов. Даже при хорошем развитии событий, ревью статей происходит долго, а практическое применение может наступить уже через поколение.
Поэтому хочется заниматься не наукой, а чем-то другим. Чем можно поменять границы познания человечества сразу в нескольких областях. И ощутить влияние своей деятельности хотя бы в этом веке.
Помимо администрирования науки (менеджмента НИИ) я придумал только три способа:
- политика (перераспределение ресурсов на то, что тебе интересно с помощью своей власти)
- инвестиции (с помощью чужих или своих ресурсов)
- бизнес (похоже на инвестиции, но с большими затратами своего административного ресурса)
Решил я, значит, что 3 сервера для pet projects это не очень affordable и что один можно переиграть и уничтожить. Для этого надо всего-то перекинуть self-hosted Ghost blog и e-commerce tg bot с одного сервера на другой.
Step-by-step guide:
- Навалить музла.
- Налить безлимитного сидра из виворка друга.
- Скачать по scp себе на ноут дампы бд блога и тгбота, а потом закинуть их на сервак и влить в свежезадеплоенные бдs.
- Дампы закинуть на внешний диск для внуков.
- Зайти в Cloudflare по двухфакторке через Authy, перекинуть домены на новый IP.
- Пройтись по моему гайду 2021 года по деплою Ghost блога через Dokku.
- Триггернуть деплой Github Actions, надеясь что DNS кеша на GA тачках уже нет.
- Не завестись с 1го раза, фиксануть envs и tg bot webhook urls + ssl.
Поздравляю, вы все еще прекрасны и безработны.
Лучший учебник по FastAPI, который я когда-либо читал.
Для тех, кто уже умеет пользоваться FastAPI, но не всегда понимает, как сделать kpacuво, масштабируемо и без говнокода. С примерами и темплейтами.
🔗 github.com/zhanymkanov/fastapi-best-practices
Как эмбеддить и кластеризовать огромные соц графы (миллионы вершин) на примере данных из Телеграма.
Вершина: тг канал
Ребро: упоминание другого канала
🔗 t.me/sv9t_channel/1431
#датасет 45М реакций на мемы из @ffmemesbot.
Интересно, кто-нибудь сможет это отрисовать как-нибудь?