Сходила в консульство. У меня опять админ проверка, коллекционирую желтые бумажки 📝
на этот раз даже дали ее на русском. Тренд на персонализацию под клиента дошел и до гос учреждений, получается)
#O1
Небольшой визой апдейт: меня позвали в консульство на еще одно очное собеседование 20го марта в Белграде. Так или иначе, похоже, скоро все решится.
Для новеньких: я делаю визу талантов США уже больше 2х лет с кучей интересных кейсов (от попытки отзыва статуса таланта консулом до пинга консульства через сенатора), из которых больше года сижу на проверках. Подробнее про эпопею можно почитать по #O1
Считаю, что пора и мне запромоутить чат, существующий вместе с этим каналом. Пользоваться им можно для нетворка/обсуждения визы/стартапов/моделек. Вероятно, это удобнее, чем общаться в комментах 💻
/channel/+RxvUW07GEbFl7mHw
Если бы я родился 100 лет назад и увидел бы это видео, то я бы стал «адвентистом второго пришествия пластикового стула», серьезно вам говорю, представьте каково будет «уфологам» в эпоху генеративных видео.
Даже ошибки модели SORA интересно рассматривать
НЕ ИСПОЛЬЗУЙТЕ ЧАТГПТ ЧТОБЫ ПИСАТЬ ТЕКСТЫ С НУЛЯ 😭😭😭😭😭😭
Проверять грамматику — ок. Просить написать с нуля — не ок.
Последние недели я общаюсь с большим числом фаундеров и вижу огромное число постов/питчей каждый день, и как же сильно палятся сгенерированные посты через revolutionize, blending, tailored, empower и тд.
Я читаю абзац и не могу понять смысл питча/поста из-за этих слов, которые как чернильные пятна закрывают изначальный смысл.
Еще одна забава на продукт ханте: боты, которые пишут при помощи апи гпт комменты в дискуссиях, чтобы набрать классы. И вроде коммент-то нормальный может быть (с хорошим промптом видимо), но потом тебе прилетает еще два слово в слово таких же.
Представляю, сколько нагенерированных заявок жюри YC будет читать этой весной)) будто бы простые человеческие ошибки в духе не того артикля скоро будут плюсом, а не минусом 😂
upd: в процессе обсуждений напомнили про классный пост Вастрика
начала заполнять профиль для aesty на продакт ханте, а там почему-то Цукерберг на тэге "fashion" 🤪
я бы поняла еще если бы был Джефф Безос, которого одевают 10 стилистов..
ребят, а кто-то пробовал делать global talent на основе портфолио o1? 🤣
если были такие прецеденты, расскажите, пожалуйста)
upd: рекомендации юристов по global talent тоже очень приветствуются
как же я люблю суммаризацию от loom для русского языка 😂
хотели бы послушать питч про лайфхейст и анимацию с короткими дверями?
⚡В openai появился стор с моделями от разработчиков из комьюнити под разные задачи (не только gpt, но и другие)
вот кое-что интересное:
1. VideoGPT (генерация небольших роликов)
2. Canva (ассистент для дизайна)
3. Humanize AI (переписывает сгенерированный текст в более понятный для человека формат)
4. Math solver (решает сложные математические задачи, объясняет пошагово решение. Охх, как мне этого в вузе не хватало!)
много для кодинга, но мне если честно обычной gpt-4 без файнтюнов вполне хватает) и конечно там уже несколько AI Stylist поселилось!
Обещают в Q1 выкатить монетизацию 💸
Мой топ voice tech продуктов и архитектур за 2023🌟
1. Adobe Podcaster — отличная тулза для улучшения качества звуковых дорожек на английском языке. Явно архитектура не была указана, но путем дедукции мы выяснили, что же там под капотом (см ссылку)
2. Riffusion — text prompt melody generation. Первая версия появилась в декабре 22го как петпроджект с максимально простой идеей: использовать stable diffusion на спектрограммах. После хайпа за год ребята выросли и сделали свой софт для генерации небольших музыкальных открыток с музыкой и пением. Вышло очень здорово
3. CLAP — нейронка для извлечения фичей и их агрегации, которая не раз выручала меня в задачах, где нужно разделить звуковые данные по полу/качеству микрофона и так далее. Как CLIP, но в мире аудио
4. NANSY++, Natural Speech 2 и другие — большой пласт сеток для разных задач text prompt генерации голоса (причем, и клонирования, и поющего, и эмоционального)
5. разные Audio LLM — suno bark, audiocraft, llark. Разные задачи с управлением через llm от prompt-based synthesis и до audio production guidance
многие из архитектур уже выдают очень классные результаты, но являются дорогими/долгими/тяжелыми. Поэтому в следующем году ожидаю тренд на облегчение моделей, а также уменьшение числа минут/часов, необходимого например для качественного переноса голоса (как пример — RVC, которому сейчас для создания кавера с новым голосом нужно 10 минут). Кроме того, думаю, что гиганты типа apple будут больше внимания уделять звуку. Милана недавно, например, писала про voice cloning в последнем обновлении iOS.
Пишите в комментариях о сетках/продуках, про которые я забыла. И всех с наступающим! 🎉
🐺 Sam уже почти как Дуров — раздает советы, которые активно обсуждает твиттер 🐺
Очень неплохие, и, ожидаемо, отражающие идеологию YC startup school. Расскажу подробнее основные мысли, они хорошо делятся на 4 группы. Оригинал тут
🌟 Про вдохновение
— Стимулы (мотивации) — это сверхспособности; устанавливайте их осторожно
— Моменты вдохновения недолговечны, и жизнь проходит быстро. Не стоит бездействовать в такие моменты, важно их использовать
— Легче сделать сложное, но важное дело, чем легкое, но неважное; смелые идеи мотивируют людей
— Все начинается с оптимизма, вдохновленности, веры в себя, силы воли и нетворка
🙂 Про команду
— Помогают довести дело до конца: сплоченность команды, баланс между суетой и спокойствием и безусловная верность делу
— При найме выбирайте людей с высоким потенциалом, помимо интеллекта ищите доказательства того, что они выполнят свою работу
— Суперзвезды очень ценны, но вы должны оценивать людей по их общему влиянию на результаты
— Работа с замечательными людьми это одна из лучших частей жизни
🔜 Про концентрацию на результате
— Избавляйтесь от ненужного, концентрируйтесь на том, во что сильно верите
— Избегайте бюрократии, не позволяйте ей мешать продуктивности
— Результат важнее процесса
✏️ Про подход к работе
— Общайтесь ясно и коротко
— Итерируйтесь быстро. Ошибаться нормально
— Не боритесь с законами бизнеса, они как законы физики
— Масштабирование часто имеет удивительные свойства
— Стоит строить бизнес, который при масштабировании получает дополнительные преимущества
ну и бонус на тему ошибаться нормально
коротко про current state виртуальной примерки 🌚
Я не очень верю в решенность этой задачи в декабре 23го по нескольким причинам:
1. Лекала и размерные сетки. Возьмите одни и те же штаны из зары в Корее и в Америке. Условный M там будет совершенно разный
2. Сложные фасоны. Думаю, что в течение года можно будет примерить очень реалистично оверсайз вещи, но ведь куда интереснее как будет выглядеть какой-нибудь слим фит
3. Неинклюзивность. Все впечатляющие демки с онлайн-примеркой сейчас на стройных и высоких. Увы, но на них всегда все хорошо сидит :) если говорить про обычных людей, то здесь все будет похуже. Гугл кстати тут сделал интересную механику - выбирать похожую по фигуре модель и смотреть, как вещь будет сидеть на ней
А вообще я рада, что так много интереса к этой теме последнее время. Потому что рынок fashion e-commerce активно растет во многом из-за генеративок и хайпа вокруг примерки 🦄
картинка взята из этого треда
Стояла вчера в Белграде в многотысячной очереди на голосование. Вдоль ходил гений с табличкой "ищу Android developer'a". Прикиньте ходить там показывать страничку проекта на Product Hunt 👾
Читать полностью…🧦 Удобный датасет для сегментации одежды на HF 🧦
Я взяла за основу IMaterialist — профильтровала и адаптировала его под задачу сегментации, решив ряд сложностей:
1. На фотках присутствуют несколько людей, иногда одежда размечена только у одного
2. Много лишних деталей. Так, например, если класс "карманы" который относится и к карманам на куртке, и к карманам на юбке
3. Нереально большое число классов распознавания, которое на практике не особо нужно
4. К сожалению, в оригинальном датасете присутствуют ошибки разметки. Я постаралась также их уменьшить на постпроцессинге
Что я сделала:
1. Убрала фотки где присутствует человек с неразмеченной одеждой
2. Постаралась максимально раскидать карманы по ближайшим классам, чтобы они были частью кофты/штанов. Оставила 8 самых главных классов ('background', 'upperbody', 'upperbody_up', 'lowerbody', 'wholebody', 'wholebody_up', 'shoes', 'accesories')
3. Перепроцесснула сложный csv в удобный формат с простым классом датасета: он берет данные из папки с исходными фотками и из папки с масками в формате .npy
На 3.5k подписчиков выложу код
А как вы развлекаетесь на выходных? 😄
Поигралась с OOTDiffusion — еще одна онлайн примерка по принципу сегментация одежды -> инпеинтинг сегментированной области с учетом изображения того, что хотите примерить. Без примудростей, не продакшн решение, зато опенсорс и можно поиграться. Продолжаю с интересом наблюдать за тем, что происходит с онлайн примеркой и делать своего нейронного фэшн бади)
Читать полностью…🔍 Вышел технический репорт (на статью это пока не тянет) по Sora от openai
1. При генерации видео идея та же, что и в LLM: мультимодальные токены. Только вместо токенов — так называемые патчи (сжатые отдельно натренированной сеткой фрагменты с видео)
2. Патчи подаются в трансформер с диффузией, причем собраны они таким образом, что можно учиться и на видео, и на картинках разных размеров, разрешения и контролировать эти параметры на этапе инференса
3. При подготовке данных к тренировке подписи к видео генерируют отдельно обученной моделью
4. На инференсе запросы пользователя прогоняются через GPT, чтобы сделать их более понятными для Sor'ы
дальше идет большое число примеров, в которые я предлагаю позалипать самостоятельно. Из того, что мне больше всего понравилось — уже сейчас модель способна на некоторых примерах понимать связь "причина-следствие". Например после укуса бургера он не остается целым
на видео прогресс обучения 👀
расчехлила свои audiolm-ки и добавила этому гениальному видео то, что ему так не хватало - ОЗВУЧКУ 🔉
Читать полностью…⚡SORA: text2video от openai
Полчаса назад openai опубликовали на сайте анонс новой text2video с примерами! Качество огонь, ждем возможность поиграться и статью 🚀
Есть ограничения, о которых говорят и сами авторы. Модель не всегда понимает физику происходящего: в примере от авторов женщина задувает свечи, но с ними ничего не происходит. Также есть проблемы с причиной и следствием: человек может откусить печенье, но в кадре оно останется целым
Помимо текстовых промптов, модель может брать на вход картинки и анимировать их или существующие видео и расширить/заполнить недостающие кадры
The more you consume, the less you create? 🛍
👀 Недавно у меня был разговор с инвестором, которого я очень уважаю. Обсуждение ушло в сторону потребления контента — особенно разных зловещих сценариев, где Apple Vision становятся заменой реальной жизни для не очень счастливых людей. Он рассказал, как в молодости ездил на другой конец города, чтобы купить пластинку, в то время как сейчас любую песню можно послушать сразу да еще и бесплатно и ценность контента теряется, в то время как объемы контента становятся в разы больше.
📱Если реальная жизнь становится слишком сложной/грустной/скучной, рилзы/сериалы/дота действительно способны сделать существование более сносным. И в небольших дозах почему бы и нет. Но если это занимает большую часть жизни, точно ли это жизнь, а не существование/потребление?
💫 Фраза, которую я недавно услышала: "если человека спросить, что с ним было самое крутое за год он едва ли вспомнит смешной рилз или просмотр сериала на нетфликсе". Я думаю мы запоминаем в первую очередь то, к чему мы сами причастны. Мы все хотим создавать и принимать решения, я уверена.
👟В объемах контента есть и хорошее, само собой. Пусть у нас есть задача "получить кроссовки, идеально мне подходящие".
Наиболее крутое креаторское решение — создать обувь под себя с нуля. Но это сложно/дорого.
Пусть у нас есть огромный маркетплейс и мы хотим найти пару кроссовок, которая нам максимально подойдет. На одном только фарфетче десятки тысяч предложений. Вопрос в том, как найти ту самую пару? И здесь можно применить креативность в том, как искать одежду - например, узнать какие цвета подойдут к твоей одежде, какой стиль тебе нравится, какие магазины стоит посмотреть в первую очередь? Если хорошо знать что конкретно ищешь, то можно поиск лучших кроссовок считать приближением креаторского решения.
😎 Несмотря на перспективы все большего разделения на создателей и потребителей я верю, что у потребителей появится больше возможностей для персонализации контента/предметов гардероба/концовок в фильмах под себя, тем самым потребителей не просто будут пичкать проигранными сценариями, а все еще останется много места для творчества даже в роли консьюмеров.
p.s. здесь я пишу больше про aesty и рынок fashion tech ❤️
Хотя я с головой в визовых разбирательствах и релизе, не смогла пройти мимо очередной горяченькой темы из мира AI. Энтузиаст выложил на 4chan веса от Mistral AI - не GPT-4, но очень хорошая LLMка. Утверждал, что обучил сам. Правда, на мой вопрос "кто тебя сделал?" модель начала травить байки про команду разработки Mistral AI, А пару часов назад CEO подтвердил, что слитая моделька действительно принадлежит им. Интересно, что теперь будет с их партнерством с Google 🥲
upd: скрин, оказывается, не от сбежавшей, а от опенсорсной модели. Но и первая примерно в том же духе отвечает
небольшой визовый апдейт: написали из консульства в Белграде, запросили оригиналы моих 2х одобренных петиций О1 и все документы, которые мне присылали из USCIS. Копии я отправляла им еще в мае и тогда меня заверили, что документы получены и процессинг продолжается уже по бекграунду. Сегодня буду общаться с юристами и надеюсь, что вскоре все завершится хорошо (через 3 дня, к слову, будет год с начала проверок)
предыдущие серии: #O1
осторожно, кринж
попробовала VideoGPT, он уточняет мой промпт и потом редиректит на VEED, где меня просят купить их подписку. Вот это я понимаю, customer acquisition! 😂
Не понравилось, что вместо того, чтобы взять текст из запроса к генерации, они почему-то используют для субтитров кривоватое распознавание... Да и в целом не знаю чего я ожидала от вкусного заголовка "text2video" 🥴🦄
🌟 фаундерский ивент techstars про постановку целей
Вчера в зуме была открытая встреча фаундеров с менторами (которые сами уже успешные фаундеры). Обсуждали, как ставить цели и от чего отталкиваться на ранний стадиях.
TLDR - задавайте себе вопросы, какие метрики вы оптимизируете, следите, чтобы у каждого сотрудника была конкретная зона ответственности и проверяйте, что идея питча соответствует mvp.
Тезисы
1. Технические задания должны опираться на стратегию и бизнес нужды компании. На ранних стадиях не стоит тратить на рисерч больше 2х недель
2. Бизнес нужды в свою очередь должны отталкиваться от фидбека пользователей и их нужд
2. Как понять, какой трекшн надо получить, чтобы поднять раунд? - пообщаться с инвесторами и другими фаундерами. Вообще стоит просто поддерживать связь с другими фаундерами на рынке
3. У вас должен быть запас инвестиций по крайней мере на 10 месяцев вперед
4. Chatgpt - отличный ассистент, но не заместитель. Если вы копируете текст не думая (например заполняя заявку в акселератор) это почти всегда заметно
5. Инвесторы видят линии, а не точки. Стоит показывать что вы выдаете стабильно 25k MRR, а не в одном месяце
6. Формировать четкие цели и ожидания от каждого запуска. В метриках
Успели даже коротко обсудить мой вопрос - сказали, чтобы я не делала вейтлисты. Почему так - я не успела спросить, но написала. Как ответят, расскажу)
в конце говорили про пивоты и неудачи. Много про то, что важно отдыхать и не делать ничего ночью (а я смотрела этот вебинар в полночь, хаха). Понравилась мысль - не забывать, что ваша жизнь это не только ваш стартап, у вас есть друзья, семья, интересы, другие проекты и тд.
И еще было много ссылок. Вот две, которые мне больше всего понравились:
1. хаб полезных ресурсов для фаундеров
2. подробка фаундерских комьюнити
перешагнули порог в 2к подписчиков 🎉
канал начинался с обзоров на войс тех архитектуры с демо/плейграундами, сейчас я пишу и про развитие своего стартапа, и про новости из фешн теха, и все еще иногда про войс тех. Ну и про визу, когда там происходит какой-то движ...
Расскажите, про что вам было бы интересно почитать?
🪩 init commit для стартапа 🪩
мало кто рассказывает про первые месяцы жизни стартапа, и я понимаю почему - всегда хочется пофлексить, показать, какой ты офигенный фаундер. Но до флекса проекту надо еще дожить, причем кодинг - это далеко не самая трудоемкая часть. Сейчас расскажу, как это происходит у меня
1. Серьезные намерения
После того, как в сентябре я ушла из найма, я общалась с разными фаундерами, инвесторами. Фидбек у всех был очень простой - или неинтересно, или интересно, но приходи, когда будет mvp и трекшн. Тем не менее, мне очень нравилось жить на бонусы за консультации, проекты и парттайм заниматься стартапом. В конце октября встал очень понятный вопрос: либо я фултайм занимаюсь своим aesty, либо ничего из этого не получится. И тогда я отклонила 2 оффера - решилась отказаться временно от благ найма и попробовать сделать свое, крутое.
2. Пространство идей
Было несколько идей-кандидатов, среди которых, само собой, была и онлайн-примерка. Выяснили, что сейчас огромный запрос на персонализацию - люди не понимают, что им подходит, и часто покупают ненужное. Провели касдев с людьми из разных стран. Из интересного выяснили, что, например, японцы будут очень рады, если мы им дадим инструкцию, что им носить и как сочетать, а европейцам очень зашла идея с календариком образов и поиском по нему.
3. Общение с фаундерами, комьюнити, акселлераторы.
Я удивилась, насколько все друг друга знают в стартаперском комьюнити. А еще, насколько фаундеры любят поговорить, даже если ты просто пишешь в LinkedIn и предлагаешь познакомиться. Я общалась со многими фаундерами из разных отраслей, и все советовали подаваться в топ-10 акселлераторов (YC, techstars, alchemist, 500 startups, etc). На подачу ограничений нет, более того, жюри даже поощряют повторные заявки, так что вы точно ничего не теряете. Зато в процессе заполнения анкеты и записия питчей можно очень много понять про свой стартап и идею. Если пройти на собесы - получить фидбек вне зависимости от решения. Вообще, комьюнити и чужая рефлексия очень помогают. Вот, например, подборка каналов про развитие своих продуктов.
4. Планы
За полтора месяца мы сделали mvp, чуть выше был пост с тестфлайтом. Сейчас допиливаем наполнение и другие фичи, в Q1 выходим в стор с подпиской, запускаем маркетинг, смотрим на отклик, и выберем куда идти дальше, есть как минимум 3 гипотезы.
Кстати, скоро будет батч на 25 новых тестеров, stay tuned! 😎
Месяц назад все обсуждали Sama и его уход из openai, сейчас движ происходит в fashion tech вокруг продажи Farfetch (самый известный люксовый маркетплейс) южнокорейскому Coupang, который называют азиатским Амазоном. Мне стало интересно, как так вышло, что после миллиардного выхода на IPO в 2018м компания оказалась на грани банкротства в 2023м 🥲
👀 Шаги, противоречащие основной бизнес-модели
Изначально Farfetch был платформой, которая связывала покупателей с продавцами люкса, не владеющей собственными складами и производствами. После успешного выхода на IPO и пандемии, CEO решил расширять компанию, поглотив несколько других: New Guards Group (производство и дистрибуция люксового шмота) и Violet Grey (американское золотое яблоко). Инвесторы этот мув не оценили и стали задавать вопросы о целесообразности таких импульсивных покупок. Вскоре быстрый рост привел к увеличению накладных расходов без доходов
👀 Снижения спроса на люкс в 2023 году
Времена непростые, поэтому спрос на люксовые товары сильно уменьшился. В качестве ответной меры, многие платформы стали вводить скидки, что в начале 2023 немного помогло, но затем дало откат - люди ждали скидки и не покупали товары по полной цене 🙃 пострадали все, от модных домов до ритейла
👀 Разные обсуждения в СМИ
В сети давно обсуждают Farfetch с разных ракурсов. Кто-то считал, что благодаря своей технологичности и открытости к экспериментам компания придет к успеху, но многие сомневались в продаже люкса онлайн с самого начала, а когда компанию начало штормить - вылезло много нумыжеговорили. Для многих покупка люкса это экспириенс. Здесь его почти нет, но есть наценки. Поэтому обсуждения виртуальной примерки кроссовок в 2020м оказались не такими сочными и заметными
у Farfetch даже свой аксель был в Париже, куда я планировала подаваться весной. Coupang видит в партнерстве доступ к US рынку и продолжение экспериментов, так что мне очень интересно, будет ли в этом году набор или им не до того. Может, фандинг даже расширят 🌚
😎 Кто хочет поработать в YC стартапе?
Друзья, ищу iOS хаслера к себе в команду. Если у вас есть такие на примете, то скиньте плиз им картинку. За хорошую рекомендацию в обиде не оставлю.
P.S. Есть крутой android engineer, дайте знать если вам нужно
@rebryk