Кое-как доделала вторую часть презентации с планом обучения Machine Learning с нуля, за ноль рублей.
Первую часть, где рассказано про то, где можно получить базу в плане математики и программирования, можно увидеть здесь. Ну, а в только что дописанной второй части (см. вложение) раскрывается следующая часть учебного плана: а именно, какие бесплатные курсы, лекции и дополнительные материалы использовать, чтобы изучить классические алгоритмы машинного обучения (Classic ML) и глубокое обучение (DL).
#учебные_материалы
По-любому кто-нибудь где-нибудь сейчас собирает датасет и тренирует модельки на успешных случаях мошенничества и социального инжениринга и мы все чаще будем становиться жертвами разводняков самого разного уровня. И анти-мошеннические системы как всегда будут, в основном, только догонять, редко когда срабатывая на опережение появления новых схем.
Буквально полчаса назад сам чуть не попался на красивый развод. Постучался ко мне в личку некто, представившийся админом паблика про новости технологий и предложил взаимопиар. Я глянул, что у него довольно живой канал и под 30000 пользователей, и у каждого поста за последние несколько месяцев по 6-10 тыс. просмотров. Думаю, как-то странно, зачем ему с таким количеством пользователей взаимопиар с очень небольшим каналом. Ну, я такой вопрос и задал. Он пишет: "А какой у вас канал?". Я послал ссылку и написал, что как-то странно предлагать взаимопиар админу канала, который ты не смотрел. Он ответил: "Ну, мне помощники сделали подборку админов интересных каналов, я им напрямую сейчас пишу, просто ваш канал не посмотрел сразу. Канал у вас интересный, но я думал, что у вас аудитория больше. Недавно канал завели?". Я отвечаю: "Нет, уже года полтора веду или даже больше, просто почти не продвигаю как сам растет, так и хорошо". Он мне: "Хороший у вас канал. Я подпишусь". Я поблагодарил, а он мне пишет: "Хотите ваш канал прокламирую?". Я спросил про условия. Мне отвечает: "Вообще реклама у меня стоит 3200 за 2 часа, но сейчас место есть, могу за 1600 предложить". Ну и расписал, что если не придет как минимум 250 человек, то деньги вернет. Я думаю, интересное предложение, но у меня прямо сейчас на карте свободных 1600 нету.
И вы не поверите, ровно в этот момент в другом чате мне пишет мой клиент и делает заказ на 1630 рублей. Я думаю, ни фига себе совпадение! Как раз на рекламу хватает :) Пишу админу технопаблика и говорю, видимо, судьба готов купить рекламу. Только подтвердите мне, что вы админ этого самого паблика. Он мне говорит, там ссылка в описании паблика - можете посмотреть. Я захожу и вижу ссылку на аккаунт админа, вроде, все совпадает - нажимаю на ссылку - открывается точно такой же чат, как и тот, в котором я общался - все совпадает и картинка и описание, только чат новый. Я написал туда, но ответа не пришло. Я в первый чат, говорю, напишите мне с того аккаунта, который указан в паблике. Он мне присылает ссылку на чат в котором вы общаемся и говорит: "Вот по этой ссылке напишите мне и я отвечу". Ну, я уже понял, что меня разводят и вдруг все сообщения из чата пропали, я не успел заскриншотить.
Ох, намучаемся мы, когда ИИ изучит психологию и будет находить индивидуальные ключики к каждой потенциальной жертве.
Будьте бдительны!
PS. Клиент, который перевел 1630 к разводке отношения не имеет. Я уверен. Просто крутое совпадение.
В теории вероятностей теорема Байеса является чуть ли не ключевой концепцией, имеющей множество практических применений. Мне стоило не малых усилий, чтобы более менее начать понимать как она работает. Жаль, что эта книга не попалась мне раньше. Сейчас освежаю в памяти байесовский подход и понимаю, что написано все довольно понятно и подробно.
Вероятностное программирование на Python
Если вы как и я пользуетесь подкастами, как одним из способов самообразования, могу порекомендовать хороший выпуск Теории Большой Бороды про основы статистики:
Посмотрите этот подкаст: 236: Почему статистика контринтуитивна и зачем ее нужно знать каждому https://ru.player.fm/1xpebp
Круто! Автор канала selfedu начал выкладывать ролики по matplotlib. Очень нравится этот канал! Многие знания черпаю из него и рад, что и до матплотлиба дело дошло! Также у автора есть цикл роликов про работу нейросетей и numpy. Если ещё не видели, прям, рекомендую!
https://youtu.be/clDQPyQJ-hc
Друзья! Хочу вам в этот раз порекомендовать два классных выпуска подкастов, которые мне очень зашли. Один из старенького. Я слушаю прошлые выпуски Теории Большой Бороды и в одном из выпусков 2019 года в очередной раз был подтверждён тезис, сформулированный мной, когда я только-только увлекся прослушиванием подкастов. А именно, хочешь получить хороший выпуск подкаста - приглашай Ивана Ямщикова! Вариант на самом деле беспроигрышный. Ни одного НЕинтересного выпуска с его участием, кажется, не существует в природе! Вот и эта беседа Ивана И Антона (ведущего Big Beard Theory) получилась очень интересной, и не утратившей свою актуальность. В очередной раз перемыли все косточки тесту Тьюринга.
https://beardycast.com/podcast/tbbt/the-big-beard-theory-240/
А рекомендация второго подкаста связана с тем, что я проходил Аналитика данных от Яндекса и там немного познакомился с SQL. До этого все у мегя было только на уровне готовых запросов, которые я не очень представлял как правильно писать. Вообще, по обучению на Яндекс.Практикуме я потом напишу отдельный пост - имею чего сказать по этому поводу, Так вот, я немного погрузился в базы данных и сегодня наткнулся на выпуск подкаста "Запуск завтра", где ведущий беседует с очень позитивным дядькой, стоявшим у истоков российского интернета и одним из известных контрибьюторов PostgreSQL. Послушайте! Очень бодро и интересно получилось!
https://ru.player.fm/series/zapusk-zavtra/kak-ustroieny-bazy-dannykh-i-kak-khakier-sdielal-bazu-dannykh-dlia-vyborov
Искусственный интеллект (ИИ) — одна из самых важных и быстрорастущих областей в науке. Его используют в медицине, промышленности, банковской сфере, торговле, разных мобильных приложениях и видеоиграх.
Эксперты в этой области решают сложные задачи с помощью анализа большого массива данных. Помогают развивать продукты. Улучшают бизнес-процессы. А еще — неплохо зарабатывают и могут работать как в офисе, так и на удаленке.
Хотите окунуться в мир исследований? Тогда записывайтесь на факультет «Data Science» GeekBrains. Узнаете, как работать с научными данными и использовать машинное обучение и нейросети для решения сложных задач.
Кстати, на факультете помогают с трудоустройством. А еще специалисты по Data Science весьма неплохо зарабатывают.
Изучите новую специальность и станьте аналитиком-супергероем → https://geekbrains.ru/link/HolgE5
GPT-3 моделька на английском языке, на 2.7 миллиардов параметров стала доступна онлайн.
Это реплика и обучили ее энтузиасты eleuther.ai а не люди из OpenAI, оригинальная GPT-3 на ~175 миллиардов параметров продается как коммерческий продукт и отдается по эксклюзивной лицензии через Microsoft.
В общем, опенсорс сообщество как всегда великолепно – также выложили модельку поменьше, все по ссылкам ниже.
Код | Коллаб
Количество сгенерированных текстов в интернете увеличилось вдвое 🌚
Собрал исключительно из своего опыта изучения
https://docs.google.com/spreadsheets/d/14Kjx9O9PiNLYMugZxgtw0ELeHq2TWC14s4LM1KZESjQ/edit?usp=sharing
Я так скажу: истории про "Войти в Айти" - это во многом т.н. "инфобизнес", так как на собеседованиях надо знать ГОРАЗДО больше, чем рассказывают на курсах.
Наверное, стажировки - это самый понятный и эффективный способ "вкатиться" в любую профессию. У кого еще получить первоначальный опыт, как не у тех, кто уже понимает рынок и делает для пользователей что-то полезное? Если бы у меня сейчас была цель устроиться на какую-нибудь новую для меня работу, в которой у меня есть только теоретические знания - я бы всеми правдами и неправдами пытался попасть на стажировку к лидерам рынка. Ведь после качественной стажировки тебе уже не смогут сказать, что ты совсем без опыта и найти работу мечты будет значительно проще.
Мы с ребятами из Яндекса решили запустить небольшой цикл ответов на вопросы про стажировки. Наверное, вы слышали, что они постоянно набирают стажеров, в том числе и по аналитике данных и по машинному обучению. На вопросы будут отвечать как HR-менеджеры, непосредственно отбирающие потенциальных стажеров, так и заказчики от бизнеса, которые точно знают какие специалисты им нужны. Так вот, чтобы этот цикл был максимально приближенным к жизни, мы решили предварительно собрать вопросы, которые интересуют будущих специалистов по машинному обучению и аналитике.
Задавайте ваши вопросы в комментариях к этому посту, а мы обязательно на них ответим в подкасте!
Один из выпусков подкаста как-нибудь посвящу математике для машинного обучения. На ум приходят пока 2 возможных гостя - Воронцов и Райгородский. Но это попозже. Сейчас нашел статью на Хабре, которая мне понравилась с дорожной картой изучения математики. Делюсь.
https://habr.com/ru/post/432670/
Добрый вечер!
Появилась видеозапись четвертой лекции по курсу Computer Vision using Deep Learning на тему "Single-Shot Detector":
https://youtu.be/F5nMyPtCOdM
Лекция посвящена задаче обнаружения объектов и методу Single-Shot Detector (SSD). В рамках лекции рассмотрена архитектура SSD.
Обратите внимание, эти вопросы будут рассмотрены в следующей лекции:
- целевые функции SSD;
- особенности процесса обучения.
Не смотря на вечернее время, не могу не поделиться наконец-то готовым выпуском подкаста :) Беседуем с Ольгой Перепелкиной Deep Learning Product Manager компании Intel о подходах к распознаванию эмоций, федеративном обучении (обучении на приватных данных) и карьере в ML. Интересного прослушивания!
https://anchor.fm/kmsrus/episodes/023-ML-eutiao/a-a58djp8
Вот такой курс бесплатно выложили на UDEMY. Доступен, вроде, только сегодня.
https://www.udemy.com/course/data-analyst-powerbipowerpivotpowerquerypivotchartdax/?ranMID=39197&ranEAID=*7W41uFlkSs&ranSiteID=.7W41uFlkSs-UmAiXPGjQd1NaX1.iIpmFw&utm_source=aff-campaign&utm_medium=udemyads&LSNPUBID=*7W41uFlkSs&couponCode=1C98CD0372E441D65135
Залипательный проект от Яндекса "Музыка звёзд". Можно послушать как "звучат" космические объекты, а в конце интересный рассказ о том, как это звучание было получено. Алгоритмы разные и без нейросетей не обошлось. Если хотите порелаксировать - рекомендую!
https://soundofstars.ru/
Наткнулся на сайт с большим количеством книг по программированию в свободном доступе. Вот, например, что есть по машинному обучению: https://codernet.ru/search/?query=%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5+%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5
Читать полностью…Может, надо кому. Открыт бесплатный доступ к курсу Machine Learning Real World projects in Python на Udemy. Вроде, еще пару дней будет доступен
https://www.udemy.com/course/machine-learning-real-world-projects-in-python/?ranMID=39197&ranEAID=*7W41uFlkSs&ranSiteID=.7W41uFlkSs-InBSEVLXt.MeuTIxMLy83Q&LSNPUBID=*7W41uFlkSs&utm_source=aff-campaign&utm_medium=udemyads&couponCode=MARCH_MID
Подписчики канала прекрасно знают, что, в целом, я сторонник самообразования из открытых источников, которых сегодня предостаточно. Но это совершенно не означает, что я против платного образования и у меня в жизни был неоднократный опыт, когда я платил за науку специалистам. Например, в начале 2010-х, мне, человеку далекому от строительства, понадобилось хотя бы немного разбираться в том, как устроена эта область человеческой деятельности, чтобы хотя бы примерно представлять, на что обращать внимание при работе с проектировщиками, со всякими разрешительно-контролирующими службами, с прорабами и даже с рядовыми каменщиками, бетонщиками и так далее.
Я нашел профессионального проектировщика, который проектировал и вел авторский надзор многих объектов разной степени сложности, и напросился к нему в юные подаваны на возмездной основе. Полгода он давал мне теоретические знания, а также таскал по объектам, чтобы показать все на практике.
Конечно же, я не стал профессионалом от строительства, но хороший фундамент подо мной появился и я уже мог общаться со специалистами на похожих языках и на меня не смотрели с видом "мальчик, а ты вообще что здесь делаешь?".
В общем, я считаю, что платным образованием стоит пользоваться если:
- у вас нету четкого понимания по какой траекторией двигаться и нету времени на то, чтобы глубоко вникать для выстраивания этой самой траектории
- у вас нету понимания к кому обратиться, если в каком-то месте вашей траектории у вас произойдет затык
- у вас недостаточно мотивации, чтобы придерживаться траектории. Тут надо отметить, что не "нет мотивации", а именно просто немного недостаточно, потому что, увы, волшебных таблеток пока не придумали. Обычно финансовые обязательства дают несколько очков к мотивации.
- у вас есть понимание, что опереться на опыт экспертов - это почти гарантированные срезанные углы и сложности, в которых без опыта экспертов, можно завязнуть.
В общем, если вам надо быстро, по делу и, в какой-то мере, с индивидуальным подходом, можно смотреть в сторону платных курсов. Я посмотрел на программу, которую предлагает GeekBrains. С позиций моего скромного, но уже все-таки опыта, она очень по делу.
Еще когда только Open AI объявили о выходе модели GPT-3, а Евгений Разинков в одном из выпусков Machine Learning Podcast размышлял о том, что дорогие решения, возможно, будут доступны только корпорациям, мне пришла мысль... Но как пришла, так и ушла :) А мысль была такая, что простые пользователи вполне способны объединяться, чтобы делать что-то сопоставимое с тем, что могут позволить себе корпорации. Можно вспомнить распределенные вычисления фолдинга белков, пулы майнеров для поддержки жизнеспособности криптовалют, а также недавнюю атаку на хедж-фонды инвесторов-любителей с Реддита. Про силу опен-сорс сообществ я вообще молчу. Ну, в общем, пользователи в очередной раз объединились и сделали свою GPT-3 :)
Читать полностью…