Призеры конкурса с тачками выложили свой отчет про конкурс - https://goo.gl/3JySwE
Я не догадался до transfer learning, а они догадались xD
Ну и вот это порадовало)
Знакомый прислал просто безумно офигенную статью-обзор разных типов RNN
- https://distill.pub/2016/augmented-rnns/
Все понятно и простыми словами. По итогам нового конкурса будет больше инфы, пока так.
Интересное в мире интернета
- Ben Evans - https://goo.gl/HYMvh4
- Чуваки которые хотели отсудить Фейсбук имеют US$1bn в битках - https://goo.gl/EQcu6U
- Цены на Li-ion батареи продолжают падать линейно - https://goo.gl/TTyBVV
- Cydia закрывается - https://goo.gl/ik8STV - Apple победил. В ведерке вы можете ставить внешние говно-приложения на свой страх и риск просто нажав галку в меню. Про извращения, которые вы можете сделать подключившись со своего телефона к нему же в консоли вообще молчу
- Tunnel vision в Твиттере - https://goo.gl/NTG5ua - полярные мнения не пересекаются. Это разные миры. Еще один повод не участвовать в политике и тупых срачах
- В Кении к интернету доступ есть у 53% людей, 99% с мобилки - https://goo.gl/8P7D9H
- Cringe и маразм западного мира - Facebook for kids - https://goo.gl/smcyyL . Бред состоит в том, что буквально 50 лет в некоторых штатах назад даже в США дети рассматривались как бесплатная рабочая сила (а что семьи большие, пусть работают). А сейчас прививается этот маразм, что детство "нельзя трогать". Особенно это смешно, вспоминая школьные классы которые состояли от 5% до 50% из гопников (чем дальше тем их было меньше)
- Инфографика про посылки через интернет - Китай растет и уже на 2 месте после США - https://goo.gl/ZLDJVF
- Автономные машины могут помочь бедным - https://goo.gl/rjUDcp
- Кто в танке - рост битка и его сравнение с другими активами - https://goo.gl/WQ3kKY
- Uber занимался ... слежкой за людьми лол - https://goo.gl/GHW9qC
- Журналистота, но по гео-координатам можно находить факт наличия серийных убийц - https://goo.gl/FiVp93
- Как дети юзают интернет - https://goo.gl/BaZWxa
#internet
#digest
Банально но гугл можно использовать как источник разметки
- https://www.pyimagesearch.com/2017/12/04/how-to-create-a-deep-learning-dataset-using-google-images/
#deep_learning
Офигеть - люди превращают мануалы в читабельные и практичные гайды!
- http://tldr.sh
#linux
В работе с картинками полезно почитать про способы экстраполяции картинок
- https://graphicdesign.stackexchange.com/questions/26385/difference-between-none-linear-cubic-and-sinclanczos3-interpolation-in-image
#data_science
Сервис выдачи бесплатных TLS сертификатов для доменов Let's Encrypt [1] еще в феврале 2017 года стал наиболее популярным сервисом создания сертификатов, а в этом месяце достинг планки в 35%, это доля сертификатов выдаваемых Let's Encrypt, по оценке NetTrack [2]. Напомню что в мае 2016 года Let's Encrypt начинал свой взлет, но у него была доля в только 5% всех сертификатов.
Практически все коммерческие сервисы такие как Godaddy, Geotrust и Comodo теряют свою долю и пользователи все чаще подключают сертификаты Let's encrypt автоматически.
Эта история важна еще и тем что базовая безопасность перестала восприниматься как услуга и стала восприниматься как инфраструктура. В ситуации когда TLS должно быть базовым протоколом работы сети, то и раздачей сертификатов должна заниматься общественная организация. Пока все идет к тому что у коммерческих игроков через пару лет не останется тут вообще никаких шансов на заработок.
Но единственная ли это область где качественный недорогой некоммерческий сервис способен "убить рынок" ? Что будет если такие сервисы появились бы для электронного документооборота или бухгалтерских услуг?
Когда-то таким образом переструктурировался весь рынок электронной почты. Когда раздавая бесплатные почтовые аккаунты крупнейшие цифровые сервисы практически убили все сервисы платной электронной почты. На какое-то время.
Ссылки:
[1] https://letsencrypt.org/
[2] https://nettrack.info/ssl_certificate_issuers.html
[3] https://en.wikipedia.org/wiki/Let%27s_Encrypt
#internet #web #security
Интересное в мире ML
- Import AI - https://goo.gl/97JzTx
- Еще раз великолепная статья про визуализации нейросетей от Гугла - обязательно прочитайте - https://distill.pub/2017/feature-visualization/
- Канадские ученые - открытое письмо к правительство запретить использование AI в оружии - https://goo.gl/dixya1
- Еще один потенциальный вендор карт для нейросетей - https://goo.gl/dJ4CMJ
- Еще есть такая флешка (200 GFLOPs) - https://goo.gl/Usi1Qp
- Apple про свой детектор лиц на айфонах - https://goo.gl/1krh5H
- В tf пытаются встроить подобие PyTorch - https://goo.gl/eCYzU3
- Как правильно обращатсья с бейслайнами - https://goo.gl/ChgA1c
- Просто оставлю эту ссылку на форум тут - https://goo.gl/ZemhhL- огромный сборник best practice-ов для PyTorch
#digest
#data_science
Про юпитер тетрадки и их киллер фичи для сомневающихся
- https://www.youtube.com/watch?v=FwUcJFSAfQw
На практике, все что относится к фронтенд компонентам (виджеты, iframe) как правило не всегда стабильно и предсказуемо.
Из того, что надо начать юзать еще - сниппеты и split cells.
Недавно пробовал сравнивать с Zeppelin - вторые вообще ни в какое сравнение не идут)
#data_science
Недавно в документации pytorch появились все фишки с learning rate schedule (плато, ступеньки, экспоненциальное угасание). Прикольно наверное тем, что писал для этого отдельные библиотеки. В мастер они оказывается это добавили в августе, вероятно документация обновляется с лагом.
Читать полностью…Мелочь из практики - если вы юзаете Keras + tf - не все версии хорошо работают друг с другом.
Тут больше инфы
- https://github.com/nerox8664/pytorch2keras/issues/1#issuecomment-349380097
- https://docs.floydhub.com/guides/environments/
Beware.
#deep_learning
Вышла новая верия (v 0.3.0) Pytorch
- https://github.com/pytorch/pytorch/releases
Из того, на что упал глаз
- A profiler for the autograd engine
- Model Exporter to ONNX (ship PyTorch to Caffe2, CoreML, CNTK, MXNet, Tensorflow)
Этого очень не хватало!
#deep_learning
Про капсульные сети на русском
- https://habrahabr.ru/company/recognitor/blog/343726/
Выше было видео более интуитивное, но если вы не знаете английский, то это тоже в копилку.
#data_science
#deep_learning
Еще раз ссылка, как кажется на банальную статью про нейросети - почему они не тренируются, когда должны. За последние 2 недели я собрал почти все эти костыли. Особенно радует, когда теряешь 3-4 дня суток расчетов.
- http://theorangeduck.com/page/neural-network-not-working
#data_science
#deep_learning
Практическая копоть. Выбирая для одной задачи между densenet и resnet, прочитал статью и спросил коллег.
- Архитектура - https://goo.gl/uBrBA4 https://goo.gl/HzGqQp
- Статья - https://goo.gl/mWdhsS
- Основные идеи:
-- Некоторые сети улучшают точность за счет длины (резнет) и skip connections
-- Некоторые за счет ширины - inception
-- Некоторые за счет связей - densenet
- Практика и почему не используется на соревнованиях
-- Новая и хуже изучена чем VGG и Resnet
-- Жрет больше памяти чем резнет на таком же числе параметров и сравнимой точности
-- Тяжело и хз как правиольно тренировать
- Коллеги говорят, что сама архитектура пока сырая
#data_science
#deep_learning
Шутки программистов - когда класс говорит тебе:
Torch: not enough memory: you tried to allocate 0GB. Buy new RAM!
Великолепная серия статей про то, как пользоваться pandas
- https://tomaugspurger.github.io/modern-1-intro
#data_science
Интересное в мире интернета
- Ben Evans - https://goo.gl/JQg5rj
- Тесла представила новый авто...который вы получите в 2020 если заплатите сейчас - лол - https://goo.gl/TW2Y99
- Про грузовики Тесла от водителя грузовика - https://goo.gl/bCSf28
- Крипота в алгоритме people you may know фейсбука - https://goo.gl/58xDEs - причем вас могут вычислить даже если у вас в профиле нет ничего кроме имени
- В древности люди читали вслух - https://goo.gl/7UkxtQ
#digest
#internet
Интересное в мире ML
- Открылся конкурсе по распознаванию голоса - https://goo.gl/ojBHv7 - судя по всему там будет замес (прошло несколько дней, а там уже ажиотаж), но сам конкурс очень интересный
- Про инжиниринг фич - https://goo.gl/YvdBcZ
- Нейросетки для музыки - https://goo.gl/2baKrB
- LSTM для систем рекоммендаций - https://goo.gl/xPLDKn
- Прикольно про жанры музыки - похоже на то, как мы сами это делали - https://goo.gl/3QnfXG
- Бенчи сеток на TF по скорости работы. Кто инженер - налетай - https://github.com/taehoonlee/tensornets
- Как люди писали сетки 10 лет назад - https://goo.gl/4Biyom
- Плагин Chrome для archiv - https://fermatslibrary.com/librarian - по мне Менделей лучше
- Топовое решение с конкурса Carvana - https://github.com/asanakoy/kaggle_carvana_segmentation. Из важного:
-- Pytorch
-- Кастомные генераторы у всех участников
-- Сахар для работы с Tensorboard
-- Консольные скрипты с параметрами для запуска моделей
-- Копипаста - Юнет и подобные модели
#digest
#data_science
Понравилась статья с прошлого соревнования?
Не читал – 9
👍👍👍👍👍👍👍 82%
Да – 2
👍👍 18%
Нет
▫️ 0%
Слишком много копоти
▫️ 0%
Слишком мало копоти, нужно больше деталей пошаговых
▫️ 0%
Своё, в личку
▫️ 0%
👥 11 people voted so far.
В последнее время во время практической копоти (настройка окружений, докеров, установка дров, админство) я начал сталкиваться с нехваткой знаний про архитектуру Линукса и Юникса. В интернете безумного много книг, но самые популярные как правило издавались уже по восемь раз и фокус в них совсем на низко-уровневые вещи. Какие-то книги, типа The Linux Bible, судя по оглавлению слишком "прикладные" (и размер в 1000+ страниц смущает).
По этой причине нашел в интернете довольно свежую книгу на эту тему. Если вы начинаете коптить в Линукс - должно зайти
- https://goo.gl/Hshoyz
#linux
Библиотека, которая позволяет использовать почти все визуализации tensorboard с pytorch
- https://github.com/lanpa/tensorboard-pytorch
Особенно интересен пример для отладки графа вычислений
- https://goo.gl/oLWhfP
#data_science
#pytorch