snakers4 | Technologies

Telegram-канал snakers4 - Spark in me

2278

Lost like tears in rain. DS, ML, a bit of philosophy and math. No bs or ads.

Subscribe to a channel

Spark in me

https://youtu.be/6JZNEb5uDu4

Читать полностью…

Spark in me

Призеры конкурса с тачками выложили свой отчет про конкурс - https://goo.gl/3JySwE

Я не догадался до transfer learning, а они догадались xD

Ну и вот это порадовало)

Читать полностью…

Spark in me

Знакомый прислал просто безумно офигенную статью-обзор разных типов RNN
- https://distill.pub/2016/augmented-rnns/

Все понятно и простыми словами. По итогам нового конкурса будет больше инфы, пока так.

Читать полностью…

Spark in me

Интересное в мире интернета
- Ben Evans - https://goo.gl/HYMvh4
- Чуваки которые хотели отсудить Фейсбук имеют US$1bn в битках - https://goo.gl/EQcu6U
- Цены на Li-ion батареи продолжают падать линейно - https://goo.gl/TTyBVV
- Cydia закрывается - https://goo.gl/ik8STV - Apple победил. В ведерке вы можете ставить внешние говно-приложения на свой страх и риск просто нажав галку в меню. Про извращения, которые вы можете сделать подключившись со своего телефона к нему же в консоли вообще молчу
- Tunnel vision в Твиттере - https://goo.gl/NTG5ua - полярные мнения не пересекаются. Это разные миры. Еще один повод не участвовать в политике и тупых срачах
- В Кении к интернету доступ есть у 53% людей, 99% с мобилки - https://goo.gl/8P7D9H
- Cringe и маразм западного мира - Facebook for kids - https://goo.gl/smcyyL . Бред состоит в том, что буквально 50 лет в некоторых штатах назад даже в США дети рассматривались как бесплатная рабочая сила (а что семьи большие, пусть работают). А сейчас прививается этот маразм, что детство "нельзя трогать". Особенно это смешно, вспоминая школьные классы которые состояли от 5% до 50% из гопников (чем дальше тем их было меньше)
- Инфографика про посылки через интернет - Китай растет и уже на 2 месте после США - https://goo.gl/ZLDJVF
- Автономные машины могут помочь бедным - https://goo.gl/rjUDcp
- Кто в танке - рост битка и его сравнение с другими активами - https://goo.gl/WQ3kKY
- Uber занимался ... слежкой за людьми лол - https://goo.gl/GHW9qC
- Журналистота, но по гео-координатам можно находить факт наличия серийных убийц - https://goo.gl/FiVp93
- Как дети юзают интернет - https://goo.gl/BaZWxa

#internet
#digest

Читать полностью…

Spark in me

Банально но гугл можно использовать как источник разметки
- https://www.pyimagesearch.com/2017/12/04/how-to-create-a-deep-learning-dataset-using-google-images/

#deep_learning

Читать полностью…

Spark in me

Это очень медленно работает с multiprocessing. Beware.

Читать полностью…

Spark in me

Офигеть - люди превращают мануалы в читабельные и практичные гайды!
- http://tldr.sh


#linux

Читать полностью…

Spark in me

В работе с картинками полезно почитать про способы экстраполяции картинок
- https://graphicdesign.stackexchange.com/questions/26385/difference-between-none-linear-cubic-and-sinclanczos3-interpolation-in-image

#data_science

Читать полностью…

Spark in me

Сервис выдачи бесплатных TLS сертификатов для доменов Let's Encrypt [1] еще в феврале 2017 года стал наиболее популярным сервисом создания сертификатов, а в этом месяце достинг планки в 35%, это доля сертификатов выдаваемых Let's Encrypt, по оценке NetTrack [2]. Напомню что в мае 2016 года Let's Encrypt начинал свой взлет, но у него была доля в только 5% всех сертификатов.

Практически все коммерческие сервисы такие как Godaddy, Geotrust и Comodo теряют свою долю и пользователи все чаще подключают сертификаты Let's encrypt автоматически.

Эта история важна еще и тем что базовая безопасность перестала восприниматься как услуга и стала восприниматься как инфраструктура. В ситуации когда TLS должно быть базовым протоколом работы сети, то и раздачей сертификатов должна заниматься общественная организация. Пока все идет к тому что у коммерческих игроков через пару лет не останется тут вообще никаких шансов на заработок.

Но единственная ли это область где качественный недорогой некоммерческий сервис способен "убить рынок" ? Что будет если такие сервисы появились бы для электронного документооборота или бухгалтерских услуг?

Когда-то таким образом переструктурировался весь рынок электронной почты. Когда раздавая бесплатные почтовые аккаунты крупнейшие цифровые сервисы практически убили все сервисы платной электронной почты. На какое-то время.


Ссылки:
[1] https://letsencrypt.org/
[2] https://nettrack.info/ssl_certificate_issuers.html
[3] https://en.wikipedia.org/wiki/Let%27s_Encrypt

#internet #web #security

Читать полностью…

Spark in me

Это художественный фильм, если что.

Читать полностью…

Spark in me

Интересное в мире ML
- Import AI - https://goo.gl/97JzTx
- Еще раз великолепная статья про визуализации нейросетей от Гугла - обязательно прочитайте - https://distill.pub/2017/feature-visualization/
- Канадские ученые - открытое письмо к правительство запретить использование AI в оружии - https://goo.gl/dixya1
- Еще один потенциальный вендор карт для нейросетей - https://goo.gl/dJ4CMJ
- Еще есть такая флешка (200 GFLOPs) - https://goo.gl/Usi1Qp
- Apple про свой детектор лиц на айфонах - https://goo.gl/1krh5H
- В tf пытаются встроить подобие PyTorch - https://goo.gl/eCYzU3
- Как правильно обращатсья с бейслайнами - https://goo.gl/ChgA1c
- Просто оставлю эту ссылку на форум тут - https://goo.gl/ZemhhL- огромный сборник best practice-ов для PyTorch


#digest
#data_science

Читать полностью…

Spark in me

https://youtu.be/VrgYtFhVGmg

Читать полностью…

Spark in me

https://spark-in.me/post/fish-object-detection-ssd-yolo - статья

Читать полностью…

Spark in me

Про юпитер тетрадки и их киллер фичи для сомневающихся
- https://www.youtube.com/watch?v=FwUcJFSAfQw

На практике, все что относится к фронтенд компонентам (виджеты, iframe) как правило не всегда стабильно и предсказуемо.

Из того, что надо начать юзать еще - сниппеты и split cells.

Недавно пробовал сравнивать с Zeppelin - вторые вообще ни в какое сравнение не идут)

#data_science

Читать полностью…

Spark in me

Недавно в документации pytorch появились все фишки с learning rate schedule (плато, ступеньки, экспоненциальное угасание). Прикольно наверное тем, что писал для этого отдельные библиотеки. В мастер они оказывается это добавили в августе, вероятно документация обновляется с лагом.

Читать полностью…

Spark in me

Мелочь из практики - если вы юзаете Keras + tf - не все версии хорошо работают друг с другом.

Тут больше инфы
- https://github.com/nerox8664/pytorch2keras/issues/1#issuecomment-349380097
- https://docs.floydhub.com/guides/environments/

Beware.

#deep_learning

Читать полностью…

Spark in me

Вышла новая верия (v 0.3.0) Pytorch
- https://github.com/pytorch/pytorch/releases

Из того, на что упал глаз
- A profiler for the autograd engine
- Model Exporter to ONNX (ship PyTorch to Caffe2, CoreML, CNTK, MXNet, Tensorflow)

Этого очень не хватало!

#deep_learning

Читать полностью…

Spark in me

Про капсульные сети на русском
- https://habrahabr.ru/company/recognitor/blog/343726/

Выше было видео более интуитивное, но если вы не знаете английский, то это тоже в копилку.

#data_science
#deep_learning

Читать полностью…

Spark in me

https://youtu.be/1zvohULpe_0

Читать полностью…

Spark in me

Еще раз ссылка, как кажется на банальную статью про нейросети - почему они не тренируются, когда должны. За последние 2 недели я собрал почти все эти костыли. Особенно радует, когда теряешь 3-4 дня суток расчетов.
- http://theorangeduck.com/page/neural-network-not-working

#data_science
#deep_learning

Читать полностью…

Spark in me

https://youtu.be/NEscK5RCtlo

Читать полностью…

Spark in me

Практическая копоть. Выбирая для одной задачи между densenet и resnet, прочитал статью и спросил коллег.

- Архитектура - https://goo.gl/uBrBA4 https://goo.gl/HzGqQp
- Статья - https://goo.gl/mWdhsS
- Основные идеи:
-- Некоторые сети улучшают точность за счет длины (резнет) и skip connections
-- Некоторые за счет ширины - inception
-- Некоторые за счет связей - densenet
- Практика и почему не используется на соревнованиях
-- Новая и хуже изучена чем VGG и Resnet
-- Жрет больше памяти чем резнет на таком же числе параметров и сравнимой точности
-- Тяжело и хз как правиольно тренировать
- Коллеги говорят, что сама архитектура пока сырая

#data_science
#deep_learning

Читать полностью…

Spark in me

Шутки программистов - когда класс говорит тебе:

Torch: not enough memory: you tried to allocate 0GB. Buy new RAM!

Читать полностью…

Spark in me

Великолепная серия статей про то, как пользоваться pandas
- https://tomaugspurger.github.io/modern-1-intro

#data_science

Читать полностью…

Spark in me

https://www.youtube.com/watch?time_continue=27&v=gZhQrjCipRc

Читать полностью…

Spark in me

Интересное в мире интернета
- Ben Evans - https://goo.gl/JQg5rj
- Тесла представила новый авто...который вы получите в 2020 если заплатите сейчас - лол - https://goo.gl/TW2Y99
- Про грузовики Тесла от водителя грузовика - https://goo.gl/bCSf28
- Крипота в алгоритме people you may know фейсбука - https://goo.gl/58xDEs - причем вас могут вычислить даже если у вас в профиле нет ничего кроме имени
- В древности люди читали вслух - https://goo.gl/7UkxtQ


#digest
#internet

Читать полностью…

Spark in me

Интересное в мире ML

- Открылся конкурсе по распознаванию голоса - https://goo.gl/ojBHv7 - судя по всему там будет замес (прошло несколько дней, а там уже ажиотаж), но сам конкурс очень интересный
- Про инжиниринг фич - https://goo.gl/YvdBcZ
- Нейросетки для музыки - https://goo.gl/2baKrB
- LSTM для систем рекоммендаций - https://goo.gl/xPLDKn
- Прикольно про жанры музыки - похоже на то, как мы сами это делали - https://goo.gl/3QnfXG

- Бенчи сеток на TF по скорости работы. Кто инженер - налетай - https://github.com/taehoonlee/tensornets
- Как люди писали сетки 10 лет назад - https://goo.gl/4Biyom

- Плагин Chrome для archiv - https://fermatslibrary.com/librarian - по мне Менделей лучше
- Топовое решение с конкурса Carvana - https://github.com/asanakoy/kaggle_carvana_segmentation. Из важного:
-- Pytorch
-- Кастомные генераторы у всех участников
-- Сахар для работы с Tensorboard
-- Консольные скрипты с параметрами для запуска моделей
-- Копипаста - Юнет и подобные модели


#digest
#data_science

Читать полностью…

Spark in me

Понравилась статья с прошлого соревнования?

Не читал – 9
👍👍👍👍👍👍👍 82%

Да – 2
👍👍 18%

Нет
▫️ 0%

Слишком много копоти
▫️ 0%

Слишком мало копоти, нужно больше деталей пошаговых
▫️ 0%

Своё, в личку
▫️ 0%

👥 11 people voted so far.

Читать полностью…

Spark in me

В последнее время во время практической копоти (настройка окружений, докеров, установка дров, админство) я начал сталкиваться с нехваткой знаний про архитектуру Линукса и Юникса. В интернете безумного много книг, но самые популярные как правило издавались уже по восемь раз и фокус в них совсем на низко-уровневые вещи. Какие-то книги, типа The Linux Bible, судя по оглавлению слишком "прикладные" (и размер в 1000+ страниц смущает).

По этой причине нашел в интернете довольно свежую книгу на эту тему. Если вы начинаете коптить в Линукс - должно зайти
- https://goo.gl/Hshoyz

#linux

Читать полностью…

Spark in me

Библиотека, которая позволяет использовать почти все визуализации tensorboard с pytorch
- https://github.com/lanpa/tensorboard-pytorch

Особенно интересен пример для отладки графа вычислений
- https://goo.gl/oLWhfP

#data_science
#pytorch

Читать полностью…
Subscribe to a channel