Интересное в мире ML:
- Опрос - the state of ML от Каггла - https://www.kaggle.com/surveys/2017 . 2 графика наглядно иллюстрируют почему у нас зачастую ищут разрабов с налетом работы с данными, а не наоборот (понятно что у нас никто не отвечает на опросы, умножьте цифру в голове на 2)
-- https://goo.gl/8MU62f
-- https://goo.gl/8M3eAs
- Люди начинают делать аггрегаторы пре-тренированных моделей - этот http://pretrained.ml - судя по всему не работает. Качаем из доки своего любимого фреймворка пока...
- Якобы прорыв в архитектуре сетей - https://goo.gl/UvtrBj - https://arxiv.org/pdf/1710.09829.pdf - https://goo.gl/x6dhQJ - но пока только на MNIST
- Nvidia тренирует GAN прогрессивно на растущем разрешении и это якобы быстрее - https://arxiv.org/pdf/1710.10196.pdf
- Многобукв про то, что через годик появится много чипов для ML с 10x производительностью при таком же потреблении энергии - https://goo.gl/U7JTNF
- Uber открывает свой фреймворк для байесовых моделей - https://goo.gl/jWxFSj
- Популярная статья про adversarial аттаки на сети - https://goo.gl/2qMPHT и по сути самый важный код умещается на половину страницы
#digest
#data_science
#deep_learning
https://research.google.com/colaboratory/unregistered.html Jupyter notebook + Google drive.
Если взлетит - это нереально круто.
Интересно в чем catch.
Офигенный способ строить scatter-plot для гиганских массивов - https://stackoverflow.com/questions/2369492/generate-a-heatmap-in-matplotlib-using-a-scatter-data-set
Читать полностью…Офигенная презентация, которую я сделал к докладу про object detection, в которой вы найдете:
- Обзор современных sota моделей и подходов
- Основные бенчмарки современных моделей
- Направления дальнейшего развития моделей
- Мой опыт (и опыт победителей) последнего соревнования про поиск рыб на видео
- Некоторые особенности имплементаций моделей на keras и pytorch
- Проверенные имплементации моделей
- Советы для ваших пайплайнов моделей
- Забавные видосики
Ссылка на саму презентацию
- https://goo.gl/eDSM3L
Шерьте как можно больше =)
#data_science
#deep_learning
В этот раз много
- медицины
- GAN
- несколько долгих опен сорсных проектов
- но без муншотов чисто имиджевых записей они не обошлись
Интересное в мире Интернета:
- Ben Evans - https://goo.gl/aG6TgQ
- Kinect больше не производят - https://goo.gl/bFgswT
- Твиттер будет помечать политическую рекламу - https://goo.gl/DtYWeN
- Доля бесконтактных платежей в США - 5% UK 45% - https://goo.gl/wzvCmS
- Deep Map + Ford - https://goo.gl/j8wCvt
- Внутренняя история вокруг снепчата - https://goo.gl/3UX3Bu
- VC пишут про ICO - https://goo.gl/cZEdpc - мол риски и опасность
- Guardian заработал 140 миллионов фунтов с помощью "призывов задонатить" в конце статей при этом не закрывая контент - https://goo.gl/cZEdpc
- Ben Evans про фейсбук, моду и дух времени. Мол не фейсбук определяет мнения своим алгоритмом фида, а лишь курирует течения в обществе - https://goo.gl/yffqHS
#internet
#digest
Подборка статей с канала на тему "Статьи и заметки автора"
55 Заметка про TTA - /channel/snakers4/1368, /channel/snakers4/1369
56 Заметка про SELU - /channel/snakers4/1375
57 Модели и датасеты для семантической классификации - /channel/snakers4/1393
58 Статья автора про поиск работы - /channel/snakers4/1395
59 Итог конкурса carvana - /channel/snakers4/1401
60 Заметка про оптимальное использование железа для нейросетей - /channel/snakers4/1422
61 Классические статьи про нейросети - Resnet - Inception - /channel/snakers4/1465
62 Детальный ответ автора про последнее соревнование - https://spark-in.me/post/fish-object-detection-ssd-yolo
#digest
#data_science
Что интересно подписчикам канала?
Больше статей, заметок из практики – 19
👍👍👍👍👍👍👍 51%
Больше копоти, кода, линукса – 10
👍👍👍👍 27%
Больше научных статей – 4
👍 11%
Больше соревнований – 3
👍 8%
Больше ссылок, дайджестов, сборников – 1
▫️ 3%
👥 37 people voted so far.
Закончился конкурс с рыбками. Что интересно - публичный лб и приватный почти не отличаются. На платформе нормальные админы?) Автор умудрился занять 18 место из 400+ участников. Плакать или радоваться - хз.
Читать полностью…Современный dataset для image object detection
- http://detrac-db.rit.albany.edu
#datasets
Эволюция GAN
- https://www.youtube.com/watch?time_continue=1&v=XOxxPcy5Gr4
#deep_learning
Посоветовали для чтения кадров из видео это как альтернативу open-cv.
Пишите в чат, если кто-то пробовал:
- http://imageio.readthedocs.io/en/latest/examples.html
#data_science
#video
Попробовал Fb PCA (либа фейсбука) http://fbpca.readthedocs.io/en/latest/#fbpca.pca на матрице 1,000 x 1,000,000. Не дождался. А Incremental PCA отработал за несколько минут.
Читать полностью…Просто, понятно, полезно и со смыслом про визуализацию
https://alexanderdyakonov.wordpress.com/2017/10/30/визуализация-часть-1/
#data_science
Если надо скопировать миллионы файлов в Ubuntu очень быстро
find FOLDER -maxdepth 1 -type f -name '*.jpg' -print0 | xargs -0 mv -t FOLDER/SUBFOLDER/#data_science
#linux
Опен сорсная библиотека для выделения векторов из текста
https://radimrehurek.com/gensim/intro.html
#nlp
#data_science
Ура, мы сделали это! Выкладываем мощнейший датасет ассоциаций к словам и выражениям русского языка: https://github.com/dkulagin/kartaslov/tree/master/dataset/assoc
Набор включает в себя более 50.000 слов и выражений, а различных ассоциаций более одного миллиона!
Поддержите нас пальцем вверх на Хабре, пожалуйста: https://habrahabr.ru/post/341406/
В статью - https://spark-in.me/post/fish-object-detection-ssd-yolo - добавил видео от одного из лидеров конкурса ZFTurbo.
Читать полностью…Если вы есть в ods, то прочитайте последний день на канале proj_kaggle_fish. Если вы знаете базовые архитектуры, то вы очень прокачаетесь.
Читать полностью…В Keras появилась поддержка multi GPU из коробки. Наконец-то. Теперь для готовых моделей keras не хуже pytorch.
https://www.pyimagesearch.com/2017/10/30/how-to-multi-gpu-training-with-keras-python-and-deep-learning/?__s=jzpzanwy9jmh18omiik2
#data_science
#deep_learning
Офигенный туториал с анимацией из доки theano про суть сверточных слоев и статья на эту же тему:
- https://goo.gl/JG3vEd
- http://deeplearning.net/software/theano/tutorial/conv_arithmetic.html
- https://arxiv.org/pdf/1603.07285.pdf
#deep_learning
#data_science
Судя по прошлому опросу просили полнотекстовую статью.
В прошлый раз по итогу конкурса сил хватило только на пост на канале. В этот раз я разродился чутка причесать код, выложить тетрадки и написать целый длинный блог пост. По сути было весело:
- новый домен - видео - и сгенерирована тонна копипасты для работы с ним в тетрадках;
- новые sota модели для изучения;
- изучен и весьма распробован новый фреймворк - pytorch;
Статья
- https://spark-in.me/post/fish-object-detection-ssd-yolo
Комментируйте, репостите, шлите друзьям, критикуйте.
И как всегда можно:
- Поставить оценку каналу тут - /channel/tchannelsbot?start=snakers4 (1000+ подписчиков и только 50+ оценок - 5% как бы норм, но почему не больше?)
- Задонатить на новые статьи и развитие канала (вести канал несложно, статьи и соревнования занимают очень много времени) тут:
-- На чай - https://goo.gl/zveIOr
-- Договор ТКС 5011673505
#data_science
#deep_learning
#computer_vision
Полезности в постгресе - не знал про similarity и COPY
- https://habrahabr.ru/post/340460/