В процессе поиска решения для одной прикладной задачи нашел такой туториал.
Вкратце - keras не максимально гибок для задач, отличных от задач классификации.
Туториал призван помочь использовать keras в сочетании с tensorflow для максимальной гибкости
- https://blog.keras.io/keras-as-a-simplified-interface-to-tensorflow-tutorial.html
#data_science
Интересная статья про манипуляции в медиа / интернете
- https://www.ribbonfarm.com/2017/05/23/there-are-bots-look-around/
На эту тему также есть классическая статья в экономике, суть которой сводится к тому, что если на рынке никак не контролируется качество продукта, то все рано или поздно сваливается сами знаете куда
- https://en.wikipedia.org/wiki/The_Market_for_Lemons
#internet
Продолжение проекта про птичек.
Proof of concept пройден.
Теперь надо сделать вширь и вглубь и запилить мобильное приложение.
Читайте, комментируйте, может что-то подскажете.
https://spark-in.me/post/bird-voice-recognition-five
#data_science
Заметка из практики работы с серверами на абзац - про собственную глупость и простой способ ее исправить.
У меня есть сервер, который я собрал для своих целей. Стоит в другом городе в другой стране. Доступа физического туда нет. Человека, который бы смог даже с клавиатуры поправить что-то - в течение месяца там не будет. Есть несколько открытых портов в фаерволе и в роутере стоит проброс портов.
Надо пробросить новый порт в роутере. Обычно я это делаю через удаленный доступ в админку роутера (естественно минимальные меры безопасности тоже присутствуют). Но при этом есть 50% шанс, что роутер откатится на прошлый случайный конфиг (почему так происходит - желания разбираться ноль). Естественно заходить через RDP (я использую nomachine) с местным интернетом - лень (тут высокий пинг и ассиметричный канал).
Естественно роутер откатывается. Зайти на него нельзя удаленно (в старом конфиге не было). Порты для RDP тоже все закрыты. Открыт только ssh и порт для базы.
Решение - поменять порт базы на порт RDP программы, поменять порт в самой программе (на сервере и на своем клиенте), зайти через RDP, открыть порты и откатить все назад.
#linux
Скоро откроется computer vision job board от pyimagesearch.
- https://goo.gl/LiqaT5
Может кому-то актуально =)
#data_science
Судя по новым видео скоро совсем выложат второй сезон fast.ai про нейросети. Предвкушаем.
#data_science
Подписчик прислал книгу про основные команды в Linux. Читать можно онлайн:
- http://conqueringthecommandline.com/book/basics
Я обычно умудряюсь нагуглить ответ в гугле / документации / Stack overflow (и его аналогах), но кому-то может зайдет в виде книги =)
#linux
Послушал вторую неделю нового курса fast.ai:
- Курс https://goo.gl/xd85ng
Из интересного:
- Введение в использование Pytorch для наивной оптимизации
- На второй неделе рассказывали про методы факторизации матриц:
-- SVD - https://goo.gl/avR87N
-- NMF - https://goo.gl/Hw7FSx
- Применимость таких методов
-- Face Decompositions
-- Collaborative Filtering, eg movie recommendations
-- Audio source separation
-- Chemistry
-- Bioinformatics and Gene Expression
-- Topic Modeling (темы текстов)
- Эти методы больше всего по сути похожи на метод главных компонент
- На практике - самый популярный метод - NMF и в sklearn есть его имплементация
#data_science
Интересное в мире ML:
- Эволюционные методы в AutoML или методы мета-обучения
-- Статья https://goo.gl/vhuKkE
-- Код - https://goo.gl/ykRptq
- AutoML в AirBnb - https://goo.gl/jsh2nt
-- Понятность моделей против их точности - https://goo.gl/78wALw
-- Сравнение разных моделей - https://goo.gl/buW283
- Подход AirBnb к своим моделям и пайплайнам - https://goo.gl/iT9GPq
-- Их открытый софт для пайплайнов работы с данными - https://goo.gl/RSqpdh
#data_science
Вторая часть AI-Grant 20 грантов по US$2500
- https://blog.aigrant.org/ai-grant-2-0-e29408f9e32?mc_cid=7a61f59136
Я подал свой проект, чего и вам советую)
#data_science
Русские работодатели такие русские работодатели.
Или чего не надо делать при найме на работу
- https://spark-in.me/post/how-to-waste-your-life
#internet
Интересное в мире интернета:
- Ben Evans - https://goo.gl/YNFhqS
-- Китай инвестирует очень много денег в AI на государственном уровне - https://goo.gl/xquq8e
-- Наконец-то iRobot догадались что данные с пылесосов надо использовать - https://goo.gl/iavYtq
-- Отличная статья от автора Keras про ограничения Deep Learning - https://goo.gl/9QnT91
-- Картинка, иллюстрирующая это - https://goo.gl/rTk41j
-- Про будущее нейросетей от автора Keras - https://goo.gl/aQKyWB
-- Бум Sharing Economy в Китае - https://goo.gl/BLKCgN
-- Длинная статья про гонку между Uber и Lyft - https://goo.gl/8X5uZ3
#internet
Fast.ai открыли вторую серию видео про deep learning.
- http://www.fast.ai/2017/07/28/deep-learning-part-two-launch/
#data_science
Для самых занятых или ленивых недельная подборка с канала
- http://tinyletter.com/snakers41/letters/spark-in-me-13
#digest
Отличная статья про то, что такое ROC и AUC простыми (и не очень) словами с картинками.
- https://goo.gl/8z7MXY
#data_science
Соревнования ImageNet теперь официально проводятся на Kaggle
- http://www.image-net.org
#data_science
Бенчмарки разных библиотек для градиентного бустинга
- Картинка - https://goo.gl/f4xLft
- Оригинал https://goo.gl/juec5Q
- Код https://goo.gl/pyTmVQ
Использование GPU для обеих библиотек
- XGBoost - https://goo.gl/Y9UWVQ
- LightGGM - https://goo.gl/E2ziKT
Разбираем на копипасту.
#data_science
Хорошо объясняет, что же это за аналитическое продолжение, из-за которого 1 + 2 + 3 + ... = -1/12
https://youtu.be/sD0NjbwqlYw
Пара занятных примеров про O-нотацию в программировании
- https://www.interviewcake.com/article/python/big-o-notation-time-and-space-complexity
Натолкнулся на книгу от автора Keras про нейросети.
Она стоит 40 долларов. Может кому-то придется по вкусу.
Если вы ее читали и можете сравнить:
- с Deep Learning book http://www.deeplearningbook.org
- или с Neural Networks and Deep Learning http://neuralnetworksanddeeplearning.com
Напишите пожалуйста в личку.
Продолжаем серию статей про голоса птичек.
Тут вы можете посмотреть на спектрограммы и одновременно послушать птичек!
Кроме того, спектрограммы очень красивые.
Очень советую прочитать и поделиться тем, какая птичка больше всего понравилась.
Также если вы повторите основные шаги в ipynb, то вы сами сможете слушать и смотреть на птичек)
https://spark-in.me/post/bird-voice-recognition-four
#data_science