Gentleminds
104 subscribers
1 photo
1 video
2 files
176 links
Админы канала стараются постить интересные новости и статьи про дипленинг и не только, а так же кратко их описывать.
Наши сайты:
gentleminds.io
pozus.io
加入频道
Вы наверняка уже слышали про уязвимости Meltdown и Spectre, которые, по некоторым оценкам, являются самыми крупными проблемами ИТ индустрии за все время и повлияют на нее самым существенным образом. В этих статьях https://geektimes.ru/post/297029/ https://geektimes.ru/post/297031/ на доступном языке рассказывается про них, и становится понятно почему при попытке их исправить будет неизбежна существенная просадка производительности. Встретил на просторах фэйсбука такое высказывание, что мы все это время жили хорошо по производительности взаймы у безопасности.
Mikel Bober-Irizar протестировал производительность ML библиотек после PTI патча

https://medium.com/implodinggradients/meltdown-c24a9d5e254e

TL;DR: производительность в среднем падает на 5-10%, но для некоторых задач (факторизации матриц) достигает 40%
Японские ученые реконструировали картинки из мозговой активности человека. Они обучили генерационную модель на паре “активность-картинка”, получилось довольно симпатично. Мозговая активность считывалась с помощью магнитного резонанса во время показа картинки человеку. https://www.biorxiv.org/content/biorxiv/early/2017/12/30/240317.full.pdf
Классная статья про решение задачи поиска одежды по фотографии https://medium.com/@movchan74/how-to-apply-distance-metric-learning-for-street-to-shop-problem-d21247723d2a

https://github.com/movchan74/street_to_shop_experiments

Александр описывает все этапы решения и проблемы, с которыми он столкнулся: сбор данных (скрейпинг Aliexpress), чистка, разделение на выборки, triplet loss, анализ результатов.

Ёмко и жизненно, ставлю класс.

Еще и демку сделал http://vps389544.ovh.net:5555/
Еще одна статья на медиуме, где автор в форме комиксов постарался объяснить метод обучения с подкреплением Actor-Critic. https://medium.com/@rudygilman/intuitive-rl-intro-to-advantage-actor-critic-a2c-4ff545978752
Бенчмарк tf на GPU с архитектурой Volta.

https://medium.com/initialized-capital/benchmarking-tensorflow-performance-on-next-generation-gpus-e68c8dd3d0d4

Paperspace Volta (16GB — $2.30/hour)
Amazon EC2 p3.2xlarge Volta (16GB— $3.06/hour)

Я как-то упустил момент, когда Volta теслы появились у облачных провайдеров.
FAIR выпустил реализации Mask R-CNN и RetinaNet (и еще несколько сортов R-CNN) на caffe2

https://github.com/facebookresearch/Detectron

Интересно, что general purpose фреймворки (caffe2, tf (https://github.com/tensorflow/models/tree/master/research/object_detection)) внедряют object detection примитивы глубоко внутрь себя.
https://github.com/arogozhnikov/python3_with_pleasure

Список полезных возможностей python 3.

Узнал про:
* pathlib, облегчающий работу с путями (больше никакого os.path.join!)
* проверку type-hints во время выполнения с помощью enforce
В продолжение темы питона - о прекрасной библиотеке attrs для удобного создания классов без методов (namedtuple для людей)

https://glyph.twistedmatrix.com/2016/08/attrs.html
Сабреддит со сгенерированными ненастоящими видео (непорно):

https://www.reddit.com/r/videofakes/

90% видео с Николасом Кейджем.
https://www.youtube.com/watch?v=ttL0SGPaidk
Если вы раздумываете чем бы заняться, вам поможет список идей проектов от OpenAI (хочется взять и сделать) https://blog.openai.com/requests-for-research-2/
Интересная библиотека, которая изменяет размеры картинки так, чтобы максимально сохранить её суть https://github.com/esimov/caire
Лаборатория глубокого обучения МФТИ выложила свою библиотеку для построения end-to-end диалоговых система и обучения чатботов. Версия 0.0.1 подсказывает, что это далеко не конечный продукт.

https://deepmipt.github.io/DeepPavlov/
https://research.fb.com/announcing-tensor-comprehensions/

Новый алгоритм фейсбука, который позволяет из кода на http://halide-lang.org/ получать оптимизированные с помощью генетических алгоримтов CUDA-ядра. Обещают скоро добавить в PyTorch.
https://www.gwern.net/Danbooru2017

Есть такой сайт - https://danbooru.donmai.us (запрещено на территории РФ) на котором поклонники аниме размечают картинки. Делают они это уже давно и очень упорно.

В базе 1.9 Тб (2.94 млн) картинок, 333 тысячи тегов (26.3 тега на картинку).

Масштабы впечатляют. Всем аниме.