Грокс
39.3K subscribers
425 photos
47 videos
11 files
2.68K links
Технологии, финансы, аналитика и пропаганда.

Куратор: @ipestov.
По рекламе: @nazaretsky

РКН: https://gosuslugi.ru/snet/67a391c4a16f1b55428d381a

Полезные видео: @grokstv
Тест на логику: @psylogicbot
加入频道
«The real problem isn’t fake news; it’s that people have given up on that search for truth» — Jon Evans.

Великолепная колонка о мышлении, добавочном суждении и постправде, что очень хорошо гармонирует с предыдущей темой. Но, признаюсь, я никогда не думал, что буду читать о целесообразности действий США во Вьетнаме или Ираке на TechCrunch. Хотя пост не про политику, иначе бы он не был упомянут в Groks.

https://techcrunch.com/2018/02/18/fake-news-is-not-the-real-problem/ #созидание
Хочу вновь процитировать Германа Каплуна и поделиться интересной статистикой Pipedrive по продажам в различных странах и отраслях экономики:

«Лидер по продажам-Южная Африка, но самые лучшие сейлзы в Австралии. Россия на 11 месте и сделки в РФ закрываются примерно вдвое быстрее, чем в Германии. Статистика вся берется из системы, так что либо россияне позже начинают заносить информацию, либо наша ментальность не терпит очень длительных переговоров. Думаю, что второе. У нас ведь можно договориться о чём-то буквально за 2-3 встречи. А, если уж не договорились, то чего время терять? Ещё интересное из их исследования:

- Самые тяжелые сделки у агентов по недвижимости.

- Для всех пользователей среднее время закрытия сделки - 40 дней (в Швейцарии 29, в Нидерландах —50 дней).

- В Южной Африке продавцы конвертируют ошеломляющие 21,5% всех потенциальных клиентов, в то время как во Франции это всего 13%. в США только 16%.

- Утверждается, что более низкие коэффициенты конверсии в западных странах связаны с более развитыми экономическими условиями и более жесткой конкуренцией.

- Производственный сектор регистрирует коэффициент конверсии 26%, а это означает, что в среднем каждая четвертая сделка закрывается. Это самая высокая из всех отраслей промышленности и почти в два раза выше средней. Торговля и строительство заняли второе место, за ними следуют творческие отрасли.

- Команды, работающие в сфере финансов, скорее всего предпочитают телефонные звонки, обычно около 4 на 1 клиента. В разработке программного обеспечения и приложений более предпочтительными являются электронные письма, требующие трех повторений, чтобы закрыть сделку.

- Большинство встреч на обед запланированы для тех, кто работает в сфере здравоохранения и недвижимости. Секторы, которые, скорее всего, будут проводить личные встречи, - это недвижимость и производство, что явно связано с их процессом продажи на месте».

Кстати Pipedrive — портфельный проект фонда Каплуна и одно из лидирующих в мире CRM решений для малого и среднего бизнеса.

https://www.facebook.com/german.kaplun/posts/10215845371266434 #аналитика
На просторах интернета мне повстречалась увлекательная статья, которая рассказывает об истории машинного перевода. Несколько удивительно, но понятию Natural Language Processing в сегодняшнем осмыслении мы обязаны кучке стран, которые сорок лет подряд пыталась шпионить друг за другом. А вообще мне трудно выделить какие-то тезисы. Памятных интересностей вроде машины Троянского или «эти типы стали...» там много.

http://vas3k.ru/blog/machine_translation/

Кстати, рекомендую посмотреть на Вастрик.ру в целом. Чего стоят лишь одни иллюстрации к статьям... сколько щепетильных стараний... Хочется про это рассказать. Правда в отличии от автора я приемлю жаргонизмы только в эпистолярном жанре, однако это один из лучших гиковских блогов рунета, на мой взгляд. Большие публикации там выходят редко, но есть почтовая рассылка Вастрик.Инсайд.
На днях на TechCrunch писали про SignAll — проект, который занимается переводом языка жестов. Это чудесно! И я вспомнил, как однажды переводил материал для Хабра о компании, где работают глухие разработчики. Приведу один фрагмент из примечания:

«В статье было интересное слово Grokker, которое нигде не переводится и по которому я не нашел информации в рунете. Возможно, многие хабравчане тоже не знают, поэтому поделюсь своим личным маленьким открытием. Grok — означает понять так основательно, что наблюдатель становится частью наблюдения. А гроккер, соответственно, тот, кто умеет так понимать».

Символизма много. Вспомнить всё было приятно, но я не об этом. Последним витком эволюции перевода являются нейросети. И есть замечательное чтиво от разработчика из команды машинного перевода Яндекса, которое повествует о проблемах ИИ в данной сфере: «грязные» данные, омонимы, многозначность слов и прочее.

Несмотря на всё это, настоящее впечатляет. Но ведь живой перевод — это не просто статистический анализ слов. А компьютер по-прежнему не понимает текст. Слова же в нём не преобразуются в идеи или образы. Машинный переводчик сегодня — это китайская комната. Данная мысль хорошо раскрыта в статье The Atlantic.

Интересно, какая из последних двух публикаций является более органичным продолжением истории машинного перевода...
Вчера Forbes опубликовал рейтинг 20 самых дорогих российских интернет-компаний. Помимо того, что Билетикс каким-то образом обогнал Aviasales, там ещё нет Рамблера. И если в первом случае 30-и кратная разница в посещаемости согласно Similarweb ничего не гарантирует (что врядли), то Rambler&Co должен подтеснить хотябы SkyEng, который на 20 месте при оценке в $80 миллионов.

SkyEng огромные молодцы. Я их очень уважаю, как и всех других участников рейтинга. Но пару лет назад Мамут Потанину только за долю в Рамблере почти $300 миллионов отдал. Там Газета, Лента, Афиша, ЖЖ, ну куча всего. Был дефолт всех этих медиаактивов? — Нет. Просто кто-то вероятнее всего забыл про них. И удивляет не только этот кто-то, но и другие из Коммерсанта, Ведомостей, РБК, кто цитирует этот рейтинг.

Получается, что списки Forbes настолько знамениты, что нельзя их не упомянуть у себя, даже если там написана чушь. Это ж Forbes! Все будут писать про это, значит и мы должны, первыми! Задумался о brand awareness и brand strength. Хочется пожелать всем участникам рейтинга построить столь сильные и нерушимые мировые бренды #мысливслух.
В последнее время участились случаи, когда я публично указываю на какие-то несостыковки в подаче информации. Я не сменил фокус и не упиваюсь моментом, когда мне удаётся или кажется, что удалось заметить какую-то небольшую ошибку в числах или фактах. Но точно ли это небольшая ошибка? Для Forbes то? Учитывая, что его цитируют все?

Ну вот будь Рамблер публичным, то обеднел бы господин Мамут от непутёвых инвесторов, прочитавших Forbes и непосмотривших индекс. Тыщ сто рублей как с куста запросто! Смешно о серьёзном. Однако умение осознавать числа — крайне важный навык. Для профессионального автора тоже, если тот не пишет для газеты Жизнь.

Позволю себе ещё немного заумного бреда. Я считаю, что косвенная роль тематических медиа в экономике страны колосальна. Это как культура или образование. Отдельный пласт. Я давно называю Хабрахабр своим альма-матер. И вот если взглянуть на США, то некая параллель между состоянием СМИ и рынком очевидна.

Для наглядности там сайты университетов цитируются по всему миру. Правда распространённость английского тоже играет важную роль. Поэтому другой пример: ценные бумаги. Там Yahoo Finance, Investopedia, Seeking Alpha, Market Watch, The Fool и множество соответствующих сабредитов. А у нас что? — Вот настолько же и разнятся масштабы фондовых рынков.

Понятно, что спрос рождает предложение. Но и спрос порой формируется занарок. Здорово когда этим занимаются грокеры своего дела. #мысливслух
Дюже любопытный график о творческой экономике и косвенной роли платформ. Только самый прибыльный тут Twitch, а не Youtube, как пишут BI и Statista.

https://goo.gl/1WQe6V (Business Insider) #аналитика
Про нейросети часто говорят, что они "имитируют работу мозга", но это большое преувеличение. Да, информация передаётся между слоями нейросети подобно сигналу между нейронами в мозгу. Но даже самые сложные нейросети на порядки проще самых простых биологических мозгов. Вот познавательное исследование - учёные разобрали, как работает обонятельная система бражника (обычный серый мотыль) и смоделировали на её основе нейросеть. А в голове у мотыля непростая система: 30 тысяч химических рецепторов улавливают запахи, затем сигнал передаётся в антенную долю, где 60 разных клубочков отвечают за разные запахи. Дальше код уловленного запаха передаётся в грибовидное тело (это такие парные структуры в мозгу насекомых, состоящие из нескольких слоёв нейронов), где 4000 специальных клеток перекодируют запахи в воспоминания. На финальном уровне несколько десятков внешних нейронов интерпретируют полученные сигналы в действия, к примеру "лететь вверх".

Эта система сильно отличается от компьютерных нейросетей: к примеру, антенная доля кодирует сигнал с низким количеством параметров, а следующий уровень, грибовидное тело - уже с высоким. В нейросетях слои обычно имеют схожее количество измерений. А ещё успешное распознавание запаха приводит к выделению гормона октопамина, который помогает закреплять полезную информацию. В нейросетях всё по-другому - там связи между слоями пошагово корректируются, пока не будет получен правильный результат.

На смоделированной нейросети учёные увидели много интересного: как сигнал очищается от шума с увеличением разрядности между слоями, как обучение без октопамина замедляется и становится практически бесполезным. Мотыль обучается очень быстро - для того чтобы правильно запомнить нужный запах, ему достаточно нескольких итераций, тогда как обучение искусственных нейросетей требует очень много времени. Исследователи планируют использовать подсмотренные у природы механизмы для того чтобы обучать нейросети быстрее и эффективнее. Мне кажется, такие заимствования у природы - это очень круто!

https://www.technologyreview.com/s/610278/why-even-a-moths-brain-is-smarter-than-an-ai/
Грокс
Вновь про проблему централизации источников информации и около. На TechCrunch вышла колонка «How Facebook stole the news business». Автор в ретроспективе анализирует отношение соцсети к изданиям и бьёт тревогу из-за появления «local news digest». Мол убивает…
У меня уже недели две в закладках была огромная статья «Inside Facebook's Two Years of Hell» на Wired. Но байты памяти освободились, после прочтения конспекта этой статьи от Евгения Тимко, который я и рекомендую к вашему вниманию.

https://www.facebook.com/jenyatim/posts/10157217926469447
Рубрика занимательных статистических фактов за последнее время #аналитика:

1. В 2017 году общий объем онлайн продаж в Китае вырос на 32% и достиг 7.18 трлн юаней ($1.15 трлн), впервые превысив планку в 1 триллион долларов. Для сравнения: объем рынка электронной коммерции в США в 2.5 раза меньше — всего $455 млрд (источник источника —@sinatech).

https://www.digitalcommerce360.com/2018/02/08/online-retail-sales-china-soar-past-1-trillion-2017/

2. В Китае более 300 магазинов Android приложений. Но ещё там проживает 565 млн игроков, которые потратили $27.5 млрд в 2017 году. 67% из этих людей — мобильные игроки. Теперь неудивительно, почему Tencent на играх зарабатывает больше всех (Sony, Blizzard, EA).

https://news.unilead.net/2018/02/26/china/

3. В Индии, Индонезии, Китае и других странах UC Browser активно использует 430 млн пользователей. Продукт холдинга Alibaba нацелен свергнуть с престола Google Chrome в Азии. А в Индии это уже произошло, согласно Statcounter.

https://www.wsj.com/articles/a-browser-youve-never-heard-of-is-dethroning-google-in-asia-1514808002
Грокс
Вновь на TechCrunch мне повстречалась любопытная статья с ироничным заголовком «В честь банкротства Tesla». Автор заставляет по новому взглянуть на компанию Маска и акцентирует внимание на том, что Tesla разрабатывает инфраструктуру для электромобилей и в…
Тема возобновляемой энергетики явно не под стать основному контенту Groks, но вывод действительно интересный. Вот зачем нам атомные электростанции? Понятно, что у природы свой ритм. Но можно ж наставить солнечных панелей и ветрогенераторов, а потом хранить энергию в батареях? — Можно. Однако, если 80% процентов энергообеспечения США будет работать таким образом, то батарей придётся купить на $2.5 триллиона. И пока не важно, что Маск строит крупнейшие литийно-ионной аккумуляторы за 100 дней.

https://www.technologyreview.com/s/610366/relying-on-renewables-alone-would-significantly-raise-the-cost-of-overhauling-the-energy/
AmoConf. Я уже не раз упомянал это удивительное событие и 4 апреля в 10:00 в СК Олимпийский оно произойдёт вновь. Уже который год по масштабам они конкурируют только сами с собой. И на этот раз AmoConf планирует собрать 25000 человек в одном зале! Это крупнейшая бизнес конференция не только в России, но и в мире.

https://2018.amoconf.ru/

Есть такая шутка: «Не получился бизнес — иди в бизнес тренеры». Так вот на AmoConf бизнес тренеров нет. Состав спикеров в этом году очень интересный: Юрий Дудь, Сергей Шнуров, Оскар Хартман, Михаил Кучмент и... сооснователь Apple Стив Возняк! Это будет грандиозное шоу!

Да, это #реклама. Но я тоже буду 4 апреля в 10:00 в СК Олимпийский. А вообще нас там будет много. Говорят пару десятков тысяч человек. Может и вы там будете?

Регистрируйтесь на
https://2018.amoconf.ru/?coupon=grok18

по промокоду: grok18
Несколько материалов об анонимности данных, а точнее о её отсутствии.

Современные возможности таргетинга поражают воображение. В частности MyTarget недавно научился сегментировать аудиторию по психотипам! Однако всякие геолокационные параметры рекламных сетей позволяют превратить показ объявлений в инструмент слежки. В рамках эксперимента исследователям потребовалась 1000 долларов, чтобы отследить перемещения интересующего их пользователя с точностью до ~8 метров по MAID.

https://www.wired.com/story/track-location-with-mobile-ads-1000-dollars-study/

Недавно в СМИ разошёлся интересный факт: при общении с репортёром Wired сотрудник Facebook попросил отключить смартфон, чтобы соцсети было сложнее зафиксировать факт их общения. Вообще современный смартфон напичкан множеством сенсоров: 2-3 камеры, датчик освещённости, акселерометр, гироскоп, GPS и ГЛОНАСС, магнитометр и другие. Статья на GeekTimes повествует о том, что можно узнать о владельце смартфона, получив доступ к одному или нескольким сенсорам.

https://geektimes.ru/post/298161/ (спасибо @internetanalytics)

Группа исследователей спарсила публичные адреса биткоин-кошельков, а потом сопоставили их с адресами, которые связаны с даркнетом (Silk Road, Wikileaks). В результате они нашли 120 совпадений, причём некоторые персонажи засветили своё имя и электронную почту. А ведь полиция и спецслужбы ещё могут получить доступ к данных криптовалютных бирж и истории посещений сайтов от провайдеров. Суждение об анонимности криптовалютных транзакций сильно преувеличено.

https://www.wired.com/story/bitcoin-drug-deals-silk-road-blockchain/

В России в миг обрело популярность приложение GetContact. Все начали синхронизировать свои контакты, дабы увидеть как ты записан у других. На фоне этого мне вспомнилась другая история про Facebook, а точнее про их алгоритм «People You May Know». В статье на Gizmodo есть перечень историй, вроде этой: женщина, получила от Facebook рекомендацию подружиться с любовницей отца, из-за которой он бросил семью 40 лет назад. И всё благодаря импорту телефонных книжек.

https://gizmodo.com/how-facebook-figures-out-everyone-youve-ever-met-1819822691
Ubisoft рассказала про их инструмент Commit Assistant AI, который ловит баги перед совершением коммита. Разработчики скормили нейросети тонны кода, написанные в компании за 10 лет. И машина научилась корректировать работу програмистов, ибо изучила все популярные ошибки в ретроспективе.

Нас так часто пугают тем, что совсем скоро с прибытием искусственного интеллекта миллионы людей потеряют свою работу... Касательно монотонного физического труда это никогда не вызывало сомнений. Но представьте, если машина изучит все коммиты на GitHub?

http://www.wired.co.uk/article/ubisoft-commit-assist-ai
Смежной историей будет рассказ на The Verge про машинный интеллект, который в погоне за рекордами в Q*bert от Atari обнаружил баг или некую закономерность действий, позволяющую набрать миллион очков 🙂

https://www.theverge.com/tldr/2018/2/28/17062338/ai-agent-atari-q-bert-cracked-bug-cheat
Грокс
Вновь про проблему централизации источников информации и около. На TechCrunch вышла колонка «How Facebook stole the news business». Автор в ретроспективе анализирует отношение соцсети к изданиям и бьёт тревогу из-за появления «local news digest». Мол убивает…
В последнее время всё больше изданий переходит на модель платных подписок. И это очень тесно связано с осознанием того, что рост доходов с рекламы в основном приходится на Facebook и новостные агрегаторы.

Вспомнилось как Демьян Кудрявцев, говорил о том, что платформы убивают независимые медиа. Но Digiday, общаясь с руководителями ведущих медиа, упоминает словосочетания product marketing, churn rate и прочее. Если контент — это продукт, за который хотят платить, то платформы ему не страшны.

Отдельно хочется сказать про читатлей. У нас такого нет, но в США проблема «fake news» — действительно проблема. У всех растёт недоверие к источникам информации, но для 79% опрошенных платить за новости кажется странным, согласно Reuters Institute. Забавное противоречие.

https://digiday.com/media/going-end-tears-reality-check-coming-subscription-thirsty-publishers/
Рубрика занимательных статистических фактов за последнее время #аналитика:

1. В 2017 году на российском рынке было продано 274 тысяч умных часов — это в 2.5 раза больше, чем годом ранее. А рынок фитнес-браслетов вырос на 450% в штуках, до 474 тысяч устройств.

https://vc.ru/34246

2. WordPress принадлежит 60% рынка CMS, согласно W3Techs на основе анализа 10 млн сайтов из рейтинга Amazon Alexa. А вообще приятно было посмотреть на столь знакомые названия и вспомнить свои подборки интересностей и полезностей на Хабре.

https://w3techs.com/technologies/overview/content_management/all

3. Группа Fasten, Яндекс.Такси с Uber, Maxim и Gett составляют всего 32.8% рынка такси-перевозок. Я и не подозревал о столь огромной доле нелегалов, чья выручка с 2015 по 2017 год сократилась на 20% до 75 млрд рублей.

https://vc.ru/32897
Однажды я уже писал про завышенное восприятие достижений машинного интеллекта, а тут мне повстречалась публикация «AI's dirty little secret: It's powered by people». Вот к примеру, вы помните как умный ИИ изучил миллионы панорам с Google Street View и нашёл корреляцию между припаркованными машинами жителей района и их демографическими признаками? А потом ещё попытался определить их политические взгляды? Но всё это произошло благодаря автоэкспертам, которые определяли марки машин для сопоставления с ценами на Craiglist. За кажым дорогим ИИ стартапом, стоит множество людей из развивающихся стран, которые за 50 центов в час маркируют данные.

Получилось, что я описал какие-то очевидности, но статья несколько о другом, в моём понимании.

https://phys.org/news/2018-03-ai-dirty-secret-powered-people.html
Небольшой эксперимент в Groks.

В закладках у меня постоянно копятся и потом удаляются потенциально интересные для вас материалы на тему машинного интеллекта и около. Большинство из них не публикуется здесь по двум причинам: специфика канала имеет негласное ограничение на количество постов или ссылка просто теряется из виду.

Что если раз в неделю делать подборку из таких публикаций без моих аннотаций?

Baidu’s voice cloning AI can swap genders and remove accents — TheNextWeb.

Google is helping the Pentagon build AI for drones — Gizmodo.

The increasing use of artificial intelligence is stoking privacy concerns in China — SCMP.

Google debuts AdSense ‘auto ads’ with machine learning to make placement and monetization choices — TechCrunch.

How an ex-YouTube insider investigated its secret algorithm — The Guardian.

Google’s new AI algorithm predicts heart disease by looking at your eyes — The Verge
Менее 0.001% адресов принадлежит почти 20% всех биткоинов. А около 3% криптовалютчиков владеет почти 96% биткоинов. В массивной статье на Medium о распределении богатств в системе Сатоши вы встретите ещё больше всяких интересных цифр. Обращаю внимание, что все данные в Google Sheets динамичны.

https://medium.com/@BambouClub/are-you-in-the-bitcoin-1-a-new-model-of-the-distribution-of-bitcoin-wealth-6adb0d4a6a95 #аналитика