Daniilak — Канал
646 subscribers
630 photos
117 videos
12 files
473 links
Пишу о технологиях и датасетах, немного ML

Рекламирую Чебоксары
加入频道
После того, как Google прекратил генерировать новые URL-адреса goo.gl в марте 2019 года, эти ссылки перестанут работать 25 августа 2025 года

Команда Archive Team ведёт архивацию всех коротких ссылок в проекте URLTeam. Уже просканировано 38.6 миллиардов ссылок и обнаружены активными 7 миллиардов ссылок
👍2🔥2
Решалка капчи через gpt4, промпты можно забрать из кода

https://github.com/aydinnyunus/gpt4-captcha-bypass
2👍2🔥2
Государство заставит получать лицензию на ведение образовательной деятельности всех, кто делает курсы и тренинги
Давно пора)
👎4🔥3👍2
Куся теперь в 3D
Было - стало
🥴5👍2👎1👀1
В 2007 году произошло важное событие, связанное с открытыми данными. На конференции в Себастополе, в штате Калифорния, группа экспертов по данным сформулировала восемь принципов открытых данных, вот они сверху вниз:

1. Полнота: данные должны быть представлены в максимально полном виде, за исключением случаев, когда это противоречит правовым или этическим ограничениям (например, защита персональных данных).
2. Первичность: данные должны быть собраны у источника с наивысшей возможной степенью детализации, не подвергаясь агрегации или модификации.
3. Своевременность: данные должны быть доступны как можно скорее, чтобы они оставались актуальными и полезными.
4. Доступность: данные должны быть доступны для максимально широкого круга пользователей, для любых целей и в прямом смысле предполагает доступ к данным без регистрации, смс или других ограничений.
5. Машиночитаемость: данные должны быть структурированы таким образом, чтобы их можно было легко обрабатывать автоматически, например с использованием общеиспользуемых форматов, таких как CSV, JSON или XML.
6. Недискриминация: данные должны быть доступны всем пользователям на равных условиях.
7. Не-имущественность (non-proprietary): данные должны быть доступны в форматах, которые не ограничены патентами или другими правами интеллектуальной собственности.
8. Лицензирование: данные должны быть свободны от ограничений на использование, модификацию и распространение. Это обычно достигается путем использования открытых лицензий типа Creative Commons.
1
Изучал недавно один сайт и увидел, что его ошибки API светят куски файлов наружу
Anonymous Poll
11%
Нормально
59%
Плохо
30%
Узнать ответ
Зачем нанимать разрабов делать мобильные приложения под iOS, если их всё равно удалят?)
😁3👀3👍1
Спутниковое фото дало ученым лучшее представление о том, как устроены облака изнутри. Изображение, полученное благодаря миссии Earthcare, позволяет увидеть внутреннюю структуру облаков и отследить движение частиц. Эксперты выявили внутри облаков отдельные слои с кристаллами льда и снежинками, подвешенными вверху, некоторые из которых медленно опускаются ниже.
Ученые заявили, что обнаружили четкую границу на высоте около 5000 метров. Именно там происходит таяние льда и снега.
Подобные исследования могут значительно улучшить прогнозы погоды и климата.
🥴2
Вышел интересный сервис - ПочваХаб

Централизованное хранилище данных, которое в перспективе станет мощным инструментом управления данными о почве и ландшафте
👍2🔥1
Платформа для определения подлинности цифровых документов и фотографий
https://ozforensics.com/

У них есть тест, можно поиграться
https://ozforensics.com/try_for_free/liveness_test
👀1
uv — очень быстрый pip на стероидах с большими абмициями

Пост будет особенно полезным, если раньше не сталкивались с pip-tools

uv — это новый и полезный уже сейчас инструмент от компании Astral, которая раньше сделала Ruff. Долгосрочная цель авторов очень амбициозная -- сделать uv единым инструментом для работы с Python и заменить все отдельные инструменты: pip, pyenv, virtualenv, pip-tools, ruff, tox, pipx, и т.д. В итоге любой инженер, аналитик, исследователь или студент сможет легко и единообразно устанавливать Python окружения и разрабатывать Python проекты.

В своей первой итерации uv — это в ~2x-100x раз более быстрая замена трём инструментам:

(1) pip. То есть uv очень быстро устанавливает Python пакеты, что особенно актуально для сложных окружений и особенно когда они устанавливаются регулярно (например, в Continuous Integration). Но и в быту при установке условного Jupyter ускорение в 5-10 раз ощущается очень приятно.

(2) pip-tools. Напомню, что в проектах важно фиксировать не только прямые зависимости (скажем, Django==5.0.3), но и непрямые (те пакеты, которые Django приносит с собой). Это нужно, чтобы у всех пользователей и на всех машинах было идентичное окружение. pip-tools помогает решить ровно эту задачу: он автоматически генерирует и поддерживает в актуальном состоянии ваш requirements.txt файл с полным списком зависимостей. А uv делает то же самое, но гораздо быстрее.

(3) venv & virtualenv. На фоне предыдущих пунктов создание виртуальной среды это скорее мелочь, но даже эту мелочь uv делает ощутимо быстрее :)
👍21
Daniilak — Канал
Спутниковое фото дало ученым лучшее представление о том, как устроены облака изнутри. Изображение, полученное благодаря миссии Earthcare, позволяет увидеть внутреннюю структуру облаков и отследить движение частиц. Эксперты выявили внутри облаков отдельные…
Где-то несколько месяцев назад мне попалась новость о том, что вирхи, которые происходят в верхних слоях атмосферы, в разы сильнее, чем обычно рассчитывали ученые.
Я хотел найти источник, но нашел другую новость от 2023 года:

Исследователи NASA охотятся за гигантскими вихрями, похожими на ураганы, в верхних слоях атмосферы Земли. Миссия VortEx NASA займется их изучением.

В миссии будут использованы четыре ракеты, запускаемые по две за раз. Пары ракет запускают с разницей в несколько минут. Одна ракета достигнет высоты примерно 360 километров, она будет измерять ветер. Вторая ракета поднимется на высоту около 140 километров. Она будет измерять плотность воздуха, которая влияет на то, как формируются вихри. Обе ракеты будут производить свои измерения в течение нескольких минут, прежде чем упадут обратно в Норвежское море.
👍1🔥1🥰1
С 1 июля Reddit обновил свой robotos.txt, теперь всем ботам кроме гугла запрещено индексировать форумы и получать новые сообщения. Бинг вот уже подтвердил что они следуют этому и нового контента пока не будет.

Почему гуглу можно - гугл платит деньги за эту индексацию, подписан прямой контракт с Reddit по которому гугл сможет использовать эти данные для обучения своих языковых моделей
👍1😁1👀1
Кандинский
1👍1🔥1
Среди американских пользователей TikTok набрал популярность термин lazy girl job или «работа для ленивых девушек». На такой должности можно трудиться из дома, без переработок и стресса, но с хорошей зарплатой. Эксперты считают: вопреки названию, тренд вовсе не связан с ленью.
https://rb.ru/story/lazy-girl-job/
👍1👎1