Daniilak — Канал
644 subscribers
630 photos
117 videos
12 files
471 links
Пишу о технологиях и датасетах, немного ML

Рекламирую Чебоксары
加入频道
Представьте троллинг:
— Ты что, не помнишь эту песню?
И ставить генерацию..
😁8😨1
Сгенерил рекламу на радио для продающегося земельного участка

app.suno.ai/song/0e4c0c6d-b317-4482-8fd2-3ed3336084ff
app.suno.ai/song/74896336-1793-4293-8432-1104d02f8676
🔥3😁3👍1🤔1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Посвящается всем авторам ТГ каналов про Эй Ай


Я слежу что пишет сама
Знаю все про Гэ Пэ Тэ
Ворлд модели строит Сора
подпишись на мой тэ гэ

Здесь посты и много мемов
Можно слушать и читать
Будешь лучшем в мире сеток
Клоуна не ставьте блять

Когда ты станешь самым смелым
Будешь шарить, больше знать
Будет офер, много денег
Незабудь донат прислать


https://app.suno.ai/song/71d79d32-73f1-42e4-8b55-16809ebfad33
21👍1🔥1😁1
Можно разные техники, лоссы, архитектуры DL наглядно изучить. Фреймворк DL Pytorch.

https://nn.labml.ai
OpenAI показывают свою систему копирования голоса.
Распространяйте подсказки для более эффективного поиска работы на hh.ru

1) Старайтесь использовать "Ключевые слова" из описания вакансии в своем резюме. Многие работодатели используют автоматический анализ соискателей, основанный на совпадении ключевых слов. Например, они могут автоматически отклонять кандидатов, если совпадение ключевых слов менее 70%.

2) В разделе "О себе" обязательно укажите хотя бы один контакт. Информация из раздела "Контакты" полностью отображается только после оплаты работодателем специальной услуги, стоимостью около 10 тысяч рублей в день. Поэтому, чтобы облегчить связь с потенциальными работодателями, важно указать контактные данные в свободно доступной части своего профиля.

Давно хотел это опубликовать, но каждый раз забывал
🔥5👏3👍2
ChatGPT является единственным «искусственным интеллектом» практически для всех, кто находится за пределами нашего AI-пузыря
👍3
OpenAI Релизнули GPT-5 версию

К счастью, теперь доступно из России
gpt-5.openai.com
🤡4👍3
Какой язык программирования первым поддерживал кириллицу?
Anonymous Quiz
23%
Рапира
18%
ЯМБ
23%
Алмир
36%
👍1
Музыкальные артисты США из Artist Rights Alliance требуют от ИИ-платформ не разрабатывать сервисы, которые смогут заменить творчество человека или по крайней мере платить за это деньги
1
Media is too big
VIEW IN TELEGRAM
Большой материал, который подробно рассказывает о том, с какими проблемами сталкиваются люди, обучающие визуальные генеративные нейросети.

В одном из крупнейших датасетов, на котором такие модели обучают, например, обнаружили сцены детского насилия. Что ещё полбеды, ведь такие картинки просто отфильтровать.

Что гораздо хуже — в нём много изображений в пару к которым добавлены текстовые описания из служебного тега ALT на веб-страницах. Текст из этого тега показывается в том случае, если изображение не грузится, а для слабовидящих пользователей является единственной возможностью узнать о том, что вообще находится на изображении. Однако предприимчивые маркетологи добавляют в этот тег не реальное описание изображения, а ключевые слова, которые лучше всего повлияют на ранжирование сайта в поисковой выдаче. Таким образом модель получает датасет, в котором описан не реальный мир, а мир, который видят поисковые роботы.

Про другие проблемы наглядно — тут:
https://knowingmachines.org/models-all-the-way
👍2🔥1
Опубликовал новый датасет на Kaggle: Кадастровые данные Чебоксар с полигонами

Содержит подробные кадастровые данные о земельных участках и объектах капитального строительства в Чебоксарах, включая геометрические данные в виде полигонов.

🔎 Вот некоторые из полей, которые вы найдете в этом датасете:

- Кадастровый номер объекта
- Тип объекта (например, Земельный участок)
- Площадь объекта в квадратных метрах
- Адрес объекта
- Категория земельного участка (например, Земли населенных пунктов)
- Разрешенное использование объекта
- Кадастровая стоимость объекта
- В геометрии объекта представлены полигоны

Cheboksary Cadastral Data with Polygons

#dataset
👍8🔥1
Надпись "For Humans"
перевод статьи

Когда Кеннет Рейтц создал библиотеку requests, сообщество Python с энтузиазмом приняло этот проект, так как он наконец предоставил чистый, вменяемый API для выполнения HTTP-запросов. Он дал своему проекту подзаголовок "Python HTTP Requests for Humans" (HTTP-запросы в Python для людей), обозначая тем самым, что его API предоставляет дружественные для разработчиков интерфейсы. Если бы наименование вещей "для людей" остановилось на этом, я был бы с этим вполне согласен. Однако вместо этого произошел постоянный поток новых проектов, описывающих себя как созданные "для людей", и у меня есть претензии к этому.

Это пустой знак
Люди так часто используют мем "для людей" в своих проектах, что исходное намерение и значение затерялись, оставив за собой лишь мета-значение - то есть абсолютно безысходное значение. Теперь, когда я вижу его, мне кажется, что человек слишком старается дать понять, что он "в теме". Это противоположно тенденции некоторых людей усложнять все жаргоном, но обе эти тенденции происходят от одного корневого импульса.

Также присутствует намек на самоуничижение, "X сложный, поэтому вот что-то для людей". Но, разумеется, для того чтобы проект был полезен, его создатель должен обладать глубокими знаниями в данной области, поэтому это скорее выглядит как показушная скромность.

Это пренебрежение к другим пакетам
Когда новый проект представляет себя как "Х для людей", это в какой-то степени подразумевает, что все предыдущие библиотеки в данном направлении были не совсем "для людей". Буквально "для людей" обозначает более гуманный, дружественный к разработчику подход, что наводит на мысль, что другие пакеты не были достаточно удобны для разработчика. Иными словами, это несколько уклончивая критика других библиотек за их неудачные API.

Целевой аудиторией любого Python-проекта всегда являются разработчики. Называть свой проект "Для людей" - это всего лишь высокомерный способ заявить, что, по вашему мнению, ваш проект обладает более продвинутым API по сравнению с другими проектами в этой же области.

Пусть библиотека сама говорит за себя. Пусть другие оценят ее качество.

Как исправить ситуацию
Давайте исправим ситуацию, описывая наши проекты исходя из их функционала. Я понимаю, что в момент выхода requests ситуация с HTTP была довольно сложной, и Кеннет сделал хорошую попытку изменить это, но, думаю, пора двигаться дальше.

Я не хочу особо придираться к Кеннету, но есть примеры:

records, "SQL for Humans"
legit, "Git for Humans"
pep8, "pep8 for Humans"
hypermark, "markdown for Humans"
keras. "Deep Learning for humans"
К сожалению, это реальные примеры. PEP8 - это стандарт, который предлагает делать код более понятным для пользователя, а Markdown - это язык разметки, который изначально создан для удобства чтения. SQL изначально разрабатывался, чтобы быть удобным для людей...

Я бы попросил Python-сообщество отказаться от этого подхода "for humans". Если ваш проект обладает великолепным API, покажите его нам, не рассказывайте о нем. Если ваш проект улучшает другие проекты в этой области, покажите, как они сравниваются. Но просто называть свой проект "for humans" - это не только неуважительно, но и немного неловко.
This media is not supported in your browser
VIEW IN TELEGRAM
В Китае набирают популярность коворкинги, в которых можно готовить, смотреть телевизор и даже работать. Местным уже полюбился такой формат времяпровождения, особенно зашло интровертам.

Работает все просто: вы платите фиксированную стоимость по времени и получаете практически бесконечное количество ингредиентов. Для развлечения стоит телевизор с подключенным стриминговым сервисом
👍1🔥1
Когда приходишь в стартап, а там джуны
😁7👍1🔥11
Дата-журналистика в РФ мега-страдает. Ни тебе датасетов, ни других нормальных пруфов. У кого-то внезапно из одного результата в статье появляется совершенно другой результат
А где-то вообще не умеют складывать 2 и 2
👍32🥴1