298K subscribers
3.99K photos
700 videos
17 files
4.57K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
加入频道
Forwarded from Spark in me
Третья статья из цикла статей про анализ сайтмапов.
А сможете ли вы понять, чем в реальности отличаются кластеры слов?
Я не смог =)

https://spark-in.me/post/sitemap-scraping-part-3

#data_science
Forwarded from Spark in me
То, что показалось интересным из презентаций Avito Data Science Meetup.

То, что используется для предсказания популярности статей:
- Embeddings - https://goo.gl/zb9G7X
- Используемые модели и методы - https://goo.gl/jzzkaE

Способы построения рекомендаций Озоном:
- Технологии - https://goo.gl/YTu47r
- Модели - https://goo.gl/mMXJ4s
- Какие логия парсятся - https://goo.gl/9mpVAv
- Как считают сопутствующие товары - https://goo.gl/BnCSPd
- Персональные рекомендации (по сути коллаборативный фильтеринг) - https://goo.gl/E818ab
- Аксуссуары (по сути декартово расстояние) - https://goo.gl/wL9a97


#data_science
#internet
👍1
Forwarded from Spark in me (Alexander )
Вот как оказывается фейсбук определяет лица на фото
- Сначала картинки упрощаются с использованием градиентов
- Потом картинки лиц поворачиваются с использованием специального алгоритма
- Потом тренируются embeddings для лиц
- Потом с помощью "простых" алгоритмов типа SVM выбираются нужные классы для лиц

Ссылка
- https://goo.gl/zeeNBi

Библиотека для определения лиц
- https://github.com/ageitgey/face_recognition#face-recognition

#data_science
👍1
Интересное в мире DS/ML (в этот раз негусто):

- Andrew Ng открыл новый курс на Курсере про Deep Learning - ссылка выше (было)
- Facebook полностью перешел на нейросети для перевода - https://goo.gl/VhjA9H
- Pytorch v0.2 - https://goo.gl/99QpB3 - может кому-то актуально
- Люди из Salesforce тренируют LTSM сети для перевода с одного языка на другой, берут получившийся декодер (часть сети) и используют его чтобы скормить его выход другим нейросетям, которые делают более простые вещи - https://goo.gl/6Kt77o

#data_science
@computer_science_and_programming :

Welcome to the world of:
* #Artificial #Intelligence,
* #Deep #Learning,
* #Machine #Learning,
* #Data #Science
* #Python Programming language
* and more advanced research
You will find up-to-date books📚 links🔗 and more you wanted.
Join us and learn hot topics of Computer Science together.👇👇👇

@computer_science_and_programming
👍1
⭐️ Towards Building the Federated GPT: Federated Instruction Tuning

Shepherd: A lightweight, foundational framework enabling federated instruction tuning for large language models


Модель для фундаментальной основы для изучения федеративной тонкой настройки LLM.

🖥 Github: https://github.com/jayzhang42/federatedgpt-shepherd

Paper: https://arxiv.org/pdf/2305.05644.pdf

📌 Data Preparation: https://github.com/jayzhang42/federatedgpt-shepherd#Data_Preparation

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍125❤‍🔥22🔥1
🐼 PandaLM: ReProducible and Automated Language Model Assessment

Judge large language model, named PandaLM, which is trained to distinguish the superior model given several LLMs. PandaLM's focus extends beyond just the objective correctness of responses, which is the main focus of traditional evaluation datasets.

PandaLM - обеспечивает автоматизированные сравнения между различными большими языковыми моделями (LLM). Задавая одинаковый контекст, PandaLM может сравнивать ответы различных LLM и предоставлять причину решения вместе с эталонным ответом.


🖥 Github: https://github.com/weopenml/pandalm

📕 Paper: https://arxiv.org/abs/2306.05087v1

🔗 Dataset: https://github.com/tatsu-lab/stanford_alpaca#data-release

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍183🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
🔦Relighting Neural Radiance Fields with Shadow and Highlight Hints

В данной работе представлен новый подход к изменении освещенности объекта на основе небольшого набора неструктурированных фотографий объекта, освещенного движущимся точечным источником света, отличным от позиции обзора.

git clone https://github.com/iamNCJ/NRHints.git
cd NRHints
pip install -r requirements.txt

🖥 Github: https://github.com/iamNCJ/NRHints

🚀 Project: https://nrhints.github.io/

📕 Paper: https://nrhints.github.io/pdfs/nrhints-sig23.pdf

⭐️ Dataset: https://github.com/iamNCJ/NRHints#data-and-models

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍87🔥7