Библиотека баз данных – Telegram

Библиотека баз данных

10.4K subscribers

177 photos

3 videos

25 files

200 links

Самая большая библиотека бесплатных книг по SQL

По всем вопросам- @haarrp

@ai_machinelearning_big_data - machine learning

@pythonl - Python

@itchannels_telegram - 🔥 best it channels

@ArtificialIntelligencedl - AI

РКН: № 5037640984

About

Blog

Apps

Platform

Библиотека баз данных

10.4K subscribers

Библиотека баз данных

SQL_cheatsheet.pdf

⚡️ SQL-шпаргалка, которая выручит в интервью, проекте и проде

Полный мастер-гайд по SQL в одном PDF: практичные примеры, чёткие объяснения и никакой воды.

Что внутри:
• 💬 Создание баз, таблиц и изменение схем
• 💬 Запросы любого уровня сложности: JOIN, GROUP BY, HAVING, PARTITION
• 💬 Подзапросы, CTE, оконные функции: ROW_NUMBER, RANK, DENSE_RANK
• 💬 VIEW, временные таблицы и работа с дубликатами
• 💬 Даты, строки, преобразования и агрегации
• 💬 Очистка данных, разбиение по разделителям
• 💬 UNION, INTERSECT, EXCEPT — управление сложными выборками

Затрагиваются и продвинутые кейсы:
• Парсинг адресов
• Кастомная сортировка
• Использование ISNULL и COALESCE

🧠 Это не просто набор команд — это концентрат боевого SQL-опыта.

Подходит для:
➡️ Подготовки к SQL-интервью
➡️ BI и аналитики
➡️ Web-разработки с базами
➡️ Встраивания SQL в проекты на Python, Go, Java и других языках

👍6🔥6❤3

2.59K viewsedited 08:59

Библиотека баз данных

Forwarded from Python/ django

Руководство_по_ускорению_и_оптимизации_Python_кода.pdf

🖥

Гайд по ускорению Python, который реально стоит прочитать 🔥

Без лишней теории — только рабочие практики, которые используют разработчики в боевых проектах.

Внутри:
• Как искать bottleneck'и и профилировать код
• Где и когда использовать Numba, Cython, PyPy
• Ускорение Pandas, NumPy, переход на Polars
• Асинхронность, кеши, JIT, сборка, автопрофилировка — всё по полочкам
• Только нужные инструменты: scalene, py-spy, uvloop, Poetry, Nuitka

⚙️ Написано просто, чётко и с прицелом на production.

📌 Полная версия онлайн

@pythonl

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2

2.02K views12:18

Библиотека баз данных

🔢 PGVector: векторный поиск прямо в PostgreSQL — гайд

Если ты работаешь с embedding'ами (OpenAI, HuggingFace, LLMs) и хочешь делать семантический поиск в SQL — тебе нужен pgvector. Это расширение позволяет сохранять и сравнивать векторы прямо внутри PostgreSQL.

📦 Установка PGVector (Linux)


git clone --branch v0.8.0 https://github.com/pgvector/pgvector.git
cd pgvector
make
sudo make install

Или просто:
• macOS: brew install pgvector
• Docker: pgvector/pgvector:pg17
• PostgreSQL 13+ (через APT/YUM)

🔌 Подключение расширения в базе


CREATE EXTENSION vector;

После этого ты можешь использовать новый тип данных vector.

🧱 Пример использования

Создаём таблицу:


CREATE TABLE items (
  id bigserial PRIMARY KEY,
  embedding vector(3)
);

Добавляем данные:


INSERT INTO items (embedding) VALUES ('[1,2,3]'), ('[4,5,6]');

Поиск ближайшего вектора:


SELECT * FROM items
ORDER BY embedding <-> '[3,1,2]'
LIMIT 5;

🧠 Операторы сравнения

PGVector поддерживает несколько видов расстояний между векторами:

- <-> — L2 (евклидово расстояние)
- <#> — скалярное произведение
- <=> — косинусное расстояние
- <+> — Manhattan (L1)
- <~> — Хэммингово расстояние (для битовых векторов)
- <%> — Жаккар (для битовых векторов)

Также можно усреднять вектора:


SELECT AVG(embedding) FROM items;

🚀 Индексация для быстрого поиска

HNSW (лучшее качество):


CREATE INDEX ON items USING hnsw (embedding vector_l2_ops);

Параметры можно настраивать:


SET hnsw.ef_search = 40;

#### IVFFlat (быстрее создаётся, но чуть менее точный):


CREATE INDEX ON items USING ivfflat (embedding vector_l2_ops) WITH (lists = 100);
SET ivfflat.probes = 10;

🔍 Проверка версии и обновление


SELECT extversion FROM pg_extension WHERE extname='vector';
ALTER EXTENSION vector UPDATE;

📌 Особенности

- Работает с PostgreSQL 13+
- Поддержка до 2000 измерений
- Расширяемый синтаксис
- Можно использовать DISTINCT, JOIN, GROUP BY, ORDER BY и агрегации
- Подходит для RAG-пайплайнов, NLP и встраивания LLM-поиска в обычные SQL-приложения

🔗 Подробнее

💡 Храни embedding'и прямо в PostgreSQL — и делай семантический поиск без внешних векторных БД.

🔥5❤4👍2

1.99K views13:04

Библиотека баз данных

🎯 Хитрая SQL-задача для продвинутых
Тема: переходы состояний пользователей через inactive → banned → active?

У нас есть таблица логов смены статусов пользователей:


CREATE TABLE user_status_log (
    user_id INT,
    status TEXT,         -- 'active', 'inactive', 'banned'
    changed_at TIMESTAMP
);

Каждый раз, когда пользователь меняет статус, добавляется запись.

🔍 Найди пользователей, которые хотя бы один раз:

• стали inactive
• потом были banned
• и либо так и остались забанены, либо позже перешли в active

Важно:
• Статусы могут меняться много раз
• Нас интересует первая последовательность inactive → banned (→ optional `active`)
• Если пользователь не вернулся в `active`, всё равно считаем, что условие выполнено

---

🧠 Решение с оконными функциями:


WITH ranked_status AS (
  SELECT
    user_id,
    status,
    changed_at,
    ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY changed_at) AS rn
  FROM user_status_log
),
status_with_next AS (
  SELECT
    user_id,
    status,
    changed_at,
    LEAD(status) OVER (PARTITION BY user_id ORDER BY changed_at) AS next_status,
    LEAD(changed_at) OVER (PARTITION BY user_id ORDER BY changed_at) AS next_changed_at
  FROM ranked_status
),
transitions AS (
  SELECT
    user_id,
    changed_at AS from_time,
    next_changed_at AS to_time,
    status AS from_status,
    next_status AS to_status
  FROM status_with_next
  WHERE next_status IS NOT NULL
),
flagged_users AS (
  SELECT DISTINCT user_id
  FROM (
    SELECT
      user_id,
      MAX(CASE WHEN from_status = 'inactive' AND to_status = 'banned' THEN 1 ELSE 0 END) AS went_inactive_then_banned,
      MIN(CASE WHEN from_status = 'banned' AND to_status = 'active' THEN 1 ELSE 0 END) AS banned_then_active
    FROM transitions
    GROUP BY user_id
  ) t
  WHERE went_inactive_then_banned = 1
)
SELECT *
FROM flagged_users;

🧩 Почему это интересно?

• Используются оконные функции LEAD(), ROW_NUMBER()
• Нужно отслеживать последовательные пары статусов
• Объединяем логику в несколько CTE-слоёв
• Придётся думать не только о текущем статусе, но и о контексте (что было до и что после)

Подобные задачи — хороший способ прокачать мышление о временных событиях в SQL.

❤6👎2🤔2👍1

2.01K views12:10

Библиотека баз данных

🔥 Успех в IT = скорость + знания + окружение

Здесь ты найдёшь всё это — коротко, по делу и без воды.
Пока другие ищут, где “подглядеть решение”, ты уже используешь самые свежие инструменты!

AI: t.me/ai_machinelearning_big_data
Python: t.me/pythonl
Linux: t.me/linuxacademiya
Собеседования DS: t.me/machinelearning_interview
C++ t.me/cpluspluc
Docker: t.me/DevopsDocker
Хакинг: t.me/linuxkalii
Devops: t.me/DevOPSitsec
Data Science: t.me/data_analysis_ml
Javascript: t.me/javascriptv
C#: t.me/csharp_ci
Java: t.me/java_library
Базы данных: t.me/sqlhub
Python собеседования: t.me/python_job_interview
Мобильная разработка: t.me/mobdevelop
Golang: t.me/Golang_google
React: t.me/react_tg
Rust: t.me/rust_code
ИИ: t.me/vistehno
PHP: t.me/phpshka
Android: t.me/android_its
Frontend: t.me/front
Big Data: t.me/bigdatai
МАТЕМАТИКА: t.me/data_math
Kubernets: t.me/kubernetc
Разработка игр: https://yangx.top/gamedev
Haskell: t.me/haskell_tg
Физика: t.me/fizmat

💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy
Папка ML: https://yangx.top/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://yangx.top/addlist/mzMMG3RPZhY2M2Iy

😆ИТ-Мемы: t.me/memes_prog
🇬🇧Английский: t.me/english_forprogrammers
🧠ИИ: t.me/vistehno

🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: https://yangx.top/addlist/BkskQciUW_FhNjEy

Подпишись, если хочешь быть в числе тех, кого зовут в топовые проекты!

❤2🥱1🥴1

2.74K views08:40

Библиотека баз данных

Чит лист по основам SQL.pdf

🔥 Русская шпаргалка по SQL — удобно и по делу!

В этом чек-листе собраны самые важные примеры SQL-запросов с понятными пояснениями на русском языке. Всё, что нужно: SELECT, JOIN, фильтрация, сортировка и другие практичные приёмы — в одном месте.

Держите под рукой, чтобы не тратить время на вечный гуглинг синтаксиса и типовых трюков.

Сохрани себе, чтобы не потерять!

❤10👍2

3.31K views10:34

Библиотека баз данных

SQL For Data Analysis.pdf

SQL Window Functions.pdf

Крутая подборка полезных шпаргалок по SQL

Внутри можно найти:
◦ База по SQL
◦ SQL Joins подробно
◦ Оконные функции
◦ SQL для анализа данных
И др.

👍5❤1

3.12K views14:03

Библиотека баз данных

🗃️ Работа с JSON в SQLite через JDBC (на Java)

SQLite поддерживает встроенные JSON-функции, и теперь их можно удобно использовать прямо из Java-приложений с помощью JDBC. BlackSlate выпустили подробный гайд, как это делать эффективно.

📌 Что внутри:
- Подключение к SQLite через JDBC
- Хранение, извлечение и обновление JSON-данных в таблицах
- Использование функций json_extract, json_set, json_insert, json_remove и других
- Примеры SQL-запросов для работы с вложенными JSON-структурами

🔧 Зачем это нужно:
- Хочешь хранить метаинформацию, конфиги или вложенные структуры — JSON в SQLite отличный выбор
- Не нужно ставить отдельную NoSQL-СУБД: всё работает локально
- Идеально подходит для embedded-приложений, десктопных утилит, мобильных приложений

💡 Примеры:
- Вставка JSON:


INSERT INTO configs (id, data) VALUES (1, '{"theme": "dark", "font": {"size": 14}}');

https://www.blackslate.io/articles/explore-sqlite-json-operations-using-jdbc

❤3👍3

2.11K views13:31

Библиотека баз данных

Сохраняй себе годноту : сотни бесплатных PDF-книг по языкам и технологиям.

Здесь есть буквально всё: гайды по Bash и основам Linux, книги по всем актуальным языкам программирования (включая Python, JS, Swift и другие), материалы по SQL, Docker, алгоритмам и не только. База регулярно обновляется и полностью бесплатна.

🆖

https://goalkicker.com/

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5👎3🔥3👍2😁1

1.92K views07:10

Библиотека баз данных

Forwarded from Machinelearning

Media is too big

VIEW IN TELEGRAM

🌟

Amazon встроила векторную базу данных прямо в хранилище S3.

Amazon анонсировала S3 Vectors - нативную поддержку векторного поиска прямо внутри своего вездесущего объектного хранилища. Заявлено, что это может снизить затраты на хранение и обработку векторов до 90%.

По сути, AWS предлагает не отдельный сервис, а новый тип бакета vector bucket. Внутри него вы создаете векторные индексы, указывая размерность векторов и метрику расстояния (косинусную или евклидову).

🟡

Дальше все работает как магия

Вы просто загружаете в индекс свои эмбеддинги вместе с метаданными для фильтрации, а S3 берет на себя всю грязную работу по хранению, автоматической оптимизации и обеспечению субсекундного ответа на запросы. Никакого управления инфраструктурой.

Один бакет может содержать до 10 тысяч индексов, а каждый индекс, в свою очередь, десятки миллионов векторов.

🟡

Главная сила этого решения - в экосистеме.

S3 Vectors бесшовно интегрируется с Bedrock Knowledge Bases. Теперь при создании базы знаний для RAG-приложения можно просто указать S3-бакет в качестве векторного хранилища.

Процесс создания RAG-пайплайна для тех, кто уже живет в облаке AWS, упрощается до нескольких кликов. То же самое касается и SageMaker Unified Studio, где эта интеграция тоже доступна из коробки.

🟡

"One more thing" анонса - умная интеграция с сервисом OpenSearch.

AWS предлагает гибкую, многоуровневую стратегию. Нечасто используемые или «холодные» векторы можно экономично хранить в S3 Vectors. А когда для части данных потребуется максимальная производительность и низкая задержка в реальном времени, например, для системы рекомендаций, их можно быстро экспортировать в OpenSearch.

Это очень прагматичный инженерный подход, позволяющий балансировать между стоимостью и производительностью.

Пока сервис находится в статусе превью и доступен в регионах US East (N. Virginia), US East (Ohio), US West (Oregon), Europe (Frankfurt), and Asia Pacific (Sydney) Regions.

Попробовать S3 Vectors можно в Amazon S3 console.

🟡

🖥

Github

@ai_machinelearning_big_data

#AI #ML #RAG #Amazon

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4👍2🔥2🥰1

1.93K views09:44

Библиотека баз данных

800+ SQL Server Interview Questions and Answers .pdf

🖥 Нашли кладезь знаний из 800+ SQL-вопросов с задачами — идеально для подготовки к собеседованиям.

Подойдёт, чтобы:
— прокачать SQL-навыки с нуля до продвинутого уровня
— быстро освежить синтаксис перед интервью
— попрактиковаться на реальных задачах

Полезно как джунам, так и мидлам. Отличный способ проверить себя и закрыть пробелы.

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6👍3🥰1

2.51K views11:04

Библиотека баз данных

120 ключевых вопросов по SQL за 2025 год

Статья содержит 120 ключевых вопросов по SQL для собеседований, разделённых по темам и уровням сложности, с краткими пояснениями.

Основываясь на актуальных требованиях 2025 года, вопросы охватывают базу данных, оптимизацию, практические задачи и нюансы СУБД (MySQL, PostgreSQL, SQL Server).

🔜

Подробности

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6👍4🔥3😁1

2.3K views06:47

Библиотека баз данных

🔮 CozoDB — графовая база данных с поддержкой Datalog-запросов, временными срезами и векторным поиском через HNSW-индексы.

Инструмент имеет встроенные алгоритмы для работы с графами и кроссплатформенность: работает как embedded-решение на Python, Node.js, Android и даже в браузере через WASM. Поддерживает SQLite, RocksDB и распределённое хранилище TiKV.

🤖 GitHub

❤6👍4

2K viewsedited 13:29

Библиотека баз данных

🖥 Мощный учебник по SQL — охватывает всё от базы до продвинутого уровня.

Внутри — 4 модуля, разбитые по сложности:
🟣 Основы SQL
🟣 Средний уровень
🟣 Продвинутый SQL
🟣 Аналитика на SQL

📚 Каждый модуль — это около 10 практичных уроков с возможностью сразу применять знания.

📌 Ссылка тут: https://mode.com/sql-tutorial

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥6❤2👍1😁1

2.21K views09:48

Библиотека баз данных

🖥 Теперь писать сложные промты самому не обязательно — OpenAI выпустили генератор, который превращает даже простой запрос в подробную инструкцию для ИИ.

Принцип простой: описываете, что хотите получить, нажимаете Optimize — GPT-5 анализирует запрос и выдаёт готовый детализированный промт. Работает бесплатно.

Инструмент может упростить работу с любыми нейросетями, особенно если у вас нет опыта в составлении промтов.

Готовый вы можете сразу попробовать в @Chatgpturbobot

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5❤3👎3🔥2😁1

1.9K views12:10

Библиотека баз данных

📝 Вышло большое практическое руководство по работе с VictoriaLogs

Недавно вышло полезное руководство по эффективному использованию VictoriaLogs — системы для работы с логами. В статье разбираются ключевые концепции: как правильно структурировать сообщения (_msg), работать с временными метками (_time) и настраивать потоки (stream) для оптимальной производительности.

Автор объясняет, как избежать типичных проблем:
— Толстых потоков, когда один сервис генерирует слишком много логов
— Высокой кардинальности, когда слишком детализированные потоки замедляют поиск
— Динамических имен полей, которые могут ухудшить сжатие данных

Также в статье есть советы по оптимизации, рассказывающие:
— Как правильно указывать сообщения и временные метки
— Какие поля лучше выбирать для потоков
— Как работать с вложенными структурами

Гайд написан доступно и подойдет тем, кто только начинает работать с VictoriaLogs или хочет улучшить текущую настройку логирования.

🔗 Читать статью - *клик*

❤2👍2🔥1

1.6K viewsedited 10:36

Библиотека баз данных

🎮 Погружаемся в SQL, с помощью увлекательной аркадной игры

Разработчики замутили настоящий олдскульный шедевр, который сделает из вас МАСТЕРА баз данных и точно не даст заскучать.

• Проходим уровни, собираем пазлы вместе с уткой DuckDB и прокачиваем SQL на максимум.
• Квесты, задачи, подсказки — всё как в настоящем приключении.
• Работает прямо в браузере и даже на телефоне.

Любые запросы к базам — щёлкаем как семечки 👉 https://dbquacks.com/.

❤2👍1🔥1

1.08K views13:04