Machine learning Interview

This media is not supported in your browser

🔥

ReZero — маленькая модель, которая никогда не сдаётся

🧠 ReZero — это LLM на базе Llama 3.2B, обученная не просто находить ответы, а упорно искать лучший.

🔁 Вместо того чтобы оптимизировать на скорость или recall, ReZero обучается пробовать снова и снова, пока не найдёт правильный ответ.

Модель намеренно поощряется за настойчивость — если она делает retry и улучшает результат, это считается успехом.

Использует синтетические поисковые движки, которые заставляют модель перезапрашивать и улучшать свои ответы.

Обучается с помощью усиленного обучения (RL) — формируя привычку "не сдаваться".

🔜

Github

🔜

Модель

@ai_machinelearning_big_data

#LLM #Search #RL #AI #Meta #ReZero #NeverGiveUp #Llama3

Please open Telegram to view this post

VIEW IN TELEGRAM

❤17👍4🔥4

2.63K views17:04

About

Blog

Apps

Platform