Affichage des articles dont le libellé est Raisonnement Renforcement. Afficher tous les articles
Affichage des articles dont le libellé est Raisonnement Renforcement. Afficher tous les articles

samedi 26 avril 2025

Les 4 étapes pour entraîner un LLM

 


Qu'est-ce qu'a bien pu faire la start-up chinoise DeepSeek pour secouer le monde de la tech ? Pour le comprendre, on se demande comment passer d'un simple compléteur de texte, à un assistant IA capable de raisonner !

Détails et compléments dans le billet de blog qui accompagne la vidéo : https://scienceetonnan...

00:00​ Introduction
01:37​ Le prétraining auto-supervisé
13:30​ Le fine-tuning supervisé
19:07​ Le fine-tuning par les préférences
26:40​ Le fine-tuning par le raisonnement
32:30​ Les innovations de DeepSeek
37:35​ L'avenir de l'IA

Le serveur Discord de Science étonnante ➡️     / discord  ​

Écrit et réalisé par David Louapre © Science étonnante

Abonnez-vous :     / scienceetonnante  ​
Me soutenir sur Tipeee : http://www.tipeee.com/...
ou Patreon :    / scienceetonnante  ​
Mes livres : https://scienceetonnan...
Facebook :    / sciencetonnante  ​
Twitter :    / dlouapre  ​


Articles les plus populaires