DeepSeek détrône ChatGPT : l’assistant IA chinois bouleverse la tech

Le chatbot DeepSeek a créé la surprise en janvier 2025 en s’imposant comme l’application gratuite la mieux notée sur l’App Store d’Apple aux États-Unis, détrônant le célèbre ChatGPT.

Cette ascension fulgurante de l’assistant virtuel chinois a provoqué des remous jusque dans les marchés financiers : l’essor de DeepSeek a contribué à faire chuter les actions de plusieurs géants technologiques américains, les investisseurs s’interrogeant sur leurs coûteux paris dans l’IA.

En quelques jours, cette jeune pousse de Hangzhou est passée du statut d’inconnue à celui de nouvel acteur incontournable de l’intelligence artificielle.

DeepSeek doit ce succès à un nouveau modèle de langage ultra-performant et open source, capable de rivaliser avec les systèmes d’OpenAI tout en étant développé avec une fraction des moyens. D’après le fondateur Liang Wenfeng, le modèle phare DeepSeek-R1 a été entraîné pour moins de 6 millions de dollars, là où des modèles équivalents comme GPT-4 auraient requis plus de 100 millions de dollars de calcul.

Surtout, DeepSeek s’est affranchi des puces les plus sophistiquées : au lieu des très onéreuses Nvidia A100 ou H100, l’équipe a utilisé des processeurs Nvidia H800 de génération précédente, disponibles en Chine malgré les restrictions d’exportation américaines.

Ce choix audacieux, associé à de nouvelles optimisations logicielles, a permis d’atteindre des performances d’élite avec des composants moins puissants – un véritable tour de force technologique salué par les experts.

Techniquement, DeepSeek-R1 se distingue par son architecture hybride innovante. Avec 670 milliards de paramètres, c’est l’un des plus vastes modèles open source jamais publiés. Pourtant, grâce à une conception dite en « mixture of experts », seuls une partie de ces paramètres s’activent pour chaque requête, concentrant la puissance de calcul sur les composants les plus pertinents.

Le modèle recourt en outre à une attention latente multi-tête pour accélérer ses inférences et peut générer plusieurs mots simultanément au lieu de progresser mot par mot.

Autre originalité, son entraînement a intégré un mécanisme de renforcement interne : plutôt que de dépendre d’un modèle critique externe comme c’est courant, R1 utilise ses propres règles pour évaluer et améliorer ses réponses au fil de l’apprentissage.

Ces choix techniques contribuent à une efficacité hors norme, divisant par dix les coûts d’inférence par rapport aux concurrents et réduisant l’empreinte énergétique de chaque interaction.

L’impact de DeepSeek dépasse le cadre technologique. Le modèle est disponible gratuitement en open source, ouvrant la voie à une adoption large par des développeurs indépendants et des chercheurs. Là où l’accès aux IA avancées était jusqu’ici restreint par des licences coûteuses – l’abonnement à ChatGPT Plus avoisine 200 $ par mois pour les versions comparables – l’assistant de DeepSeek est librement téléchargeable et intégrable.

Pour de nombreuses startups ou laboratoires académiques, cette démocratisation de l’IA est une aubaine. « Ce genre de modèle, aussi performant qu’économe, met l’IA de pointe à la portée de communautés bien plus larges », souligne Anil Ananthaswamy, expert en IA, évoquant un pont inédit entre l’industrie et la recherche publique.

En bousculant les conventions établies – puissance, coûts et contrôle – DeepSeek R1 a enclenché une révolution dans l’IA que nul n’avait vu venir, repositionnant la Chine sur l’échiquier technologique mondial.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *