Dernière mise à jour : 4 avril 2026 — Source : api-docs.deepseek.com/quick_start/pricing
Cette page présente les tarifs officiels de l’API DeepSeek tels que publiés par DeepSeek Inc. deepseek-fr.ai est un site indépendant qui ne vend pas d’accès à l’API ; nous relayons ces informations à titre informatif pour la communauté francophone.
Rappel : le chatbot disponible sur deepseek-fr.ai est gratuit et ne nécessite aucune inscription ni clé API. Les tarifs ci-dessous concernent exclusivement l’API officielle de DeepSeek, destinée aux développeurs souhaitant intégrer DeepSeek dans leurs propres applications.
Modèle unifié : DeepSeek V3.2
Depuis décembre 2025, l’API officielle de DeepSeek repose sur un modèle unique — DeepSeek V3.2 — accessible via deux identifiants selon le mode d’utilisation :
deepseek-chat: mode non-thinking, optimisé pour les réponses rapides (conversation, classification, résumé, pipelines d’outils). Sortie maximale : 8K tokens.deepseek-reasoner: mode thinking, avec chaîne de raisonnement visible (Chain-of-Thought). Idéal pour les tâches complexes de logique, mathématiques et code. Sortie maximale : 64K tokens.
Les deux identifiants utilisent le même modèle V3.2 et bénéficient de la même grille tarifaire.
Tarifs officiels de l’API
Tous les prix sont en USD par million de tokens.
| deepseek-chat | deepseek-reasoner | |
|---|---|---|
| Version du modèle | DeepSeek V3.2 (Non-thinking) | DeepSeek V3.2 (Thinking) |
| Fenêtre de contexte | 128K tokens | 128K tokens |
| Sortie max | 8K tokens (défaut 4K) | 64K tokens (défaut 32K) |
| Entrée — cache hit | 0,028 $ / million | 0,028 $ / million |
| Entrée — cache miss | 0,28 $ / million | 0,28 $ / million |
| Sortie | 0,42 $ / million | 0,42 $ / million |
Qu’est-ce que le Context Caching ?
DeepSeek applique automatiquement un système de cache de contexte : lorsque plusieurs requêtes partagent un même préfixe (prompt système, instructions, définitions d’outils), les segments identiques sont réutilisés sans être refacturés au tarif plein.
- Cache hit (préfixe déjà en cache) : 0,028 $ / million — soit une réduction de 90 % par rapport au tarif standard.
- Cache miss (première occurrence du préfixe) : 0,28 $ / million — tarif standard.
Le caching est automatique et ne nécessite aucune configuration de votre part. Pour maximiser les économies, structurez vos prompts avec un préfixe constant (instructions système, schéma d’outils) et un suffixe variable (message utilisateur).
Offre gratuite pour les nouveaux comptes
DeepSeek offre 5 millions de tokens gratuits à chaque nouveau compte développeur lors de l’inscription sur platform.deepseek.com. Ce crédit est valable 30 jours et permet de tester l’API sans engagement financier. Aucune carte bancaire n’est requise pour s’inscrire.
Une fois le crédit épuisé ou expiré, l’utilisation passe en mode pay-as-you-go selon les tarifs indiqués ci-dessus.
Fonctionnalités incluses dans l’API
Les deux identifiants (deepseek-chat et deepseek-reasoner) prennent en charge :
- JSON Output : réponses structurées en JSON.
- Tool Calls : appels d’outils et intégration d’agents.
- Chat Prefix Completion (bêta) : complétion à partir d’un préfixe de conversation.
- FIM Completion (bêta) : complétion « fill-in-the-middle » (uniquement
deepseek-chat). - Streaming : réception des réponses en flux continu.
L’API DeepSeek est compatible avec le format OpenAI, ce qui facilite la migration depuis d’autres fournisseurs. Il suffit de modifier l’URL de base (https://api.deepseek.com) et la clé API.
Estimation des coûts mensuels
À titre indicatif, voici une estimation des coûts selon le volume d’utilisation (en supposant un taux de cache hit de 50 %) :
| Profil d’utilisation | Volume estimé | Coût mensuel approximatif |
|---|---|---|
| Usage personnel (projets personnels, tests) | < 5M tokens/mois | 1 – 5 $ |
| Petite application (chatbot, assistant interne) | 5 – 30M tokens/mois | 5 – 20 $ |
| Application en production (SaaS, service client) | 30 – 200M tokens/mois | 20 – 100 $ |
| Usage entreprise (volumes importants) | 200M+ tokens/mois | 100 $+ |
Ces estimations sont fournies à titre indicatif. Le coût réel dépend du ratio cache hit/miss, de la longueur des réponses et du modèle utilisé (chat vs reasoner).
Modèles historiques
Les modèles suivants ne sont plus disponibles en tant qu’identifiants distincts dans l’API. Leurs capacités sont désormais intégrées dans DeepSeek V3.2 :
- DeepSeek R1 : les capacités de raisonnement avancé sont accessibles via
deepseek-reasoner(V3.2 en mode thinking). - DeepSeek Coder : les capacités de génération de code sont intégrées dans
deepseek-chat(V3.2). - DeepSeek V3 (original) : remplacé par V3.2 depuis décembre 2025.
Pour des informations détaillées sur chaque modèle, consultez nos fiches modèles.
Ressources officielles
- Tarifs officiels — api-docs.deepseek.com/quick_start/pricing
- Documentation API complète — api-docs.deepseek.com
- Plateforme développeur — platform.deepseek.com
- Statut de l’API — status.deepseek.com
Note importante : les tarifs présentés sur cette page sont extraits de la documentation officielle de DeepSeek à la date de dernière mise à jour. DeepSeek Inc. se réserve le droit de modifier ses prix à tout moment. Nous vous recommandons de toujours vérifier les tarifs en vigueur sur api-docs.deepseek.com avant de vous engager.
deepseek-fr.ai est un site indépendant, non affilié à DeepSeek Inc. Nous ne commercialisons aucun service API et ne percevons aucune commission sur les ventes de DeepSeek.
