DeepSeek Math V2 & Hunyuan OCR : Quand la Chine fait trembler la Silicon Valley

Le 27 novembre dernier, deux laboratoires chinois ont fait trembler la Silicon Valley en publiant des modèles qui n’auraient pas dû exister. Le premier vient de battre tous les humains dans l’une des compétitions mathématiques les plus difficiles au monde. Le second, avec seulement 1 milliard de paramètres, ridiculise des géants cinq fois plus gros que lui. Et le plus surprenant ? Ces deux modèles sont entièrement open source.

🧮

DeepSeek Math V2

Raisonnement mathématique de niveau Olympiade

685B paramètres Open Source Apache 2.0

👁️

Hunyuan OCR

Reconnaissance optique de caractères ultra-performante

1B paramètres End-to-end Multilingue

DeepSeek Math V2 : L’IA qui surpasse les meilleurs mathématiciens

Quand on parle de spécialisation en mathématiques, on ne parle pas de résoudre des équations du second degré. On parle de performances au niveau des Olympiades Internationales de Mathématiques.

Pour mesurer l’ampleur de cette avancée, prenons la compétition PUTNAM, considérée comme l’examen de mathématiques universitaire le plus difficile d’Amérique du Nord. En décembre 2025, près de 4 000 étudiants ont planché pendant 6 heures sur 12 problèmes.

Les résultats au PUTNAM 2025

90/120

Meilleur score humain

2/120

Score médian humain

118/120

Score de DeepSeek Math V2

+28 pts

Écart avec le meilleur humain

Vous avez bien lu : la moitié des participants n’ont même pas réussi à obtenir plus de 2 points. Et DeepSeek Math V2 a obtenu 118 points sur 120, surpassant de 28 points le meilleur mathématicien humain de la compétition.

Sur les Olympiades Internationales de Mathématiques 2025, le modèle a résolu 5 problèmes sur 6, atteignant le niveau médaille d’or.

Le secret : le raisonnement auto-vérifiable

La plupart des systèmes d’IA mathématiques se concentrent sur une seule chose : trouver la réponse finale. Le modèle reçoit une récompense quand il trouve le bon nombre, et c’est tout. Le problème ? Un modèle peut très bien arriver au bon résultat par accident, en faisant des erreurs qui s’annulent mutuellement.

Dans le monde académique, dans les compétitions sérieuses, ce qui compte n’est pas seulement la réponse finale — c’est la rigueur du raisonnement, la qualité de la démonstration, la cohérence logique de chaque étape.

DeepSeek a construit Math V2 autour d’un principe révolutionnaire : le raisonnement auto-vérifiable. Le modèle ne se contente plus de résoudre un problème. Il prouve sa solution. Il vérifie son propre travail et admet ses erreurs quand il en fait.

🏗️ Architecture en trois couches

1
Le Vérificateur Comparable à un correcteur d’Olympiade. Il lit l’intégralité de la démonstration et la note sur plusieurs critères : 1 point pour une dérivation rigoureuse, 0.5 si le raisonnement est correct mais bâclé, 0 pour les erreurs de logique.
2
Le Méta-vérificateur Un superviseur qui vérifie que le correcteur fait bien son travail. Même les grands modèles peuvent halluciner des erreurs qui n’existent pas. Ce second niveau augmente massivement la fiabilité.
3
Le Générateur Le modèle IA lui-même, qui doit s’auto-évaluer après chaque démonstration. Il est récompensé pour son honnêteté, pas seulement pour sa justesse.

💡

L’innovation clé

Si le modèle fait une erreur et l’admet ouvertement, il reçoit une récompense. S’il essaie de bluffer, il est pénalisé. Les hallucinations diminuent drastiquement et le raisonnement devient beaucoup plus stable.

L’autre aspect fascinant : la capacité du système à évoluer de manière autonome. Les démonstrations difficiles à noter ou à résoudre deviennent automatiquement de nouvelles données d’entraînement. Le vérificateur s’améliore, le générateur s’améliore, et l’ensemble progresse sans nécessiter des armées de mathématiciens humains.

🆓

Open Source

Ce modèle de 685 milliards de paramètres est disponible gratuitement sur Hugging Face sous licence Apache 2.0. Pendant qu’OpenAI et Google gardent leurs modèles mathématiques sous clé, DeepSeek les distribue à tout le monde.

Hunyuan OCR : Le petit modèle qui défie les géants

Tencent a publié Hunyuan OCR, un modèle d’un milliard de paramètres dédié à la reconnaissance optique de caractères. Et ce petit modèle est en train de surpasser des géants multimodaux comme Qwen 3 VL (4 milliards de paramètres), Gemini 2.5 Pro, et même certaines API commerciales.

Ça ne devrait pas être possible à cette taille. Et pourtant, les benchmarks sont là.

Une architecture révolutionnaire

L’OCR traditionnel fonctionne avec un système complexe à plusieurs étapes : un modèle détecte où se trouve le texte, un autre le découpe, un troisième le reconnaît, un quatrième reconstruit la mise en page. À chaque étape, des erreurs peuvent s’accumuler.

Tencent a tout intégré dans un seul modèle de bout en bout. Vous donnez une image, et en une seule passe, il gère la détection du texte, l’analyse des documents, l’extraction d’information, la traduction et même les questions-réponses visuelles.

📐

Encodeur visuel intelligent

Basé sur une fondation de 400 millions de paramètres, il accepte les images dans leur résolution et ratio d’aspect originaux au lieu de tout forcer dans un carré. Crucial pour l’OCR en conditions réelles : longs reçus, tableaux larges, pages multicolonnes, impressions tordues…

🧠

Compréhension 4D avec XDR

Au lieu de traiter tout comme une séquence plate de tokens, le modèle divise la compréhension en quatre dimensions : le texte lui-même, la hauteur de la page, la largeur de la page, et le temps pour les vidéos.

Performances de Hunyuan OCR

71%

Score global (benchmark interne)

94%

OmniDoc Bench

860 pts

OCR Bench (1er <3B)

91%

DocIL (14 langues)

Sur Wild Omni Bench, où les documents sont imprimés, pliés, recapturés sous éclairage terribles et tordus, il score encore au-dessus de 85%. Le modèle a même remporté la première place dans la compétition ICDAR 2025 pour la traduction de documents dans la catégorie « petit modèle ».

Deux philosophies, un même constat

Quand on regarde ces deux sorties côte à côte, elles représentent deux philosophies qui semblent opposées mais qui sont peut-être complémentaires.

Critère DeepSeek Math V2 Hunyuan OCR

Philosophie Massif et spécialisé Compact et efficient

Paramètres 685 milliards 1 milliard

Domaine Raisonnement mathématique Reconnaissance de caractères

Innovation clé Auto-vérification Architecture end-to-end

Disponibilité Open Source (Apache 2.0) Open Source

La question que tout le monde se pose dans l’industrie : quelle direction va dominer ? Les modèles massivement spécialisés qui excellent dans des domaines précis, ou les systèmes généraux qui font tout mais peut-être un peu moins bien ?

🔮 Et demain ?

La vraie révolution sera probablement dans la combinaison des deux : des orchestrateurs intelligents qui savent quand appeler un spécialiste et quand utiliser un généraliste.

Mais une chose est certaine : ces sorties marquent un tournant dans la course à l’IA. Et le fait qu’elles soient open source change radicalement la donne pour les développeurs et chercheurs du monde entier.

📺 Voir la vidéo complète

DeepSeek Math V2 et Hunyuan OCR - Vidéo explicative

Vidéo source sur YouTube