GPT-5.4 : Test Complet – Nerdic Kings
OpenAI vient de lâcher GPT-5.4, son tout nouveau modèle avec niveau de réflexion étendue. Alan des Nerdic Kings l’a immédiatement soumis aux fameux « Prompt Tests NK » – les mêmes à chaque vidéo pour permettre des comparaisons directes avec Gemini, Claude et les autres. Résultat ? Du très très bon… et du très très bizarre. 🥚

📊 Les Benchmarks Officiels d’OpenAI

OpenAI accompagne la sortie de GPT-5.4 d’une page de benchmarks comparatifs avec les versions précédentes (GPT-5.2, GPT-5.3 Codex). Deux métriques ressortent particulièrement.

SW Bench Pro – GPT-5.4 57,7 %
vs 57,2 % pour GPT-5.3 Codex • +0,5 pt
SW Bench Pro – GPT-5.3 Codex 57,2 %
SW Bench Pro – GPT-5.2 55,6 %

🔬 OS World Verified : amélioration nette

OpenAI souligne une nette amélioration sur ce benchmark d’automatisation des tâches de bureau. Les exemples de prompts générés – simulateur de parc d’attraction, RPG façon Final Fantasy, survol 3D du Golden Gate – donnent un avant-goût saisissant de ce que le modèle est capable de produire.

GPT-5.4 est disponible en deux modes de réflexion : Standard et Étendu. Le mode étendu prend… du temps. Alan a attendu jusqu’à 20-25 minutes sur certains prompts. Probablement dû à l’engouement autour de la sortie, mais à noter si tu veux l’utiliser en production.


🖥️ Test #1 – Mini OS Nebula Desktop

Premier prompt : générer un mini système d’exploitation de bureau avec applications incluses. GPT-5.4 livre Nebula Desktop Ouest – et le résultat divise.

👑
Points forts
Design ultra clean, bloc-notes, calculatrice, explorateur de fichiers, wallpapers de folie (Sunset, Aurora…)
⚠️
Points faibles
Snake buggé (murs non traversables), Nebula Runner 3D planté dès le départ, impossibilité de fermer les fenêtres
« C’est très dur de prendre une décision ici parce qu’il y a du très très bon comme du très mauvais. » — Alan, Nerdic Kings

🎮 Le jeu Snake

Le principe de base de Snake veut qu’on traverse les murs pour réapparaître de l’autre côté. Ici ? On meurt en touchant le mur. Bug confirmé. Et impossible de fermer la fenêtre du jeu une fois ouverte – on reste bloqué avec Snake à l’écran.

❌ Non validé ⭐⭐☆☆☆

🎨 Les réglages & wallpapers

À l’inverse, les réglages du système sont bluffants : fond d’écran modifiable en temps réel avec des thèmes Aurora, Forest, Sunset, Midnight, Daylight. « Minimal Sunset, c’est carrément le genre de fond d’écran que j’adore mettre moi. » Probablement l’un des plus poussés jamais générés en prompt test.

✅ Validé ⭐⭐⭐⭐☆

💼 Test #2 – Portfolio Front-End Developer

À partir d’une maquette dessinée à la main (header « Tom Stack », sections Projets/Compétences/About), GPT-5.4 doit transformer le sketch en site web moderne, élégant et responsive.

  • Design premium : propre, clair, impactant
  • Animations fluides et très attrayantes
  • Couleurs fidèles à la maquette
  • Navigation header complète (Accueil, Projets, Compétences, À propos)
  • Barres de compétences animées (HTML 95 %, JS 92 %, UX 96 %)
  • Page authentique, humaine, call-to-action efficace
  • Illustration du personnage : « faite par un enfant de 3 ans »
« Je crois que c’est le meilleur portfolio qu’on m’est fait, et pourtant on en a fait des très bons avec les modèles testés précédemment. » — Alan, Nerdic Kings
✅ Complètement validé ⭐⭐⭐⭐⭐

🎨 Test #3 – Génération SVG Complexe

Un classique du canal : soumettre une image complexe (bureau Mac avec clavier, souris, lampe, horloge) et demander une reproduction SVG fidèle et détaillée. Alan a délibérément choisi une image difficile.

⌨️

Le clavier

Bien rendu, détaillé. Agréablement surprenant.

🍎

Le Mac + logo

Logo Macintosh reproduit, interface interne correcte.

💡

La lampe

Reconnaissable, « pas si mal » selon Alan. Ressemble vaguement à un casque de chevalier.

🕐

L’horloge

Complètement explosée, pas au bon endroit.

🖱️

La souris

Mal positionnée sur le clavier.

📝

Le texte « Hello »

Écrit « belle au » ou « belle dos ». GPT a fait ce qu’il a voulu.

🥊 GPT-5.4 vs Gemini 3.1 Pro sur le SVG

Alan compare avec Gemini 3.1 Pro sur le même prompt. Verdict sans appel : GPT-5.4 l’emporte. La version Gemini est « horrible, n’importe quoi, rien ne va. » 20 minutes de réflexion étendue pour GPT-5.4 — et ça se ressent sur la qualité.

⚠️ 6-7/10 – Validé malgré les défauts ⭐⭐⭐⭐☆

🌿 Test #4 – Simulation de Plante 3D

Simuler la croissance d’une plante en 3D avec paramètres ajustables (vitesse de croissance, taille, facteur aléatoire). Résultat… inattendu.

🌫️ Un résultat… cosmique ?

La plante est entourée de fumée, les mouvements sont « très très flippants« , et le background est étrange. On distingue à peine la végétation. Point positif quand même : les racines sont visibles – une première dans les tests de la chaîne. On peut zoomer. La plante bouge en temps réel.

En version améliorée (V2) ? Strictement identique à la V1. Aucune modification malgré la demande explicite d’amélioration.

❌ Non validé ⭐⭐☆☆☆

🏹 Test #5 – Jeu d’Archerie 3D

Un jeu d’archerie avec gravité réaliste, vent dynamique, cibles à distance variable et difficulté croissante. C’est un des prompts favoris d’Alan.

  • Graphismes : meilleurs qu’on lui ait jamais faits (arbres soignés, foin ajouté)
  • Poids de la flèche + gravité très bien calculés = sensations satisfaisantes
  • Flèches qui se plantent dans le sol après l’impact 🎯
  • Ambiance immersive
  • Arc orienté dans la mauvaise direction (casse l’immersion)
  • Barre de puissance non fonctionnelle
« C’est super bien fait honnêtement. On a le poids de la flèche avec la gravité, c’est très satisfaisant en fait de tirer avec. » — Alan, Nerdic Kings
✅ Complètement validé ⭐⭐⭐⭐☆

🧟 Test #6 – Zombie Tower Defense

Survivre aux vagues de zombies, protéger la base avec tourelles, snipers et mines. Le classique du tower defense à la sauce GPT.

🏰

Tourelles upgradables

Les tours s’agrandissent visuellement au niveau max. Très immersif.

💣

Mines fonctionnelles

Les zombies les déclenchent vraiment en marchant dessus.

🧟‍♂️

Variété de zombies

Petits (rapides), normaux, grands (lents mais résistants). Rajoute énormément au gameplay.

🤑

Bug ressources

Affichage « NaN » quand on a trop d’argent. Pas bloquant mais dommage.

« Honnêtement, le jeu est validé parce qu’au final, il y a tout ce qu’on veut sur un Tower Defense. » — Alan, Nerdic Kings
✅ Validé ⭐⭐⭐⭐☆

🏺 Test #7 – Marché Mésopotamien Antique en 3D

Le prompt phare de la chaîne ! Réaliser en JavaScript/Three.js une scène 3D détaillée d’un marché vivant dans un village mésopotamien antique. À chaque vidéo, les résultats sont soit époustouflants… soit ahurissants. GPT-5.4 ne déroge pas à la règle.

🗺️ Version 1 – La découverte

  • PNJ qui se déplacent (marchands, villageois)
  • Animaux en mouvement – les chèvres bougent réellement (une première !)
  • Collision avec les étales (impossible de les traverser)
  • Tapisserie bien modélisée sur les étales
  • Poterie détaillée et réaliste
  • Sol ultra-brillant, blanc intense – très étrange
  • Palmiers… étranges
  • 🥚 Des œufs géants partout (sans collision !)
  • PNJ entourés de sphères flottantes inexpliquées
🥇
GPT-5.4
7/10
Objets modélisés, animaux en mouvement, tapisserie et poterie détaillées
🥈
Gemini 3.1 Pro
8/10
Scène globale exceptionnelle mais étales moins détaillées (formes géométriques)

🔄 Version 2 – La tentative d’amélioration

Après 20 minutes de réflexion étendue, Alan demande d’améliorer le sol et la végétation. Résultat : sol légèrement amélioré (mais toujours trop blanc), végétation nettement plus dense (palmiers, roseaux, buissons, ombres portées).

Et les œufs géants ? Il y en a encore plus dans la V2. 🥚🥚🥚 Selon Alan, ce seraient peut-être… des ballons gonflables mésopotamiens. Il n’est pas historien, il ne peut rien affirmer.

Bonus V2 : un tapis maintenant en lévitation. Le fameux tapis magique d’Alon.

« Après, c’est peut-être moi qui dis n’importe quoi. Au temps de la Mésopotamie, il y avait des œufs géants. C’est moi peut-être qui me trompe. Je ne suis pas historien, je ne peux rien avancer. » — Alan, Nerdic Kings (en toute humilité)

📝 Bilan : GPT-5.4, validé ou pas ?

  1. Mini OS Nebula – Mitigé

    Design et réglages excellents, mais les jeux sont buggés et les fenêtres non fermables.

  2. Portfolio Front-End – 🌟 Meilleur jamais généré

    Animations, responsivité, couleurs, barres de compétences. Un sans-faute presque complet.

  3. SVG Complexe – Honorable

    Clairement meilleur que Gemini 3.1 sur ce prompt difficile. 6-7/10 mérités.

  4. Simulation de plante 3D – ❌ Raté

    V2 identique à V1. Résultat cosmique/flippant. Non validé.

  5. Archerie 3D – Excellent

    Meilleurs graphismes testés sur ce prompt, physique très satisfaisante.

  6. Zombie Tower Defense – Validé

    Gameplay complet, variété de zombies, upgrades visuels. Jeu achevé avec succès.

  7. Marché Mésopotamien – En demi-teinte

    Détails impressionnants (tapisserie, poterie, animaux), mais des œufs géants… et des ballons.

💡 Conclusion générale

GPT-5.4 est impressionnant sur la génération d’interfaces et de code (portfolio, tower defense, archerie). Il montre des signes de faiblesse sur les simulations 3D génératives et la cohérence des scènes. Le mode réflexion étendue produit une meilleure qualité, mais au prix de temps d’attente considérables (20-25 min). Un modèle qui mérite clairement sa place dans le top des LLM actuels.

📺 Regarder la Vidéo

GPT-5.4 Test Nerdic Kings

🚀 Tu veux tester GPT-5.4 toi-même ?

Retrouve tous les prompts de test dans la description de la vidéo et rejoins la communauté Nerdic Kings !

▶ Voir la vidéo complète
#GPT54 #OpenAI #NerdicKings #TestIA #LLM #Intelligence Artificielle #JavaScript3D #ThreeJS #Benchmark #Mésopotamie #TowerDefense #Flova

Article généré à partir de la retranscription de la vidéo Nerdic Kings – Test GPT-5.4. Tous droits réservés à leurs auteurs respectifs.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Retour en haut