Méthode de recherche UX où l'on observe des utilisateurs représentatifs en train de réaliser des tâches réalistes sur un produit ou un prototype. Le test mesure l'utilisabilité selon trois critères : efficacité (la tâche est-elle accomplie), efficience (en combien de temps et d'étapes) et satisfaction (le ressenti de l'utilisateur). Le modérateur observe sans guider ni aider. Jakob Nielsen a démontré que cinq participants suffisent pour détecter 85 % des problèmes d'utilisabilité. Le test peut être modéré (avec un facilitateur) ou non modéré (à distance, via un outil automatisé).
On rédige des scénarios de tâches réalistes ancrés dans un contexte crédible ("Vous cherchez un vol Paris-Barcelone pour deux personnes le 15 mars"). Le think-aloud (pensée à voix haute) est la technique de verbalisation la plus courante pendant le test. L'observateur note les réussites, les échecs, les hésitations, les erreurs et les commentaires spontanés. Les tests non modérés (via UserTesting, Maze, Lookback) permettent de tester plus de participants à moindre coût. Le rapport de test priorise les problèmes par sévérité et fréquence, avec des extraits vidéo pour rendre les constats tangibles auprès des décideurs.
Lors d'un test utilisateur sur le site de la RATP, trois participants sur cinq cherchent un bouton "Valider" après avoir sélectionné un itinéraire. Le système passe automatiquement à l'étape suivante sans confirmation explicite, créant un sentiment de perte de contrôle que les analytics seuls ne capturaient pas.