La normalisation est un processus qui implique la transformation de caractères et de séquences de caractères dans une représentation formelle. Ce processus est important quand des textes doivent être comparés à des fins de tri et de recherche, mais il est aussi important pour le stockage des données, afin que les documents soient cohérents.
Le consortium Unicode Consortium a défini un nombre de formes de normalisations pour refléter les différents besoins des applications :
Les constantes suivantes définissent les formes de normalisation à appliquer par le normalizer :