Encodages d’octets et chaînes de caractères
Si un tableau d'octets contient du texte non-Unicode, vous pouvez convertir le texte en Unicode avec l'une des méthodes du constructeur String. Inversement, vous pouvez convertir un objet String en un tableau d'octets de caractères non-Unicode avec la méthode String.getBytes. Lorsque vous invoquez l'une de ces méthodes, vous spécifiez l'identifiant d'encodage comme l'un des paramètres. L'exemple qui suit convertit les caractères entre UTF-8 et Unicode. UTF-8 est un format de transmission pour Unicode qui est sûr pour les systèmes de fichiers UNIX. Le code source complet de l'exemple se trouve dans le fichier StringConverter.java. Le programme StringConverter commence par créer un String contenant des caractères Unicode : String original = new String("A" + "\u00ea" + "\u00f1" + "\u00fc" + "C"); Lorsqu'elle est imprimée, la String nommée original apparaît comme :…