263 views
--- tags: 1NSI --- # Texte et chaîne de caractères Le mot texte est polysémique : il peut aussi bien désigner ce qui est écrit que son sens, la façon dont s'est écrit, etc. Un texte peut contenir un titre, des couleurs, être souligné... :::info Une <b>chaîne de caractères</b> est un texte brut, c'est-à-dire une suite de caractères sans aucune mise en forme. Le <b>caractère</b> est la plus petite unité utilisée pour représenter un texte. ::: Parmi les caractères, on a les lettres, les chiffres, les signes de ponctuation, l'espace, les signes mathématiques... mais aussi des caractères non imprimables comme "retour à la ligne" ou "fin de fichier". Dans l'alphabet latin, une même lettre définit deux caractères : une minuscule et une majuscule. Exemples de caractères : A ë œ ≠ { π 未 7 # Encodage Dans un ordinateur, comme tous les types de données, les chaînes de caractères sont représentées par des $0$ et des $1$. :::info Une méthode d'<b>encodage</b> est une correspondance arbitraire entre des mots binaires (séries de $0$ et $1$) et des caractères. Les méthodes d'encodage les plus courantes sont **ASCII**, **ISO-8859-1** et surtout **UTF-8** (ou Unicode). ::: **Exemple.** En ASCII, la lettre B est codée par 1000010. Pour faciliter la lecture, on convertit parfois ce code binaire en hexadécimal ou en décimal comme si c'était un nombre entier naturel : $B = (1000010)_\text{bin} = (42)_\text{hex} = (66)_\text{déc}$ On écrit parfois aussi $0b1000010$ pour le binaire et $0x42$ pour l'hexadécimal. # Exercice : Recherche d'information :::warning <b>Exercice : Recherche d'informations.</b> ASCII, ISO-8859-1 et UTF-8 sont trois méthodes d'encodage. Pour chacune de ces trois méthodes, faites une recherche pour déterminer : 1. quand elle a été développée ; 1. le nom de l'organisme qui l'a développée ; 1. l'ensemble des caractères qu'elle peut encoder ; 1. le nombre de bits sur lequel elle code un caractère ; 1. combien de caractères elle peut coder ; 2. ses avantages et inconvénients. ::: Vous pouvez présenter les résultats dans un tableau croisé comme celui-ci : | | ASCII | ISO-8859-1 | UTF-8 | | -------------- | ----- | ---------- | ----- | | Quand | | | | | Organisme | | | | | Ensemble | | | | | Nombre de bits | | | | | Combien | | | | | Avantages | | | | | Inconvénients | | | |