---
tags: 1NSI
---
# Texte et chaîne de caractères
Le mot texte est polysémique : il peut aussi bien désigner ce qui est écrit que son sens, la façon dont s'est écrit, etc. Un texte peut contenir un titre, des couleurs, être souligné...
:::info
Une <b>chaîne de caractères</b> est un texte brut, c'est-à-dire une suite de caractères sans aucune mise en forme.
Le <b>caractère</b> est la plus petite unité utilisée pour représenter un texte.
:::
Parmi les caractères, on a les lettres, les chiffres, les signes de ponctuation, l'espace, les signes mathématiques... mais aussi des caractères non imprimables comme "retour à la ligne" ou "fin de fichier".
Dans l'alphabet latin, une même lettre définit deux caractères : une minuscule et une majuscule.
Exemples de caractères : A ë œ ≠ { π 未 7
# Encodage
Dans un ordinateur, comme tous les types de données, les chaînes de caractères sont représentées par des $0$ et des $1$.
:::info
Une méthode d'<b>encodage</b> est une correspondance arbitraire entre des mots binaires (séries de $0$ et $1$) et des caractères.
Les méthodes d'encodage les plus courantes sont **ASCII**, **ISO-8859-1** et surtout **UTF-8** (ou Unicode).
:::
**Exemple.**
En ASCII, la lettre B est codée par 1000010. Pour faciliter la lecture, on convertit parfois ce code binaire en hexadécimal ou en décimal comme si c'était un nombre entier naturel :
$B = (1000010)_\text{bin} = (42)_\text{hex} = (66)_\text{déc}$ On écrit parfois aussi $0b1000010$ pour le binaire et $0x42$ pour l'hexadécimal.
# Exercice : Recherche d'information
:::warning
<b>Exercice : Recherche d'informations.</b>
ASCII, ISO-8859-1 et UTF-8 sont trois méthodes d'encodage. Pour chacune de ces trois méthodes, faites une recherche pour déterminer :
1. quand elle a été développée ;
1. le nom de l'organisme qui l'a développée ;
1. l'ensemble des caractères qu'elle peut encoder ;
1. le nombre de bits sur lequel elle code un caractère ;
1. combien de caractères elle peut coder ;
2. ses avantages et inconvénients.
:::
Vous pouvez présenter les résultats dans un tableau croisé comme celui-ci :
| | ASCII | ISO-8859-1 | UTF-8 |
| -------------- | ----- | ---------- | ----- |
| Quand | | | |
| Organisme | | | |
| Ensemble | | | |
| Nombre de bits | | | |
| Combien | | | |
| Avantages | | | |
| Inconvénients | | | |