Qu'est-ce que le mp3 ?

De la musique partout avec vous

Impossible aujourd'hui de passer à côté de l'iPod ou plus généralement des lecteurs mp3. Ces petits appareils électroniques vous permettent d'écouter de la musique partout, dans la rue, le métro, au travail ou tranquillement à la maison.
Par abus de langage, MP3 désigne autant l'appareil en lui-même que la musique qu'il permet d'écouter. Evidément en théorie ceci est faux puisque MP3 désigne la méthode de compression audio utilisée pour l'encodage de la musique.
 
Qu'est-ce que le MP3 ?
MP3, abréviation pour MPEG-1/2 Audio Layer 3 est une méthode de compression audio basée sur l'analyse de Fourrier et le filtrage des fréquences audio. On l'appelle également codec MP3, c'est à dire méthode de compression-decompression audio.
L'intérêt principal du MP3 est d'être capable de compresser fortement les informations sonores. Cette compression rime forcément avec perte de qualité. Pour cette raison, le MP3 est particulièrement indiqué pour les lecteurs portables mais reste boudé dans les applications professionnelles. Notons que les CD audio achetés dans le commerce ne sont pas au format MP3. Le codec MP3 est toutefois un bon rapport compression/qualité puisque le résultat reste agréable à l'écoute.
 
 
 
Logo astuce
De manière plus simple...
L'abréviation MP3 désigne le nom d'une des méthodes permettant de représenter des informations sonores pour un ordinateur.
 
Logo question
Le saviez-vous ?
Un CD audio du commerce contient 74min de musique environ. Au format MP3, un même CD serait capable de contenir  jusqu'à 15h de musique.

Représentation numérique d'un son

D'un point de vu physique, un son est une vibration : une succession de compression/décompression des molécules du matériau dans lequel il se propage. D'un point de vu mathématique, un son est représentable graphiquement comme la vibration du matériau en fonction du temps. On appelle cette courbe un spectre de modulation d'amplitude.
 
Spectre de modulation d'amplitude d'une musique.
Extrait de "Toute cette histoire", Louise Attaque.
 
Supposons que l'on veuille numériser la note LA. Cette note est le son du diapason ou encore celui de la tonalité de votre téléphone. Un LA pur a une fréquence de 440Hz, cela signifie qu'il s'agit d'un signal se répétant à l'identique 440 fois par seconde. Sa représentation est la suivante :
 
 
 
La numérisation, aussi appelée "digitallisation" de ce son se fera par la prise de mesures tout au long de la courbe. Pour un CD audio classique, l'ordinateur va prendre 44100 mesures par seconde. Cela s'appelle le taux d'échantillonage, ici de 44,1kHz. Cette opération d'échantillonage de notre note aura donc la représentation suivante :
 
 
Le fichier numérique de cette note contiendra donc la liste de toutes les mesures prises :
0  0,33  0,67  0,8  0,98,  0,82  0,71  0,4  .... 
 
La lecture du fichier entrainera la restitution sonore du son : les mesures seront reproduites électriquement. Ce signal électrique envoyé aux haut-parleurs deviendra audible.
 
Le MP3 va plus loin qu'un simple échantillonage : il travaille en fréquence. Dans notre exemple, il est clairement visible que la note LA de 440Hz est un signal qui se répète à l'identique: c'est une simple fréquence de 440Hz. Au lieu d'inscrire la liste des mesures prises sur la courbe, le MP3 se contentera d'incrire dans le fichier la fréquence de la note, éventuellement accompagné du moment où commence le son dans la musique et du moment où celui-ci finit :
440
 
La restitution du son se fera par la reconstitution de la courbe qui sera alors transformée en signal électrique pour être transmise aux haut-parleurs.

Numérisation d'une musique au format MP3

Supposons désormais que notre musique soit constituée de deux notes: un LA de 440Hz et un LA de l'octave du dessus,  de 880Hz. Le son audible résultant est la somme des deux signaux. Plutôt que de donner la valeur des mesures d'échantillonage du résultat (dernière courbe), il suffit de donner les deux fréquences qui la composent :
440   880
 
 
Les schémas de gauche sont la représentation mathématique du son.
Les schémas de gauche sont la représentation du spectre des fréquences équivalente: ils présentent les différentes fréquences présentent dans le son.
courbe 1: un LA d'octave 3 à 440Hz
courbe 2: un LA d'octave 4 à 880Hz
courbe 3: le son résultant si les deux notes sont jouées simultanément
 
Pour une musique complète, le signal est beaucoup plus complexe, nous en avions donné un exemple en début d'article. Pourtant même s'il est très complexe, il est possible de décomposer ce signal en plusieurs sinusoïdes simples comme celles de note LA. On appelle cette analyse mathématiques une transformée de Fourrier. Elle nécessite une puissance relativement élevée et les lecteurs MP3 portable ont longtemps été limités du fait de la consommation électrique importante que ces calculs impliquaient : leur autonomie n'était alors pas suffisante. Aujourd'hui, les lecteurs MP3 embarquent des micro-processeurs spécialisés dans le type de calculs nécessaire au décodage de tels flux audio.
 
Logo définition
Transformée de Fourrier
Tout signal peut-être décomposé comme somme de signaux sinusoïdaux.
 
Le logiciel encodant une musique au format mp3 va effectuer la transformée de Fourrier (une analyse mathématique) du spectre de la musique (la représentation graphique que nous en avions fait en début d'article). Cette musique est décomposée en somme de signaux sinusoïdaux. Plus simplement, un calcul permet de trouver toutes les fréquences qui la composent.
 
Pour augmenter encore le taux de compression, le logiciel peut ensuite utiliser un modèle psycho-acoustique. Selon ce modèle, il lui devient possible de supprimer certaines fréquences considérées comme inaudible par l'homme. Bien-sûr, cela renforce la perte de qualité du signal.
Certaines personnes seront gênées par les pertes engendrées, d'autres n'entendront pas la différence avec l'original. Un peu comme le langage SMS où certaines lettres jugées inutiles sont supprimées: certaines personnes peuvent le lire sans problème, pour d'autres, c'est parfaitement incompréhensible!
Exemple: a12c4 signifiant "A un de ces quatres !"
 
Logo question
Pourquoi est-on gêné par la suppression de fréquences pourtant inaudibles ?
Individuellement, certaines fréquences correspondent à des notes trop aigues ou trop graves pour être entendues par l'oreille humaine. Toutefois, une musique est une somme de multitudes de fréquences où toutes ont un rôle, même minime. Prenons la note LA joué par un piano et un saxophone. En théorie le LA des deux instruments devrait être identique : une fréquence unique de 440Hz. En pratique pourtant, le son est composé d'une multitude de fréquences de faible impact sur le son, mais qui pourtant lui donnent tout son timbre. C'est la raison pour laquelle un LA de piano ne sonne pas pareil qu'un LA de saxophone. Enlever ces fréquences pourtant inaudibles c'est restituer un son biaisé sonnant plus électronique. Un son de saxophone au synthétiseur ne sonnera pas pareil qu'un son de véritable saxophone du fait de l'absence de toutes ces fréquences qui proviennent du cuivre de l'instrument, de la vibration du souffle du musicien....
 
Logo astuce
Avec quel logiciel lire un MP3 ?
 
En résumé...
 
1- Une musique est un signal sonore qu'il est possible de représenter mathématiquement
2- Un calcul mathématique permet de décomposer la musique en signaux simples d'une seule fréquence que l'on pourrait assimiler à des notes.
3- Certaines de ces fréquences, considérées comme inaudibles sont éliminées
 
S'il ne fallait ne retenir qu'une phrase : 
"Le MP3 est un format de fichier audio largement utilisé et dont l'avantage réside dans le taux de compression qu'il propose malgré une légère perte de qualité."
 
Votre note : Aucun(e) Moyenne : 4.2 (11 votes)