Faut-il écouter la musique en Hi-Res 24 bits/ 96 KHz ?

Est-ce qu’il y a véritablement plus de plaisirs à écouter la musique HD ? Est-ce que nous percevons véritablement une différence ? N’est-ce pas là encore une simple manœuvre marketing ? Si nos oreilles ont une limite auditive, est-ce que notre cerveau, nos organes, peuvent ressentir des vibrations que n’entendent plus nos oreilles ?

D’abord, testez vos oreilles

Je vous invite à utiliser de préférence un casque audio de bonne qualité. Une écoute sur enceinte est tout aussi faisable, mais tout dépend de votre matériel (chaine du son). Pour vous donner le plus de chances de discernement possible, mieux vaut être équipé d’une bonne carte son (un bon DAC).

Ce test d’écoute propose deux versions MP3 compressées, l’une à 128 Kpbs et l’autre à 320 Kbps. Le but étant de trouver le fichier WAV, qualité CD. Je précise que le CD que nous connaissons tous (WAV/PCM) n’est pas considéré comme HD. Il est un standard de sortie numérique, une référence de sortie audio idéale pour notre capacité auditive.

Faites ce test deux ou trois fois, car la chance peut vous sourire, vous verrez qu’au bout de deux tentatives rien ne va déjà plus.

Quel est votre résultat ? Voici le mien :

Mon matériel :

Carte son UR242
Enceintes ALESIS M1 active MK2
Casque Sennheiser eh-350.

1er essai au casque : Je trouve 1 seul fois le WAV et 5 fois MP3/320 Kbps.

2ème essai sur enceintes : Je trouve 2 fois le WAV, 2 fois le MP3/320 kbps et 2 fois la version 128 kbps.

3ème essai au casque : Je trouve 2 fois le WAV, 2 fois le MP3/320 kbps et 2 fois la version 128 kbps.

4ème essai au casque encore : Je trouve 2 fois le WAV, 1 fois le MP3/320 kbps et 3 fois la version 128 kbps.

5ème et dernier essai sur enceintes : Je trouve 3 fois le WAV, 3 fois la version 128 kbps.

Je me suis ramassé il faut l’avouer ! Cependant, je pense avoir remarqué une chose, c’est que la version WAV est légèrement moins forte sur certains morceaux. Dites-moi en commentaire si la technique se révèle efficace pour vous.

Je précise également que j’entends encore bien. Pour tout vous dire, j’entends encore jusqu’à 17300 Hz, donc toutes les conditions étaient là.

Vieillissement de l’audition

La dégradation naturelle de l’ouïe est bien entendu un facteur à prendre en compte. Afin de tester votre santé auditive, il existe Function generator depuis l’Appstore d’Apple ou Frequency Sound Generator pour Android.

Notre mémoire auditive est stérile

Vu les résultats inconsistants que nous obtenons, il est facile d’en déduire que notre mémoire auditive est quasi nulle dans ce domaine. Nuancer les imperfections d’un son compressé en basculant d’un titre à un autre se révèle finalement très compliqué. Un manque de discernement ? J’ai tenté de chercher dans les aigus certaines subtilités, tenter aussi l’écoute forte, l’écoute très basse. Rien ou si peux, juste une perception de volume plus faible pour le WAV comme je le disais plus haut.

Des tests à l’aveugle ont été réalisés avec des professionnels du son (ingénieurs, musiciens) et tous ont été incapables de différencier une qualité CD d’une qualité HD. Ils ajoutent que la notion de plaisir d’écoute reste identique.

Il est donc quasi impossible de faire la différence entre le standard CD et la haute définition ! Alors, tout est dit ou presque ! Non, non, restez encore un peu, et si vous êtes arrivés jusqu’ici (merci) c’est que le sujet vous passionne ou que vous tentez de comprendre quelque chose qui vous échappe.

J’ai regroupé plus bas quelques notions techniques afin d’avoir sous le coude les réponses de certaines définitions.

Faut-il migrer vers l’audio Hi-Res ?

J’ai mené ma propre enquête, consulté des vidéos techniques de matheux, suivi des cours, lu plusieurs articles et aussi écouté certains témoignages d’ingés son. Voici ce que j’en conclue.

Faut-il passer à la HD : Oui et Non !

Oui parce que ça tire vers le bas tous les formats compressés qui nous explose les tympans et détruise notre santé auditive, puis disons-le, à défaut de l’entendre, le son est meilleur, plus dynamique. On se fiera aux chiffres, plutôt qu’à nos oreilles.
Non parce que la HD c’est le double de prix voir plus (2019), que votre disque dur stockera des fichiers beaucoup plus lourds, et que tout ceci n’a rien d’écolo.

On sait que la qualité CD 16 bits/44 100 Hz de l’époque, a été soigneusement pensée et créée pour satisfaire pleinement nos besoins auditifs. Ce format et sa résolution restent une référence, c’est un rendu très bon et suffisant. Il n’est pas compressé et présente une bonne dynamique ! Donc pourquoi vouloir plus ? Marketing ? Il faut vendre toujours plus ? Et bien, c’est un peu ça du point de vue consommateur.

La Hi-Res c’est pour les pros

Cependant, il est impératif pour les ingénieurs du son de travailler en HD 24 bits / 44 100 Hz minimum. Pourquoi ? Cela apporte plus de souplesses, plus de précisions au moment de retoucher le son. La plage dynamique est plus large. Elle passe de 96 dB à 144 par rapport au CD.

Si la prise son est faite en 16 bits alors 2 bits sont déjà perdus puisque pour des problèmes de saturation, le réglage des décibels ou du volume si vous préférez, doit se faire idéalement entre -14 et -18 dB. L’échelle étant comprise entre – l’infini et le 0 db. Donc, on perd en puissance et précision en se privant de -14 à 0, soit 2 bits, car 1 bit = 6 dB. Au-delà du zéro, c’est la zone tampon de saturation.

La compression audio

Lors de l’étape du mastering audio certains groupes veulent sonner toujours plus fort que la concurrence. Il faut se démarquer quelques parts. Donc certains professionnels gonflent les fréquences au max et finalement la dynamique disparaît. Tous les instruments restent continuellement au même niveau sonore et proche de la saturation, du 0 dB.

Une compression de types MP3 ou AAC ne produira pas la même chose. La compression de données (MP3, AAC, OGG ) supprimera définitivement certaines fréquences, en se basant sur le fait que certaines fréquences sont étouffées par d’autres, alors elles deviennent inutiles. Cette compression détériore l’expérience d’écoute là où la compression de type dynamique qui booste les fréquences au maximum peut détériorer l’audition.

Ex : Un CD a un débit binaire (bitrate) de 1400 kbps environ, car 44100 x 16 x 2 = 1411200 / 1000 = 1411.2 kbps. Pour la compression MP3 les débits les plus répandus sont 128, 192, 256, 320 kbps. Soit un rapport de compression de 1/10, 10 fois moins lourd que le fichier original.

Quant à la suppression de certaines fréquences, imaginez qu’une moto passe dans la rue, la sonnerie de votre téléphone retentit, mais vous ne l’entendez pas ! L’algorithme de compression supprimera carrément la sonnerie du téléphone au moment où la moto passe. Ainsi la musique perd diverses fréquences ici ou là.

Donc si un album est déjà survitaminé, dans quel état sera la version compressée ?! Quoi qu’il en soit, faites attention à vos oreilles. On peut évoquer la compression audio des radios (Fun radio, NRJ) qui utilisent un maximum ce procédé de compression dynamique pour faire ressortir toutes les fréquences et couvrir les bruits ambiants en voiture.

A gauche on conserve une dynamique, à droite tout est compressé

Le triste exemple du groupe Metallica

Pour son neuvième album, les quatre cavaliers, ou du moins l’ingénieur du son a poussé les potards un peu trop loin ! Et si je vous parle de ça, c’est que l’exemple est assez marrant. La version audio de Death Magnetic est meilleure sur le jeu Guitar Hero, car d’une part, le son est en version HD, et d’autre part, il est non masterisé, non sur-vitaminée comme celle du CD. LoL.

Effectivement, la différence saute aux oreilles, le son est vraiment différent, un peu moins puissant, mais on ressent plus les instruments et leur profondeur d’attaque, ça sature moins, la basse est bien présente, un peu trop à mon goût, mais ça pique moins les tympans. Si vous souhaitez écouter tout ça, c’est ici en HD FLAC 24bit/96khz sur YouTube. Je vous invite sur “All Nigtmare Long”. Il est possible de passer d’une chanson à l’autre avec les liens en description sur la vidéo.

Je ferai une comparaison du spectre des fréquences dans un futur article que je mettrai en lien ici. Donc, on tentera de voir les différences entre la version HD, CD, et aussi les services de streaming AppleMusic et Youtube Music.

On sait maintenant que la musique HD n’est pas nécessaire pour nous consommateurs et que finalement le plus important, c’est la chaîne du son qui doit être de qualité. Mais on peut toujours se poser la question suivante, quel service de streaming audio choisir ? Puisque que tous utilisent la compression. Est-ce qu’un service se démarque de l’autre ? Y a-t-il une compression meilleure que l’autre ?

Se débarrasser de la compression audio

Au final, ce qu’il y aurait de mieux à faire, serait de stopper simplement l’écoute des formats compressés et reprendre une écoute CD standard comme dans les années 90.

Pour gagner en espace de stockage, il existe une alternative, c’est le format FLAC qui compresse le CD, mais sans perte tout en gardant à l’identique la dynamique des 16 bits / 44,1 KHz. C’est une solution intéressante qui permet de réduire de 50% le poids d’un fichier.

Pour mieux comprendre

Le son : Vibration de l’air. Suite de surpressions et de dépressions de l’air qui se mesure en Hertz. Ex : un LA 440 d’une corde de guitare vibrera 440 fois par seconde.

Propagation du son :

En fonction de la température

Aire : 340 mètres/s
Eau : 1440 mètres/s
Cuivre : 3500 mètres/s
Acier : 5000 mètres/s

Décibels : (dB) C’est la valeur comptabilisée de la pression acoustique exercée par une onde sonore. On en reparle plus bas.

Hertz : (Hz) C’est la mesure de la fréquence de répétition d’un événement qui se répète chaque seconde.

Échantillonnage ou numérisation du son : C’est l’action de prélèvement périodique d’échantillon d’un signal analogique.

Fréquence d’échantillonnage : C’est le nombre d’échantillons mesurés par seconde. Les plus connus sont celles du téléphone 8000 Hz et celle des CD audio 44100 Hz.

Attention à ne pas mélanger un signal sonore de 440 hertz (représentant des vibrations acoustiques) et la fréquence d’échantillonnage exprimée aussi en Hertz qui représente un découpage dans le temps.

La dynamique : Grossièrement, c’est la différence entre un son tout juste audible et un son à son maximum (avant saturation). En qualité CD, la dynamique est de 96dB. Avec une quantification sur 16 bits, on obtient 96 dB, car 1 bit = 6 dB = 96 dB. Sur 1 bit on peut stocker une amplitude de 6 dB. Sur 24 bits on passe à 144 dB, sur 32 bits à 192 dB ! Mais à quoi ça sert ! Pour nos oreilles encore une fois à rien.

spectre de fréquences :

Quantification : C’est la valeur numérique en bit de chaque échantillon prélevé.

Bit : Un bit en informatique peut prendre soit la valeur 0 soit la valeur 1. C’est un peu comme un interrupteur, soit le courant passe ou pas.

Un codage sur 2 bits (2²) donne 4 valeurs possibles : 00 – 01 – 11 – 10. Un codage 4 bits (2⁴) donne 16 valeurs possibles : 0000 – 0001 – 0011 – 0111 – 1111 – 1000 – 1100 – 1110 – 1111. Et sur 8 bits on passe à 256 valeurs possibles, sur 16 bits 65 536 valeurs… Plus le nombre de bits est important, plus on diminue l’erreur introduite par la numérisation.

Bitrate / Débit binaire : C’est le flux d’une quantité de bits généré sur une seconde. Plus cette valeur est grande, plus elle permet de stocker des informations et donc d’avoir une reproduction fidèle de l’audio, valable également en vidéo.

Les limites de l’audition humaine

L’oreille humaine perçoit les sons, les vibrations acoustiques comprises entre 20 Hz et 20 000 Hz quand tout va bien. Nous distinguons plus facilement la plage 500Hz – 10000Hz. Elle représente notre zone de confort en quelque sorte. Les valeurs les plus grandes définissent les aigus.

Lorsque nous parlons : La phonation

Nous pouvons émettre sur des fréquences comprises entre 50Hz et 7000Hz. La parole se situe vers 3500Hz.

Qualité CD et Qualité téléphonique

La qualité CD que nous connaissons depuis le début des années 80′ couvre largement nos besoins auditifs. La fréquence d’échantillonnage pour le CD audio PCM est de 44 100 Hz et de 8000 Hz pour la téléphonie numérique.

Pourquoi les experts de l’époque ont-ils décidé d’échantillonner à 44 100 Hz le CD audio ?

Le théorème de Shannon-Nyquist : Pour être correctement représenté, un son doit être échantillonné/découpé, avec une fréquence au moins deux fois supérieures.

Ex : Si nous voulions appliquer le théorème pour numériser seulement un LA 440, alors il faudrait théoriquement échantillonner à une fréquence au moins égal à 880 hertz pour obtenir un son non pollué.

Puisque la plage fréquentielle de l’oreille humaine va de 20 à 20 000 Hz, on double la fréquence max et on obtient 40 000 Hz.

Pourquoi 44 100 Hz et non 40 000 Hz?

Le repliement de spectre : Notion importante pour bien comprendre le théorème de Shannon-Nyquist.

On a tous déjà observé ce repliement et notamment à la télévision lorsque les roues d’une voiture semblent s’inverser. C’est lié à la fréquence d’échantillonnage de la vidéo cadencée à 24 images par seconde. La fréquence de rotation de la roue apparaît alors à une fréquence négative.

Ex : si on échantillonne la parole (3500 Hz) il va nous falloir doubler à 7000 Hz. Mais il y a de fortes chances que des sons de 3600 Hz sortent de votre bouche tant bien même qu’il vous vienne soudainement à crier du 6500 Hz au téléphone. Ces 6500 Hz vont se transformer en un son grave de 500 Hz, car 7000 – 6500 = 500.

Ces repliements provoquent, lors de la numérisation, des composantes fréquentielles qui ne sont pas présentes dans le signal analogique d’origine. D’où la nécessité de faire précéder un filtre passe-bas ou filtre anti-repliement de fréquence. Pour notre exemple, toutes les fréquences au-delà de 3500 Hz doivent être filtrées.

Mais comme un filtre n’est pas parfait, il laissera passer quand même des fréquences de 3510Hz ou 3555 Hz par exemple. Et c’est pour cette raison que l’on se donne une marge pour le choix de l’échantillonnage et éviter toutes fréquences additionnelles non désirées. On comprend pourquoi la téléphonie numérique est échantillonnée à 8000 Hz et non 7000 Hz. C’est une marge obligatoire dû à l’imperfection de l’action des filtres.

Quand commence la haute résolution / Hi-Res

La haute résolution est un terme marketing ! C’est tout ce qui se trouve au delà de 16 bits et/ou 44,1 kHz. Souvent il est question de 24 bits/48 kHz et 24 bits/96 kHz.

Le 1 bit DSD est intrigant n’est-ce pas ? Quelques explications un peu plus bas

Voici quelques exemples de tolérances hebdomadaire d’expositions :

40 heures à 87 dB
20 heures à 90 dB
5 heures à 96 dB
2 heures à 100 dB
30 minutes à 106 dB
10 minutes à 111 dB
4 minutes à 115 dB
1 minutes à 120 dB

Au dessus, les risques de détériorations peuvent être irréversibles si en plus l’exposition est répétée.

Une autre technologie : le DSD

Cependant, il existe une autre technologie codée seulement sur 1 bit, avec un taux d’échantillonnage ultra élevé. C’est-à-dire 2.8 millions de prélèvements par seconde. Avec ce taux, nul besoin de beaucoup de valeurs numériques de stockages d’où le 1 bit.

Les formats destructeurs de sons et d’oreilles

MP3 :

Type : flux audio
1995 (MPEG-1/2 Audio Layer III)
Compression avec perte
Extension : .mp3
Débit : 8, 16, 24, 32, 40, 48, 56 , 64, 80, 96, 112, 128, 160, 192, 224, 256, 320 Kbits/s
Fréquence d’échantillonnage : 8, 11, 16, 22, 24, 32, 44, 48 kHz

AAC :

Type : flux audio
1997 (Advanced Audio Coding)
Bonne qualité de compression mais avec perte
Extensions de fichier : .aac, .m4a, .m4p, .m4b, .mp4, .3gp
Débits : 64, 80, 96, 128, 160, 192, 256, 288, 320 Kbps
Fréquences d’échantillonnage : 11, 12, 16, 22, 24, 32, 44, 96 kHz
adopté par Apple

Un format selon Apple de meilleure qualité que le MP3. Ça reste de la compression donc ce n’est toujours pas bon.

Les formats sans perte à privilégier

FLAC, ALAC, WMA, WAV, AIFF, DSD. Tous, supportent la HD sauf le WAV qui reste en 16 bits.

Vidéos

Falaises de Font d’Urle

Vidéo – Roc de Toulau 1581m

VERCORS – SAOÛ – La Chapelle Saint-Médard

VERCORS – Pas des Bachassons

Les gorges de la Bourne – Vercors

Fleuve à Ambel

Article au hasard

Vidéo – Rando Pas du Loup – Grotte des Ussets

Faut-il écouter la musique en Hi-Res 24 bits/ 96 KHz ?

D’abord, testez vos oreilles

Quel est votre résultat ? Voici le mien :

Vieillissement de l’audition

Notre mémoire auditive est stérile