L’enregistrement sonore qui a pour objectif la restitution durable d’un son a vu le jour fin 19ème siècle avec le phonautographe. On parle aujourd’hui d’enregistrement analogique ou numérique, dans le cas de l’analogique, le principe est de transformer une onde sonore en une grandeur électrique, puis mécanique ou magnétique qu’on peut enregistrer, pour le numérique ce sont des données numériques stockées sur un support numérique.

L’enregistrement sonore comporte trois phases fondamentales :

  • La captation : pour transformer les ondes sonores en signal ;
  • Le traitement : un dispositif de traitement du signal adapte et prépare le signal (compression, etc.) ;
  • L’enregistrement : pour transformer le signal en une forme matérielle, stable.

La captation ou prise de son est essentielle pour la restitution du champ sonore. Certains n’hésitent pas à dire que celle-ci ne sert qu’à produire un « objet sonore » dont la réalité, éloignée de l’objet de la captation, ne pourra qu’être électro-acoustique (voir Pierre Schaeffer par ex.). En effet, les premières déformations viennent de cette étape et subissent la qualité des microphones (ou du leur placement).

C’est ici qu’on parle de « dynamique » ou portée dynamique d’un système d’enregistrement qui désigne le rapport entre les amplitudes minimum et maximum que le système peut ou enregistrer et reproduire convenablement. Ce rapport ne peut dépasser celui de l’élément où il est le plus faible, du microphone, qui convertit le son en signal électrique, au haut-parleur qui convertit le signal en son. On trouve généralement le terme de Dynamic Range (ou DR) qui, en termes de qualité audio, dit qu’une plage dynamique plus élevée est généralement synonyme de meilleure qualité.
Certains ingénieurs du son écrasent la dynamique afin de favoriser une meilleure restitution sur du matériel d’écoute d’entrée de gamme. D’autres privilégient les écarts dynamiques et ainsi toute la saveur de la prise de son et du timbre des instruments. Tout est un choix…
Le site Loudness War mesure et indexe la marge dynamique de nombreux albums. On constate très rapidement qu’on peut avoir le meilleur matériel au monde, certains albums ne seront jamais bien restitués…

En 1982, avec Philips et Sony, naît le Compact Disc, premier support audio numérique, sur lequel la musique est stockée sous forme numérique, après un échantillonnage selon la technique PCM (Pulse Code Modulation). Le principe de cette numérisation dit, avec le théorème de Shannon, que la description d’un signal électrique nécessite un nombre d’échantillons équivalent au double de la plus haute fréquence de ce signal. Comme notre oreille perçoit jusqu’à 20 000 hauteurs de sons différentes — soit 20 000 Hertz — il est décidé de prélever, chaque seconde, 44 100 échantillons pour les CD audio. D’où la norme de 44,1Khz (et chaque échantillon audio sur ce support est décrit avec seize zéros et uns (16 bits), ce qui correspond à un débit binaire de 1,411 Mbps (44100x16x2 canaux)).

Dans les années 90, arrive le MP3 : avec lui le débit d’un flux PCM 16 bits/44,1 kHz est réduit de 1,411 Mbps à 128 kbps, moyennant une perte de qualité « acceptable ». Cette division par dix du débit implique une compression destructive : certains sons jugés peu utiles sont tout bonnement supprimés, selon des modèles psychoacoustiques complexes. La réponse en fréquence et la marge dynamique sont réduites. À l’écoute, une musique au format MP3 offre une scène sonore moins vaste, un registre grave moins ample et tonique, ainsi qu’une reproduction des hautes fréquences moins fluide. (Frandroid)
C’est d’ailleurs toujours valables pour tous les codecs audio destructifs : l’AAC porté par Apple, le Vorbis utilisé par Spotify, l’AC3 de Dolby, ou même le SBC et l’aptX, réservés à la transmission Bluetooth.

Pour autant, d’autres méthodes de compression non destructives sont ensuite développées, afin de préserver totalement l’intégrité du flux PCM 16/44. En 2000-2005 apparaissent les codecs FLAC (Free Lossless Audio Codec) puis ALAC (Apple Lossless Audio Codec), qui emploient une compression lossless (sans perte). Avec eux, le débit d’un flux CD 16 bits à 44,1 kHz est réduit de 1,411 Mbps à des valeurs moyennes comprises entre 600 kbps et 900 kbps — selon la complexité du signal audio.

Comme le son CD est critiqué par les audiophiles (qui lui reprochent, entre autre, une importance égale à toutes fréquences et donc des fréquences harmoniques situées au-delà de 20 kHz, essentielles notamment pour la détermination du timbre, de la couleur du son, qui sont tout simplement détruites au détriment de la musicalité), on voit apparaître le SACD (64 fois la résolution du CD-Audio) mais l’équipement est onéreux et le succès n’est pas au rendez-vous.
Pour autant, l’idée d’un échantillonnage plus important fait son chemin dans les studios d’enregistrement. Les ingénieurs du son travaillent avec des flux PCM jusqu’à 32 bits et 384 kHz. À l’écoute — avec un matériel de qualité — les bénéfices sont évidents : transparence, marge dynamique accrue et timbres plus réalistes. On parle alors de fichier disponible au grand public Hi-Res audio (FLAC) 24 bits 192 kHz.

Pour aider les consommateurs à identifier les baladeurs, amplis ou casques capables de prendre en charge les signaux audio HD 24 bits, un consortium industriel japonais a lancé le label Hi-Res Audio en 2014. On voit alors apparaître chez Sony, Pioneer ou encore Onkyo, des amplis, casques, baladeurs, smartphones ou enceintes certifiés Hi-Res Audio. Le point commun de ces appareils est la prise en charge native des flux audio HD 24 bits jusqu’à 192 kHz, grâce à un DAC intégré.

Pour les appareils Bluetooth, la norme Hi-Res Audio Wireless est différente. Pour profiter de ce logo, les appareils compatibles doivent prendre en charge des codecs audio Bluetooth spécifiques comme le LDAC ou le LHDC. Ces codecs ont en commun de permettre une transmission sans fil jusqu’à 24 bits à 96 kHz. On n’est donc pas au niveau du décodeur Hi-Res classique à 192 kHz.

Voici un petit rappel des principaux codecs audio Bluetooth et de leurs capacités (d’après Frandroid) :

  • SBC : 16 bits / 44,1 kHz max, débit jusqu’à 345 kbps
  • AAC : 16 bits / 44,1 kHz max, débit jusqu’à 256 kbps
  • AptX : 16 bits / 44,1 kHz max, débit jusqu’à 384 kbps
  • AptX HD : 24 bits / 48 kHz max, débit jusqu’à 576 kbps
  • AptX adaptative : 24 bits / 96 kHz max, débit jusqu’à 420 kbps
  • AptX Lossless : 16 bits / 44,1 kHz max, débit jusqu’à 1 Mbps
  • LDAC : 24 bits / 96 kHz max, débit jusqu’à 990 kbps
  • LHDC : 24 bits / 96 kHz max, débit jusqu’à 900 kbps

Bilan, l’audio lossless en Bluetooth, c’est possible, mais uniquement en qualité CD, avec les codec LDAC et LHDC, et à condition que la liaison radio ne soit pas perturbée.

Voilà, maintenant, dans le chapitre 3, on va voir quelles sont les solutions pour bénéficier du meilleur son possible aujourd’hui en 2024.

Erikheus A partir de mes oreilles

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *