À chaque personne sa propre façon de composer et d’enregistrer de la musique, de la musique de film, des mélodies ou des effets sonores. Il existe encore plus de variantes quand il s’agit d’arranger ou de produire une chanson ou un album entier. Pour tous les types de productions audio, arrive un moment où il faut mixer sur un, deux ou plusieurs canaux toutes les pistes enregistrées indépendamment. L'étape suivante consiste à parfaire le formatage du mixage final et à lui donner une ultime touche qualitative en effectuant le mastering de la production. La production audio est maintenant prête à être publiée, soit numériquement (broadcast, téléchargement, streaming), soit sur un support physique (CD, DVD, SACD, etc).
Par conséquent, dès le début de chaque production audio, il est essentiel d'avoir une idée de la manière dont votre prochaine création sera partagée. La réponse à cette question permettra de définir rapidement la façon dont vous allez, dans la pratique, enregistrer votre production et quel format audio approprié doit être envisagé.
L’ère numérique moderne a vu apparaître des myriades de formats de fichiers audio et, à un moment donné, vous avez dû vous demander quel format audio offrait la qualité sonore optimale, ce qu’il fallait utiliser pour le streaming sur internet, quelles étaient les différences dans l’audio sur les divers réseaux sociaux et plateformes de streaming ? Avec l'augmentation de la bande passante sur Internet, il devient moins nécessaire qu’avant de compresser les fichiers audio – tous les acteurs de la production musicale et audio savent bien que certains formats de fichiers audio compressés se traduisent par des compromis sur la qualité du son. Découvrons cela ensemble.
Codec audio : De quoi parle-t-on ?
Un codec audio peut être un appareil ou un programme informatique. Dans un ordinateur, un codec audio peut être un programme informatique mettant en œuvre un algorithme qui compresse et décompresse les informations audio selon un type donné de codage d’enregistrement sonore ou de streaming.
Un codec possède à la fois un convertisseur numérique/analogique (DAC) et un convertisseur analogique/numérique (ADC), et gère ensemble ces deux convertisseurs. MP3, Windows Media Audio (WMA) ou Dolby Advanced sont des exemples de codecs courants. Ils fonctionnent comme un circuit électronique qui transforme les ondes sonores en données numériques, et vice versa. Le terme peut s'appliquer à la « seule » transformation des signaux A/N et N/A, mais il peut aussi intégrer la procédure de compression pour contribuer à réduire ou à modifier le signal.
Perte et compression
Il existe trois types de codecs de base, qui incluent ou non la compression de la taille des fichiers. Voyons en détail comment fonctionnent ces différents algorithmes.
- Format non compressé : ce terme définit un enregistrement sonore sans aucune compression de données. Le son non compressé reste donc identique à celui qui a été enregistré.
- Format de compression sans perte (lossless) : il s'agit d'un procédé de compactage des données audio, par calcul, qui permet la compression et la décompression des données des enregistrements sonores sans aucun compromis sur la qualité audio perçue. La compression sans perte signifie que même si la taille du fichier est réduite, la qualité audio reste identique – on peut ainsi réduire jusqu'à 50 % la taille du fichier sans perte de qualité.
- Format de compression avec perte (lossy) : il s'agit d'un procédé éliminant par calcul certaines données audio moins importantes afin de réduire la quantité d'informations dans l'enregistrement sonore, pour créer un ensemble de données moins lourd à transmettre. Les codecs de compression avec perte se basent sur des principes psychoacoustiques pour arriver à des tailles de fichier nettement plus petites. Compte tenu des propriétés de l'appareil auditif humain (oreilles/cerveau) et suite au phénomène psychoacoustique de « masquage », certains éléments d'un enregistrement sonore sont occultés par d'autres et l'auditeur ne les perçoit pas. Les algorithmes avec perte décomposent et analysent les ondes sonores, et codent, à des résolutions binaires inférieures, les bits correspondant à ces parties masquées du son. Ces algorithmes utilisent un « codage perceptuel » pour effectuer l'analyse psychoacoustique et la réduction des données. Les fichiers audio qui en résultent peuvent être d’une taille jusqu'à dix fois inférieure. Mais cette réduction des données et de la taille a un coût. Contrairement aux fichiers sans perte, les enregistrements sonores avec perte ne conservent pas toutes les informations audio et entraînent généralement une dégradation audible de la qualité du son. L’ampleur de cette dégradation dépend du codec lui-même, de sa mise en œuvre et de la taille du nouveau fichier audio comprimé.
Formats audio courants
DSD (Direct Stream Digital) - Il s'agit d'un format audio non compressé de très haute résolution. Le DSD est de bien meilleure qualité que les données PCM classiques en 16 bits/44,1 kHz et que les formats sans perte tels que le FLAC et l’ALAC. Grâce à son codec de très haute qualité (le format de données DSD échantillonne en 1 bit, modulation Delta-Sigma à une fréquence de 2,8224 MHz), des convertisseurs audio très performants sont souvent nécessaires pour lire les enregistrements DSD.
PCM (Pulse-Code Modulation, « Modulation par impulsions et codage) – Il s'agit d'un format audio non compressé, représentant des signaux analogiques échantillonnés numériquement. C'est le format standard de l'audio numérique dans les ordinateurs, les CD, les DVD, la téléphonie numérique et d'autres applications audio numériques. Dans un enregistrement PCM, l'amplitude du signal analogique est échantillonnée régulièrement à intervalles uniformes et chaque échantillon est quantifié à la valeur numérique la plus proche.
WAV (Waveform Audio Format) – Le WAV est un autre format audio ne compressant pas l'enregistrement audio analogique original dont il est dérivé. Les fichiers WAV permettent une fréquence d'échantillonnage et une résolution numérique très élevées, ce qui leur permet de prendre en compte tout le champ auditif de l'oreille humaine. Un encodeur de fichiers WAV utilise la modulation par impulsions et codage (PCM) comme format de données. Ces fichiers sont difficiles à diffuser en streaming, car leur forme non compressée implique des débits très élevés.
BWF (Broadcast Wave Format) – Le BWF est également un format non compressé dédié aux données audio. Il est basé sur le format audio WAV auquel l'UER (Union Européenne de Radio-Télévision) a ajouté une « extension audio broadcast ». Il s’utilise notamment pour faciliter les échanges de contenus audio entre différents environnements broadcast ou entre installations basées sur des logiciels de station de travail audio différents.
AIFF (Audio Interchange File Format) - L'AIFF est un format audio totalement non compressé, lisible sur Mac et PC. Conçu par Apple, il est impossible de le distinguer des sons au format PCM. Comme le volume de données est important, le streaming en AIFF est possible mais peu usité.
FLAC (Free Lossless Audio Codec) – Le FLAC est un format audio open source sans perte, doté d'un algorithme de compression très efficace, qui peut réduire le fichier de 50 à 70 % par rapport à sa taille originale. Ce format est très populaire parmi les amateurs de musique car il offre un moyen de stocker sa collection de musique sous une forme de la plus haute qualité. Comme il est open source, ce format est compatible avec de nombreux appareils et programmes.
ALAC (Apple Lossless Audio Codec) - Assurant un son identique à l’enregistrement original, le codec ALAC, qui utilise un conteneur de fichier M4A, se caractérise par une compression sans perte et permet de multiples montages sans perte de qualité. Les fichiers avec perte M4A possèdent une qualité similaire à celle de formats sans perte, mais leur taille est inférieure et ils sont essentiellement lus avec des appareils Apple.
MP3 (Moving Picture Experts Group Layer-3 Audio) - C'est l'un des codecs audio les plus connus. Les enregistrements MP3 utilisent une compression avec perte, qui élimine définitivement certaines données audio. Les enregistrements MP3 peuvent être dix fois moins volumineux que les enregistrements WAV. Les fichiers MP3 peuvent être encodés à un débit binaire constant ou variable. Un débit binaire constant assure une même qualité sur toute la durée du fichier audio, au prix d’une augmentation de la taille du fichier. Le débit binaire variable réduit la qualité pendant les moments de silence ou de quasi-silence de l'enregistrement, ce qui se traduit par une réduction globale de la taille du fichier.
WMA (Windows Media Audio) - Le WMA est disponible en versions avec et sans perte. En général, les enregistrements WMA sont moins volumineux que ceux non-compressés et leur utilité est comparable à celle des enregistrements MP3 et FLAC.
Ogg Vorbis - Il s'agit d'un format audio open source, sans brevet et avec perte. Il est parfait pour le streaming sur Internet car il se satisfait de connexions assez lentes. Offrant une bonne qualité sonore pour un faible débit numérique, il compresse l’audio et élimine des informations pour obtenir des enregistrements de plus petit volume. De plus, les fichiers OGA/OGG ont tendance à être de meilleure qualité que les MP3.
AAC (Advanced Audio Coding) - Il s'agit d'un autre codec avec perte qui offre des enregistrements audio peu volumineux et fonctionne extrêmement bien pour la diffusion en ligne. Il permet également de créer des fichiers avec un débit binaire variable ou constant. Les enregistrements AAC ne sont pas adaptés si vous avez besoin d'une quasi-réplique de l'enregistrement original, car certains bits sont supprimés.
Comment faire son choix ?
Le choix du meilleur format audio dépend en grande partie de l'application et de l'utilisation. Vous devez choisir un format audio assurant une qualité sonore optimale pour la publication ou le support de transmission, sans plus. Les enregistrements audio d'une qualité excessive peuvent être difficiles à gérer, à éditer et à partager.
- Les ingénieurs du son et les créateurs de contenu audio professionnels utilisent des formats de fichiers non compressés à haute résolution pour enregistrer, éditer et masteriser les fichiers audio, ce qui permet de conserver une qualité sonore totale. Une fois le formatage audio final terminé, ces enregistrements peuvent facilement être exportés dans des formats compressés plus faciles à distribuer. PCM, WAV, BWF et AIFF sont des exemples de formats non-compressés.
- Si vous n'êtes pas un amateur de musique désireux d'écouter votre collection de musique en haute fidélité, vous pouvez choisir un format audio sans perte, qui utilisera moins de capacité de stockage qu'un format non compressé, tout en conservant la qualité totale de l'enregistrement initial. Ces formats comprennent les FLAC, WMA, et ALAC (M4A).
- Si vous avez besoin de partager des enregistrements audio ou de diffuser des flux en streaming sur Internet, choisissez un format qui utilise la compression du son avec perte. Heureusement, les codecs de compression avec perte ont rapidement amélioré leur qualité sonore au cours des dernières années, réduisant considérablement la différence entre la compression avec perte et la compression sans perte. Le format MP3 est probablement le plus populaire. Les fichiers MP3 peuvent être créés avec différents débits binaires, ce qui permet d'équilibrer la qualité sonore et la taille. Leur taille efficace en a fait le format standard pour l'échange audio sur le Web. Les autres formats courants sont l’Ogg Vorbis et l’AAC.
Un dernier conseil. Lorsque vous devez exporter un mixage audio sous forme de mixage stéréo final, assurez-vous toujours que le fichier audio est optimisé et de la meilleure qualité possible pour le média de destination (CD, DVD, broadcast, streaming Web, etc.).
L’audio sur Internet
Compte tenu du nombre de plateformes de réseaux sociaux, les possibilités de partager des productions audio sur Internet sont énormes. Aborder ce sujet soulève la question suivante : quel format audio dois-je utiliser lorsque je transmet ma production sur Internet ? Comme souvent dans le monde des médias sociaux, les spécifications audio et vidéo ont tendance à souvent changer. La plupart de ces changements sont liés au fait que les plateformes de médias sociaux améliorent leurs solutions pour offrir à leurs utilisateurs des expériences de visionnage et d'écoute plus agréables.
Si tous ces changements sont difficiles à suivre, le tableau ci-dessous fournit un résumé de la situation actuelle.
Médias sociaux
Formats audio 1 | Formats vidéos 1 | |
Codec AAC stéréo à 128 kbits/s+ | .MOV et .MP4 avec codec de compression H.240 | |
Codec AAC stéréo à 128 kbits/s+ | .MOV et .MP4 avec codec de compression H.240 | |
AAC-LC mono ou stéréo (Low Complexity) | .MP4 pour l’Internet, .MOV pour le mobile | |
Snapchat | Codecs stéréo PCM ou AAC, min. 192 kbits/s, 16 ou 24 bits uniquement, fréquence d’échantillonnage de 48 kHz | .MP4 ou .MOV avec codec de compression H.264 |
YouTube | MP3 stéréo (en conteneur MP3/WAV), PCM (en conteneur WAV), AAC (en conteneur MOV), audio FLAC. Débit binaire audio minimum pour les formats avec perte : 64 kbits/s | .MOV, .MPEG4, MP4, .AVI, .WMV, .MPEGPS, .FLV, .3GPP ou .WebM |
Codec AAC MPEG4, moins de 64 kbits/s | .ASF, .AVI, .FLV, .MOV, .MPEG-1, .MPEG-4, .MKV ou .WebM | |
Vimeo | AAC-LC (Low Complexity) stéréo, fréquence d’échantillonnage 320 kbits/s, 48 kHz | Codecs H.240, Apple ProRes 422 (HQ), H.265 (HEVC) |
Plateformes de streaming
Formats audio 2 | |||
Spotify | Accepte FLAC ou WAV stéréo Tous les fichiers sont convertis en WAV (44,1 kHz) et transcodés dans l'un des formats suivants : - Ogg/Vorbis (96, 160 ou 320 kbits/s) - AAC (128 ou 256 kbits/s) - HE-AACv2 (24 kbits/s) | ||
Pandora Premium | AAC+ (32 kbps ou 64 kbps) MP3 (192 kbps) | ||
Apple Music | AAC (256 kbps) | ||
SoundCloud | Accepte WAV, FLAC, AIFF, ALAC, MP3, AAC, Ogg / Vorbis, MP4, MP2, M4A, 3GP, 3G2, MJ2, AMR et WMA. Il est recommandé d’utiliser les formats WAV (16 et 24 bits), FLAC, AIFF ou ALAC | ||
TIDAL HiFi | Qualité Master - En partenariat avec MQA (Master Quality Authenticated), offre une qualité de master audio de 44,1 kHz / 16 bits, à 96 kHz / 24 bits (parfois 192 kHz) entre 2304 et 9216 kbits/s HiFi - FLAC (44,1 kHz / 16 bits) à 1411 kbits/s Standard – AAC (320 kbits/s) | ||
Table de mixage TouchMix et formats audio
Avec l'aperçu ci-dessus des formats de fichiers audio courants, vous pouvez vous demander comment les tables de mixage de TouchMix QSC gèrent leurs capacités d'enregistrement audio. Tous les modèles TouchMix sont capables d’enregistrer toutes leurs entrées plus un mix stéréo vers un disque USB externe sans recourir à un ordinateur. Les pistes sont créées en format non-compressé Broadcast Wave (BWF) 32 bits et peuvent être lues et mixées sur la table de mixage ou importées dans un logiciel DAW pour l’overdub ou le montage post-production.
De plus, un utilitaire DAW TouchMix gratuit pour Windows® et macOS® est disponible pour aider au transfert de pistes TouchMix vers un logiciel DAW et inversement.
Conclusion
Malgré l'augmentation constante de la bande passante sur Internet, et au-delà des considérations purement techniques, les fichiers audio avec perte sont devenus la norme pour des générations d'amateurs de musique et de musiciens qui ont grandi avec eux. Cela ne devrait pas empêcher les nouvelles générations de découvrir, de profiter et de reconnaître la qualité sonore supérieure des formats audio non compressés.
Pour tous ceux d'entre nous que la qualité du son préoccupe, continuons à partager activement l’audio non compressé et sans perte chaque fois que cela est possible, trouvons les codecs de la meilleure qualité, choisissons les débits binaires les plus élevés et gardons un œil sur les développements technologiques dans ce domaine. La recherche de la meilleure reproduction audio ne suffit pas si les formats audio de haute qualité ne sont pas largement utilisés.
Référence (1) :
- https://influencermarketinghub.com/social-media-video-specs/
- https://sproutsocial.com/insights/social-media-video-specs-guide/
- https://vimeo.com/help/compression
Référence (2) :
Données techniques tirées de chaque plateforme de médias de streaming respective.
Interesting. You might give some thought for future writings – artifacts, fidelity to the performer vs the sound engineer vs the author, trade-offs/sub-optimizations between storage media vs transmission vs D/A conversion processing resouces, and other Caeteris Paribus reliances that are passed over.
Hello Henry, thanks a lot for your note and for your writing suggestions and ideas. There is a lot to say on the various topics you mentioned. Thanks for reading our Blog. Kind regards.