La dynamique - et si on la recréait ?

Pour débattre sur tous les sujets audiophiles, ou poser vos questions sur l'audio
Avatar de l’utilisateur
TheDecline01
TN m'a tuer
TN m'a tuer
Messages : 5117
Inscription : 24 janv. 2011 10:46
Localisation : Achères
Contact :

La dynamique - et si on la recréait ?

Message par TheDecline01 »

J'ai eu une réflexion durant cette période de fêtes au sujet de la plage dynamique, et notamment de la fameuse loudness war ou compression excessive de la dynamique des enregistrements récents (années 90 on va dire) et grands publics (en gros tous les styles sauf le jazz et le classique non ?).

Je me disais avec toutes les grandes déclarations sur les logiciels, on fait du DSP, ont passe du DSD au PCM et autres... ne serait-il pas possible, et au-delà, pertinent, de re-créer au niveau logiciel de la dynamique sur un OS ou lecteur audiophile ? Je m'explique le concept :

Le logiciel charge la piste voulue. Il évalue sa plage dynamique. Disons qu'elle est bonne (niveau à déterminer évidemment, genre > 10-15dB), il ne fait rien. Mais on passe à la piste suivante, et là, cata, c'est ultra compressé, y'a 2 dB de dynamique. Et là, magie logicielle, un traitement passerait pour "retrouver" de la dynamique, en augmentant les pics et diminuant les creux. Je me doute que tout n'est pas aussi simple et qu'il faudrait réfléchir un peu plus pour obtenir un résultat cohérent et agréable, mais vu tout ce qu'on est capable de faire maintenant, je me dis pourquoi pas ? Est-ce que ça aurait un intérêt quelconque ? Et n'est-ce pas déjà pratiqué aussi... ?
En nomade : Hiby R8 > Final Audio A8000/Spiral Ear SE-6 Edge
En sédentaire : Hiby R8 > Aroma A100TB + alim > ZMF Vérité Closed/Hifiman HE-6

Je crois qu'on peut dire que je suis bien là.
Eykxas

Message par Eykxas »

A mon avis ce concept serait faisable avec de l'intelligence artificielle et du deep learning.

Avec nos logiciels "actuels" ça ne serait pas possible. Car dans le spectre audio d'une musique, un creux et un pic n'indique que l'intensité du message sonore à un instant T.

Cela n'indique pas quel(s) instrument(s) est à l'origine du pic (ou du creux) ni comment la musique a été mixée. Du coup en augmentant la différence entre pic et creux il y a de grande chance pour que ça donne n'importe quoi.

Par contre, avec de l'IA, qui serait capable de détecter l'instrument (son type, sa plage fréquentielle), sa position et son intensité relative par rapport aux autres instruments, alors du coup on peut imaginer une sorte "d'upsampling du mixage" et donc de générer de la dynamique. Et tout cela en temps réel.

Il ne reste plus qu'à rapprocher Rob Watts de Google ^^
Avatar de l’utilisateur
MrButchi
== Modérateur ==
Messages : 6514
Inscription : 28 févr. 2014 14:58
Contact :

Message par MrButchi »

Et comment le logiciel il va faire pour savoir quelle fréquence il faut atténuer ?
Sorry, but no can do. Une fois perdue, la dynamique est foutue !
Mon passé, mon présent, mon futur ?
Passé
Lecteurs : iPod V2 - Rio Karma - iBasso DX50 - Sony F887 - ZX1 - Questyle QP1R - iPhone 6S
IEMs : Shure E4c - Shure SE530 PTH - Sleek Audio SA6 - Earsonics SM3v2 - Earsonics SM64 - Sleek Audio SA7 - Custom Art Ei.3 - Custom Art Harmony Pro - Custom Art Ei.XX - Spiral Ears SE5-Ref - Custom Art Harmony 8.2 - Lime Ears Aether
Amp : Headstage Arrow 4G - Fostex HP-P1 - Oppo HA-2 - Headstage Arrow 5TX - Schiit Lyr 2 (Reflektors '74) - Eddie Current Black Widow 2
DAC : Schiit Bifrost Uber Analog / USB Gen 2 - Schiit Gungnir MultiBit

Casque : Bose QC35

Présent
Lecteur : Lotoo Paw 6000 - ES100
IEMs : VE8
Casque : Stax SR007MKII - Focal Utopia - HD800 - Bose QC700
Amp : Eddie Current Aficionado (Kron et Raytheon) et Stax SRM 727 MKII moddé
DAC : Schiit Yggdrasil et RME Adi 2 Pro Anniversary Edition
Transport : MSB Universal Transport Plus


Futur
Avatar de l’utilisateur
alphatak
1 euros par message, Stax me voilà!
1 euros par message, Stax me voilà!
Messages : 9333
Inscription : 13 oct. 2014 13:07
Localisation : Toulouse
Contact :

Message par alphatak »

Il nous a déjà fait le coup en photo, le kiras ! AI et deep learning, c'est le lapin dans le chapeau... ;-/
Système électrostatique : Stax SR-007 mk2.5 & Stax SR-007 mk2 & SR-L700, Hifiman Jade II, Stax SRM-717 & SRM-006TS & SRM-D50, iFi Audio iESL Pro
Ouverts ortho : Abyss AB-1266 Phi, Hifiman HE-6, Kennerton Odin mkII, Audeze LCD-MX4, MrSpeakers Ether Flow
Ouverts électro : Focal Utopia, Audio-Technica ATH-ADX5000, Sennheiser HD800S, Grado GS1000i, Beyerdynamic T1, Kennerton Vali
Fermés : Fostex TH900 mkII, Audeze LCD-XC, MrSpeakers Ether C
Amplis tubes : Auris HA2-SE, Pathos Aurium, Icon Audio HP8 MkII, LittleDot MkVI+, RSA Emmeline II "The raptor ", Feliks Audio Echo mkII, La Figaro 339
Amplis transistors : Audio-gd HE-9, Auralic Taurus mkII, Meier Corda Classic, Nuprime STA-9
DAC+Amp : Soekris dac1541, RME ADI-2 Pro, Focal Arche, Wyred 4 Sound Intimo
DAC : Audio-gd Master 7 NOS, Oppo Sonica DAC, PS Audio NuWave, Cayin iDAC-6
Nomade : Pioneer XDP-300R, Qudelix-5K, ISN Audio H40, AKG N40 & N400, Audeze Sine
Accessoires : Auralic Aries, Mutec MC-3+ Smart Clock USB
Mesures et EQ
Avatar de l’utilisateur
TheDecline01
TN m'a tuer
TN m'a tuer
Messages : 5117
Inscription : 24 janv. 2011 10:46
Localisation : Achères
Contact :

Message par TheDecline01 »

Ah zut, dire que je pensais avoir une idée à 1 milliard d'€...
En nomade : Hiby R8 > Final Audio A8000/Spiral Ear SE-6 Edge
En sédentaire : Hiby R8 > Aroma A100TB + alim > ZMF Vérité Closed/Hifiman HE-6

Je crois qu'on peut dire que je suis bien là.
Avatar de l’utilisateur
alphatak
1 euros par message, Stax me voilà!
1 euros par message, Stax me voilà!
Messages : 9333
Inscription : 13 oct. 2014 13:07
Localisation : Toulouse
Contact :

Message par alphatak »

Ça dépend du cours du lapin... :mrgreen:
Système électrostatique : Stax SR-007 mk2.5 & Stax SR-007 mk2 & SR-L700, Hifiman Jade II, Stax SRM-717 & SRM-006TS & SRM-D50, iFi Audio iESL Pro
Ouverts ortho : Abyss AB-1266 Phi, Hifiman HE-6, Kennerton Odin mkII, Audeze LCD-MX4, MrSpeakers Ether Flow
Ouverts électro : Focal Utopia, Audio-Technica ATH-ADX5000, Sennheiser HD800S, Grado GS1000i, Beyerdynamic T1, Kennerton Vali
Fermés : Fostex TH900 mkII, Audeze LCD-XC, MrSpeakers Ether C
Amplis tubes : Auris HA2-SE, Pathos Aurium, Icon Audio HP8 MkII, LittleDot MkVI+, RSA Emmeline II "The raptor ", Feliks Audio Echo mkII, La Figaro 339
Amplis transistors : Audio-gd HE-9, Auralic Taurus mkII, Meier Corda Classic, Nuprime STA-9
DAC+Amp : Soekris dac1541, RME ADI-2 Pro, Focal Arche, Wyred 4 Sound Intimo
DAC : Audio-gd Master 7 NOS, Oppo Sonica DAC, PS Audio NuWave, Cayin iDAC-6
Nomade : Pioneer XDP-300R, Qudelix-5K, ISN Audio H40, AKG N40 & N400, Audeze Sine
Accessoires : Auralic Aries, Mutec MC-3+ Smart Clock USB
Mesures et EQ
Eykxas

Message par Eykxas »

alphatak a écrit :Il nous a déjà fait le coup en photo, le kiras ! AI et deep learning, c'est le lapin dans le chapeau...  ;-/
Faut se rendre à l'évidence, c'est l'avenir ^^

Je pense que de belles choses vont arriver dans les 10 prochaines années.
Avatar de l’utilisateur
alphatak
1 euros par message, Stax me voilà!
1 euros par message, Stax me voilà!
Messages : 9333
Inscription : 13 oct. 2014 13:07
Localisation : Toulouse
Contact :

Message par alphatak »

C'est la même discussion qu'en photo : tu peux recréer du signal là où il a été détruit, mais en aucun cas tu ne retrouveras l'original avant compression. Ce sera peut-être mieux, peut-être moins bien, mais pas la même chose. C'est ça qu'il faut éviter de faire croire (ou de croire soi-même)... ;-/
Mais oui, de belles choses vont arriver dans les 10 prochaines années, et certaines sont déjà là ! :p
Système électrostatique : Stax SR-007 mk2.5 & Stax SR-007 mk2 & SR-L700, Hifiman Jade II, Stax SRM-717 & SRM-006TS & SRM-D50, iFi Audio iESL Pro
Ouverts ortho : Abyss AB-1266 Phi, Hifiman HE-6, Kennerton Odin mkII, Audeze LCD-MX4, MrSpeakers Ether Flow
Ouverts électro : Focal Utopia, Audio-Technica ATH-ADX5000, Sennheiser HD800S, Grado GS1000i, Beyerdynamic T1, Kennerton Vali
Fermés : Fostex TH900 mkII, Audeze LCD-XC, MrSpeakers Ether C
Amplis tubes : Auris HA2-SE, Pathos Aurium, Icon Audio HP8 MkII, LittleDot MkVI+, RSA Emmeline II "The raptor ", Feliks Audio Echo mkII, La Figaro 339
Amplis transistors : Audio-gd HE-9, Auralic Taurus mkII, Meier Corda Classic, Nuprime STA-9
DAC+Amp : Soekris dac1541, RME ADI-2 Pro, Focal Arche, Wyred 4 Sound Intimo
DAC : Audio-gd Master 7 NOS, Oppo Sonica DAC, PS Audio NuWave, Cayin iDAC-6
Nomade : Pioneer XDP-300R, Qudelix-5K, ISN Audio H40, AKG N40 & N400, Audeze Sine
Accessoires : Auralic Aries, Mutec MC-3+ Smart Clock USB
Mesures et EQ
Avatar de l’utilisateur
MrButchi
== Modérateur ==
Messages : 6514
Inscription : 28 févr. 2014 14:58
Contact :

Message par MrButchi »

@kiras - alpha est scientifique IRL dans un job où, crois-moi, l’IA il y pense.
Moi je suis conseil en PI spécialisé en brevets, et en particulier sur tout ce qui est info. Ca fait deux ans que je bosse tous les jours sur l’IA.
Alors quand on te dit ce qu’on te dit, c’est pas pour te faire chier, c’est parce que ce que tu suggères n’a pas de sens.
Pour reprendre ta suggestion, quand bien même un algo détecterait un instrument particulier, pas moyen de savoir quel était son niveau particulier sur ce morceau là originellement, quelle que soit ta base d’entraînement.
Du coup, comme te dit alpha, au mieux tu auras un truc joli mais différent de manière certaine, au pire du gloubiboulga.
Y a rien de plus désolant que de faire passer de la science pour de la fiction, ou que croire qu’un laconique « vous verrez bien » tient lieu d’argumentation...
Mon passé, mon présent, mon futur ?
Passé
Lecteurs : iPod V2 - Rio Karma - iBasso DX50 - Sony F887 - ZX1 - Questyle QP1R - iPhone 6S
IEMs : Shure E4c - Shure SE530 PTH - Sleek Audio SA6 - Earsonics SM3v2 - Earsonics SM64 - Sleek Audio SA7 - Custom Art Ei.3 - Custom Art Harmony Pro - Custom Art Ei.XX - Spiral Ears SE5-Ref - Custom Art Harmony 8.2 - Lime Ears Aether
Amp : Headstage Arrow 4G - Fostex HP-P1 - Oppo HA-2 - Headstage Arrow 5TX - Schiit Lyr 2 (Reflektors '74) - Eddie Current Black Widow 2
DAC : Schiit Bifrost Uber Analog / USB Gen 2 - Schiit Gungnir MultiBit

Casque : Bose QC35

Présent
Lecteur : Lotoo Paw 6000 - ES100
IEMs : VE8
Casque : Stax SR007MKII - Focal Utopia - HD800 - Bose QC700
Amp : Eddie Current Aficionado (Kron et Raytheon) et Stax SRM 727 MKII moddé
DAC : Schiit Yggdrasil et RME Adi 2 Pro Anniversary Edition
Transport : MSB Universal Transport Plus


Futur
OvO
Suis-je (une) enceinte ?
Suis-je (une) enceinte ?
Messages : 175
Inscription : 05 avr. 2018 15:18

Message par OvO »

Avec un DSP on doit pouvoir reconstruire un peu de dynamique en haut. Typiquement sur les albums de métal giga clippés ça ramènerait de la vie.

Par contre pour les albums où il y a besoin de ramener du détail le deep learning ne changera pas grand chose. Un détail masqué par du bruit ça ne se voit pas ça ne s’invente pas même avec la magie noir du deep learning neuronal disruptif.
Waveio/Meier DACCORD/ModWright SWE 9.0SE/Flying Mole & Audeze LCD2 - SRM 323II & Sennheiser HE60
Avatar de l’utilisateur
Murl0c
Je me suis greffé des intras
Je me suis greffé des intras
Messages : 1708
Inscription : 29 sept. 2015 14:02

Message par Murl0c »

C'est un sujet intéressant.
Dans le même genre, j'ai découvert récemment qu'un service proposait le fait de restaurer des fichiers lossy en fichiers lossless. Comme l'ont précisé alpha & Butchi, on ne retrouvera pas le fichier original mais c'est la première fois que je vois cela...
J'ai passé des heures sur l'internet franco/anglophone pour comprendre comment ils faisaient, en vain. Si un ingé son, ou quelqu'un de calé en analyse spectral me lit et qu'il a une idée, je peux envoyer tous les éléments que j'ai en ma disposition par PM.
Le résultat, à l'oeil, est stupéfiant, tout simplement impossible de repérer le faux fichier lossless, même si la source était un vulgaire mp3 128 : pas de cutshelf, pas de blocs en zoomant, rien... J'ai longuement tenté de reproduire ce résultat via des exciter, mais le résultat n'est pas à la hauteur.
Je pense qu'ils utilisent un script permettant dans un premier temps de scanner les fréquences, puis de les étendre jusqu'à 22khz.
Par contre, en écoutant, on se rend immédiatement compte que cette restauration n'est que de la poudre aux yeux, oui le son change légèrement, mais rien à voir avec un fichier lossless original, évidemment.


En haut la source (320), en bas le fake flac.
Image
zoomed
Image
Live as if you were to die tomorrow. Learn as if you were to live forever.

Audio Engineering Society
HydrogenAudio
AudioScienceReview
diyAudio
Eykxas

Message par Eykxas »

@Alphatak et MrButchi

Je n'ai pas dit que le but était de recréer "l'original". Ça restera une interprétation selon l'algo.

Mais c'est exactement ce qu'on fait en photo par exemple. le logiciel recréé des conditions similaires à un couple objectifs / capteur, mais ne pourra jamais "créer" ce qui n'existe pas.

C'est juste de la manipulation de l'existant. Et c'est ce que je suggère dans mon post initial. Une sorte de "super DSP". Cela restera de la trituration du signal original. Mais est-ce forcément une mauvaise chose ? Je ne pense pas.

D'ailleurs le travail que je suggère faite par l'IA on pourrait le faire nous même actuellement, à la main. Ça prendrait juste énormément de temps. C'est comme coloriser un film en noir et blanc. On ne connaîtra jamais les couleurs originales, mais rien ne nous empêche de faire quelque chose de crédible.
asters
Mon chien s'appelle LossLess
Mon chien s'appelle LossLess
Messages : 3085
Inscription : 20 mars 2011 11:02

Message par asters »

Un modèle ne pourra pas prédire sans faille la dynamique perdue mais on doit arriver à des choses correctes avec TensorFlow (Deep Neural Network) et le module de Signal Processing si les données d'apprentissage sont bonnes ( ce qui doit être gérable : fichier original / fichier compressé).
Bon faudra juste avoir/payer pour du GPU (TPU) pour entraîner tout ce beau monde :D
DAP Hibty R6/ PAW S1 / iFi GoBlu
Intras Oriolus Szalayi / Sony XBA3-NP / 64 Audio DUO
Caque HifiMan Ananda
OvO
Suis-je (une) enceinte ?
Suis-je (une) enceinte ?
Messages : 175
Inscription : 05 avr. 2018 15:18

Message par OvO »

@murloc : faudrait faire des essais de stabilité. Conversion losseless vers lossy, reconstruction ssy -> less, plusieurs fois, et voir comment évolue la version losseless après quelques aller-retour niveau distance de signal. Ça donnerait une idée de la qualité réelle de la construction
Waveio/Meier DACCORD/ModWright SWE 9.0SE/Flying Mole & Audeze LCD2 - SRM 323II & Sennheiser HE60
Kooka

Message par Kooka »

kirasd69 a écrit : C'est juste de la manipulation de l'existant. Et c'est ce que je suggère dans mon post initial. Une sorte de "super DSP". Cela restera de la trituration du signal original. Mais est-ce forcément une mauvaise chose ? Je ne pense pas.
Les DSP actuels flattent l'oreille. Le cerveau humain aiment ce qui flatte l'oreille. Les gens aiment déjà les DSP car le rendu est agréable, de toute façon, on le voit au quotidien sur le forum avec les appareils ayant un DSP bien conçu. Donc oui, c'est possible ce que tu dis.
Répondre

Revenir à « Discussions et Débats Audiophiles »