Jaký typ číslo se používá pro MP3 datových rámců?

hlasů
0

Píši univerzální analyzátor knihovnu pro různé formáty binárních Rust jako součást osobního projektu. Začal jsem zkoumat strukturu souborů MP3 souborů. Jak jsem pochopil, konstrukci pro MP3 soubor se skládá z hlavičky a datových rámců. Každý snímek záhlaví je vždy uveden meta informace o snímku řízení dat. Zde je diagram a seznam povolených hodnot pro záhlaví MP3 rámců, které jsem odkazování.

Chápu formátu záhlaví MP3. Můj zmatek, nebo nedostatek informací, obklopuje MP3 datových rámců. Nedaří se mi najít zdroj, který určuje, jaké číslo typ vzorky jsou kódovány podle údajů rámové části souboru MP3 na. Jsou 8 bitů, 16 bitů, 32 bitů, která byla podepsána, nesignováno, atd?

To nejlepší, co může myslet je, aby použít kombinaci frekvence vzorkovací frekvence a přenosová rychlost vypočítat, co každá velikost vzorku měl. To však není určit, zda každý vzorek je podepsán nebo celé číslo bez znaménka.

Nesnažím dekódovat tyto soubory, Jen se snažím, aby je analyzovat. Měl jsem překvapivě těžké najít tuto informaci. Jakékoliv informace nebo užitečné někdo nabídka plechovka by se moc líbí.

Položena 14/01/2020 v 00:00
zdroj uživatelem
V jiných jazycích...                            


1 odpovědí

hlasů
2

I když to není v souvislosti s mp3 sama o sobě, že by mohly být užitečné informace v Will C. Pirkle knihy, Projektování zvukové efekty pluginů v jazyce C ++ .

Ten pojednává o způsobu, jakým WAV audio formát ukládají své informace. Využívá podepsal celá čísla, počínaje od -32,768 do 32.767. To představuje řadu 2 ^ 16 v bipolární formátu, kde exponent odpovídá bitové hloubky (nejčastěji 16 nebo 24).

Další důležitou věc, kterou si uvědomit, je, že zatímco fáze inverze je běžná věc v mnoha audio aplikace, neexistuje odpovídající číslo pro převrácením -32,768. Kompenzovat, to je společné pro léčbu hodnotu -32,768 jako -32,767. To záleží jen když používáte-li hodnotu 0 ve svém zpracování, což je nejčastěji případ. V opačném případě by bylo možné rozšířit horní hranici 32,768.

Dělá stát, že to je více obyčejné pro audio aplikace pro zpracování se vypořádat s plovoucí desetinnou čárkou a to buď mezi 0.0f a 1.0f nebo -1.0f a 1.0f. Důvodem je, že kvůli sčítání a násobení jsou běžné operace v DSP, vyhneme přetékání tento rozsah, pokud budeme používat tyto plovoucí body. V bipolární formátu integer, je to příliš snadné najít dvě čísla, které vedou k výrobku nebo součtu mimo toto rozmezí. V rozmezí -1.0f až 1.0f, bude jakékoliv dvě čísla vždy mít za následek výrobek, který je stále ještě v tomto rozsahu. Bohužel, přídavek stále vyžaduje opatrnost, ale eh ...

Omlouvám se nemám více informací o .mp3s konkrétně, ale snad by to mohlo být ještě bystrý.

Hodně štěstí!

Odpovězeno 14/01/2020 v 20:02
zdroj uživatelem

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more