Новый формат звуковых файлов TSAC обещает более эффективное сжатие аудио без потери качества

Формат полагается на алгоритмы машинного обучения и может составить конкуренцию MP3, AAC и OGG Vorbis.

TSAC новый формат звуковых файлов

Математик Фабрис Беллар создал новый звуковой формат TSAC. По словам французского учёного, он ориентирован на потоковую передачу аудиосигнала с очень низким битрейтом при минимальных потерях в качестве.

Фабрис Беллар является одним из создателей технологий и наборов библиотек QEMU, FFmpeg, BPG, QuickJS, TinyGL и TinyCC. Часть наработок, использовавшихся в предыдущих проектах, стали основой нового формата кодирования аудиофайлов TSAC, который сам автор называет технологией компрессии аудио с очень низким битрейтом (англ. Very Low Bitrate Audio Compression).

В качестве основы формата был взят аудиокодек Descript, доработанный для использования в стереорежиме и дополненный алгоритмами машинного обучения. Последние позволили получить «очень высокую степень сжатия и реализовать реконструкцию утерянных нюансов звучания с учётом восприятия звука человеком». По словам Беллара, TSAC отличается значительно более низкими показателями битрейта, но большей эффективностью в сравнении с MP3 и другими популярными форматами.

TSAC поддерживает кодирование аудиосигнала с битрейтом от 5,5 Кбит/с для записей в моно и от 7,5 Кбит/с — для стерео. Судя по приведённым примерам, настолько низкая ширина потока звучит близко к показателям в районе 96 Кбит/с для формата MP3. Алгоритмы искусственного интеллекта дополнительно обрабатывают конвертируемый поток, улучшая его качество, благодаря чему файлы в формате TSAC с низким битрейтом воспринимаются как более качественные цифровые записи.

Беллар отмечает, что кодировщик TSAC полагается на ресурсы видеокарты и поддерживает графические ускорители NVIDIA на архитектурах Ampere, ADA и Hopper — RTX 3090, RTX 4090, RTX A6000, A100 и H100. При этом кодировку можно выполнять и только с помощью центрального процессора компьютера, однако в таком случае обработка файлов длится значительно дольше. Для работы кодировщика также требуется около 200 МБ оперативной памяти.

По мнению математика, TSAC способен конкурировать с MP3, AAC, OGG Vorbis и другими популярными форматами. Разработка Беллара подходит не только для передачи голоса, но и для стриминга музыки, что, вероятно, может заинтересовать стриминговые сервисы, стремящиеся сократить затраты на инфраструктуру хранения информации.

Ознакомиться с описанием формата и примерами сжатия аудио в TSAC можно на официальном сайте проекта. Там же выложены библиотеки кодировщика для самостоятельной установки и тестирования кодека.

Exit mobile version