Nowy kodek audio zapewnia 10-cio krotnie lepszą kompresję w porównaniu do plików w fomacie mp3.
W zeszłym tygodniu Meta ogłosiła opartą na sztucznej inteligencji metodę kompresji dźwięku o nazwie „EnCodec”, która podobno może skompresować dźwięk 10 razy mniejszy niż format mp3 przy 64 kb/s bez utraty jakości. Ta metoda może również znacznie poprawić jakość rozmów na połączeniach o niskiej przepustowości, stwierdziła firma. Firma opisuje EnCodec jako system trójstopniowy. Najpierw nieskompresowane dane są konwertowane do specjalnego formatu o niższej przepływności. Następnie algorytm kompresuje otrzymany format do wymaganego rozmiaru zachowując najważniejsze informacje, które później zostaną użyte do przywrócenia oryginalnego sygnału. I wreszcie, kodek konwertuje skompresowane dane z powrotem na dźwięk w czasie rzeczywistym za pomocą sieci neuronowej.
Warto zauważyć że używanie sieci neuronowej do kompresji i dekompresji dźwięku nie jest niczym nowym, szczególnie w przypadku kompresji mowy, ale naukowcy Meta twierdzą że są pierwszą grupą która zastosowała tę technologię do dźwięku stereofonicznego 48 kHz (nieco lepszej niż częstotliwość próbkowania CD 44,1 kHz ), co jest typowe dla plików muzycznych rozpowszechnianych w Internecie. Jeśli chodzi o aplikacje, Meta twierdzi, że ta oparta na sztucznej inteligencji „hiperkompresja dźwięku” może obsługiwać „szybsze połączenia o lepszej jakości” w złych warunkach sieciowych.
36622994-c546-43cc-89f7-509cde5a6456