As funcionalidades fornecida pelo MPEG-4 são classificadas no modelo
ilustrado na Figura 6.[1]
Figura 6 - Estrutura do padrão de codificação de vídeo
MPEG-4
O núcleo VLBV (Very Low Bitrate Video) fornece algoritmos e
ferramentas para aplicaçõ]es que operam a taxas de 5 a 64 Kbps. E
suporta sequências de imagens com baixa resolução espacial (por
exemplo 174x144 pixels) e baixas taxas de quadros (15 quadros/s). As
funcionalidades básicas incluem vídeo de tamanho retangular, e baixa
complexidade para aplicação multimídia.
O núcleo HBV (High Bitrate Video) possue as mesmas funcionalidades
com resolução e taxas mais altas.
O MPEG-4 considera uma cena composta de Objetos de Vídeo - OV. Os OV tem
propriedades como forma, movimento, textura, etc. Isto corresponde a
entidades no fluxo de bits que o usuário pode manipular e acessar. Um
Plano de Objeto de Vídeo (Video Object Plane - VOP) é uma ocorrencia
de um OV em dado instante de tempo. Cada quadro consiste de vários VOP.
Umas cena que contém somente um VOP, corresponde aos padrões correntes
tais como MPEG-1/2. Cada VOP tem sua própria resolução espacial e
temporal.
Uma cena é dividida em objetos, possuindo uma organização
hierárquica. A estrutura de uma cena (figura 7) está ilustrada na figura 8 e a
cena na figura 9
Figura 7 - Uma cena
Figura 8 - Estrutura Lógica da cena
Figura 9 - Estrutura de codificador e decodificador do vídeo
Uma informação adicional é enviada com os VOPs a fim de informar
ao receptor como compor a cena. A codificação do VOP é composta
de codificação da forma e codificação da textura e
compensação de movimento. Os VOPs são divididos em macro-blocos
de 16 x 16 bits, similar aos tipos de quadros em MPEG-1, como VOP-I, VOP-B,
VOP-P, ilustrado na figura 10.[3]
Figura 10 - Codificação do VOP
Como em MPEG-1 e 2, os codificadores não são padronizados em MPEG-4.