Uma grande quantidade de informação áudio-visual está disponível na forma digital, em vários lugares no mundo e muitas pessoas estão querendo usá-las. Antes de ser usada, a informação precisa ser localizada. Atualmente existem soluções que permitem a busca de informação textual. Muitas máquinas de busca são baseadas em texto e estão disponíveis na World Wide Web, e estão na maioria dos sites visitados indicando uma grande demanda. Em geral, não é possivel buscar eficientemente na Web um vídeo, informando somente a imagem da motocicleta usada pelo Exterminador do Futuro. Em casos específicos, soluções existem. As Bases de Dados Multimídias no comércio de hoje permitem a busca de imagens usando características como cor, textura e informação sobre a forma dos objetos em uma determinada figura.
Objetivos
Em 1996, MPEG iniciou um novo trabalho para fornecer uma solução para questões descritas acima. O novo membro da família MPEG chamado de Interface de Descrição do Contéudo Multimídia [4], extenderá as limitadas capacidades das soluções proprietárias na identificação do conteúdo que existem hoje, notavelmente pela inclusão de mais tipos de dados. Em outras palavras: MPEG-7 especificará um conjunto padrão de descritores que podem ser usados para descrever vários tipos de informações multimídias. MPEG-7 padronizará modos de definir outros descritores bem como as estruturas (Esquemas de Descrição) para descritores e seus relacionamentos. Esta descrição estará associada com o conteúdo, para permitir uma busca rápida e eficiente do material de interesse do usuário.
Uma funcionalidade do MPEG-7 é fornecer referências à objetos de outros padrões (PCM, MPEG-1/2/4, ...). Por exemplo, talvez um descritor usado no MPEG-4 é útil no contexto do MPEG-7. Os descritores do MPEG-4, entretanto não dependem nos modos que o conteúdo descrito é codificado ou armazenado. É possível ligar uma descrição MPEG-7 a um filme ou uma imagem que está imprimida em papel.
Ainda que a descrição MPEG-7 não dependa representação codificada do material, o padrão de certo modo está fundamentado no MPEG-4, na qual fornece o significado para codificar o material áudio-visual como objetos tendo certas relações no tempo (sincronização) e espaço. Usando a codificação MPEG-4, será possivel ligar descrições para elementos (objetos) com a cena, tal como objetos audio-visuais. MPEG-7 permitirá diferentes granularidades na sua descrição, oferecendo a possibilidade de ter diferentes níveis de discriminação.
Por isso as características descritivas deve ter um significado no contexto da aplicação, elas serão diferentes para diferentes domínios do usuário e diferentes aplicações.
Isto implica que o mesmo material pode ser descrito usando diferentes tipos de características, ligadas na área da aplicação. Para tomar um exemplo do material visual: um nível de abstração baixo seria uma descrição da forma, tamanho ,cor , movimento e posição. E para o áudio: tecla,tempo, mudanças do tempo, posição no espaço do som. Uma abstração de mais alto nivel daria uma informação semântica: Está é uma cena com um cachorro latindo na esquerda e uma bola azul rolando para a direita, com o som dos carros passando no fundo. Todas estas descrições seriam codificadas de uma maneira eficiente para pesquisa dos usuários.
O nível de abstração está relacionado com a maneira em que as características podem ser extraídas: características de baixo nível podem ser extraídas de forma automática, enquanto as de alto nível necessitam mais da interação humana.
Escopo do Padrão
MPEG-7 atenderá as aplicações que podem estar armazenadas ou fluindo (na rede) e que podem operar em ambientes de tempo real ou não. Um ambiente de tempo real significa que a informação está associada com o conteúdo enquanto está sendo capturada.
O esquema abaixo altamente abstrato,
mostra uma possível cadeia de processamento do MPEG-7, incluido aqui o escopo
do padrão (descrição).
EXTRAÇÃO DAS CARACTERÍSTICAS ====> DESCRIÇÃO DO PADRÃO ====>
MÁQUINA DE BUSCA
Esta cadeia inclue características de extração (análise), a própria descrição, e a máquina de busca (aplicação). Para explorar as possibilidades da descrição MPEG-7, a extração automática dos descritores será extremamente útil. Esta claro que a extração automática não é sempre possivel. Como notado acima, um nível de abstração mais alto, é mais difícil de extrair automaticamente, e ferramentas de extração interativa serão de bom uso. Entretanto algoritmos de extração automática ou semi-automática estão fora do escopo do padrão, bem como as máquinas de pesquisa.
Aplicações
Existem muitas aplicações e domínios de aplicações que serão beneficiadas com o padrão MPEG-7. Abaixo temos alguns exemplos [6]:
A maneira que a informação MPEG-7 será usado para responder as
consultas esta fora do escopo do padrão. Em princípio, algum tipo de
material áudio-visual será recuperado pelo significado de algum tipo
de consulta. Isto significa, por exemplo, que o material de vídeo sera
consultado usando vídeo, música, voz, etc. Isto é para a
máquina de busca combinar o dado da consulta com a decrição
áudio-visual MPEG-7. Abaixo temos alguns exemplos de consultas [5]:
1. Músicas - tocar uma notas no teclado e ter como retorno uma lista de
partes musicais, relacionadas com as notas;
2. Gráficos - desenhar algumas linhas na tela e ter o retorno de um
conjunto de imagens contendo gr'aficos ou desenhos simlares;
3. Imagens - definir objetos, incluindo cores e texturas e ter como respostas
imagens que contenham os objetos que foram definidos;
4. Cenário - descrever ações e buscar uma lista de cenários onde
ações similares acontecem;
5. Voz - usando um extrator da voz de Pavarotti, e ter como resposta uma lista
de gravações de Pavarotti.
Método e Plano de Trabalho
O metodo de desenvolvimento é comparável a padrões MPEG
anteriores. Após definir os requisitos (este proçesso já
iniciou), uma Chamada para proposta será lançada. A chamada
solicitará por tecnologias relevantes ajustando os requisitos, e após uma
avaliação da tecnologia que foi recebida, uma escolha sera feita e o
desenvolvimento continuara com mais submissões. Durante o desenvolvimento
do padrão, chamadas adicionais pode ser lançadas, quando a
tecnologia não não os requisitos [7].
Como este novo trabalho MPEG necessitará de tecnologia
disponível em áreas ainda não suficientemente representadas na
comunidade MPEG, seria necessário buscar a colaboração de novos
especialistas em áreas importantes como bando de dados e inteligência
artificial.
O plano preliminar de trabalho MPEG-7 é o seguinte:
- Chamada para Propostas - Novembro 1998;
- Working draft - Julho 1999;
- Commit Draft - Março 2000;
- Draft International Standard - Julho 2000;
- International Standard - Novembro 2000.