UFRGS

SACCA - Sistema Automático de Catalogação de Conteúdo Audiovisual

Atualmente um acervo de vídeos começa a ser produzido na UFRGS e disponibilizados pela TV Escola do MEC. Vídeos com conferências, aulas, experimentos, demonstração de procedimentos, visitas em campo, entre outros, estão proliferando, mas ficam muitas vezes sem serem usados pelo desconhecimento de seu conteúdo pela potencial população de usuários, os professores. A utilização de vídeos educacionais no processo de ensino e aprendizagem ganhou importantes recursos com o surgimento de padrões, como o MPEG-7, que auxiliam descrevê-los de forma padronizada, possibilitando a busca e seleção de vídeos ou partes dele. A utilização das descrições MPEG-7, escritas em XML e integradas a um repositório de materiais audiovisuais, possibilitarão aos professores de forma simples e rápida, localizar vídeos educacionais adequados para o apoio em sala de aula. Adicionalmente servirá como ferramenta para que o aluno navegue, de forma hipertextual, nos diversos vídeos armazenados neste repositório.

Os sistemas de cadastramento existentes, tal como o do projeto CESTA para objetos de aprendizagem, ou o ALEPH, usado na biblioteca da UFRGS, usualmente se limitam a catalogar dados inerentes aos metadados. Perde-se nestas alternativas a possibilidade de indexação full-text que as máquinas de busca como Altavista e Google popularizaram e que são tão úteis e necessárias.

No âmbito da Internet2 já foi iniciado um experimento (VALA) com catalogação automática full content em que o áudio do vídeo é analisado e palavras-chaves são identificadas e localizadas no tempo (em momento são faladas). O resultado desse projeto possibilita ao aluno digitar uma ou mais palavras chaves e receber uma coleção de URLs que apontam para vídeos armazenados no repositório (incluindo pontos específicos do vídeo onde a palavra é dita). Todavia , para a catalogação, no projeto VALA é utilizado o software comercial VIRAGE, o qual funciona somente para a língua inglesa.

No presente projeto, teve como objetivo alcançar um resultado similar, entretanto utilizando-se tecnologia de software livre. Foi projetado e desenvolvido para auxiliar o processo de catalogação full content o sistema SACCA - Sistema Automático de Catalogação de Conteúdo Audiovisual . Inicialmente esse sistema opera de forma semi-automática, sendo que um usuário realiza a análise do vídeo e a definição das palavras-chaves que constituirão a catalogação. O processo automático não foi possível de ser realizado devido a não existência no momento de softwares de reconhecimento de áudio apropriado para a língua portuguesa falado no Brasil.

Foi usado um software de domínio público que opera com os tipos padrão de vídeo (MPEG), identifica e separa cenas. O IBM Annotation Tool pode ser utilizado para descrever arquivo de vídeo gravados no padrão MPEG (1 e 2) e requer também um arquivo de segmentação, no qual a seqüência de vídeo é segmentada em pequenas unidades, chamadas de cenas. Este arquivo de segmentação pode ser carregado de outras fontes, como o "IBM CueVideo Shot Detection Tool Kit" ou segmentado automaticamente com a detecção de tomadas. O SACCA realiza uma interface com esse software e permiti ao usuário catalogar a digitação das palavras agregando de forma semi-automática o segmento do vídeo em que as mesmas foram citadas.

As informações resultantes são armazenadas em um banco de dados invertido, com todas a palavras chave catalogadas e ponteiros para os registros do projeto CESTA (Coletânea de Entidades de Suporte ao uso de Tecnologia na Aprendizagem) onde os objetos de aprendizagem tipo vídeo também são catalogados e no qual estão as informações referentes aos demais metadados de catalogação. O sistema CESTA foi modificado de modo a permitir a interoperação com o sistema SACCA. No banco de dados projetado e implementado no âmbito do projeto SACCA foram também incluídos os ponteiros para os arquivos XML MPG-7 inerentes a cada vídeo catalogado no sistema.

Um módulo de exibição foi integrado a estes dois sistemas, com vistas a permitir a exibição dos vídeos, a partir de momentos referenciado por um link (uma URL associada a um instante em que uma dada palavra-chave é falada). Este módulo apresente suporte para os principais formatos de codificação de vídeo e navegadores.