Dissertação

Extracção de Referências Bibliográficas: - - EVALUATED

O aumento da diversidade de documentos textuais em formato digital aumenta a dificuldade das tarefas automáticas de gestão e recuperação de informação. Uma das causas desta situação prende-se com a falta de metadados descritivos estruturados e normalizados para esses documentos. Por vezes pode mesmo ser necessário ler grande parte do documento para se responder a questões fundamentais como: ?Qual o assunto do documento??, ?Quem escreveu o documento??, ?Quando e onde foi publicado??, ?Quais os documentos referenciados por ele??. Não é portanto de admirar que existam actualmente tantos esforços para manter a informação bibliográfica actualizada em repositórios e bases de dados que representam domínios, instituições, organizações ou apenas pessoas individuais. Assiste-se ainda a uma proliferação de motores de pesquisa bibliográficos que visam facilitar o acesso a uma colecção de referências bibliográficas. Esta é a motivação deste projecto de dissertação, que tem como objectivo propor e avaliar técnicas para enriquecer de forma automática os metadados associados a documentos textuais em formato digital. Para tal, pretende-se recorrer a técnicas de extracção de informação de forma a reconhecer no texto, de forma automática, referências bibliográficas estruturadas, tais como os atributos de nomes de pessoas, referências temporais, etc. A dificuldade desta tarefa vem do facto de os documentos estarem escritos em língua natural, onde a informação que se procura não está estruturada.
Extracção de Informação; Metadados; Referências Bibliográficas

novembro 5, 2010, 8:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

CO-ORIENTADOR

José Luís Brinquete Borbinha

Departamento de Engenharia Informática (DEI)

Professor Auxiliar