Dissertação

DISSERTATION: Entity Linking over Short Texts EVALUATED

Dada uma entidade (por exemplo, uma localização, uma marca, um clube de futebol, entre outras) mencionada num texto, o objectivo da ligação de entidades é associar a referida entidade à entrada correspondente numa base de conhecimento existente. Este trabalho foca-se em aplicar ligação de entidades em tweets. Neste tipo de texto curto, o seu tamanho (máximo de 140 caracteres) leva à existência de desafios adicionais, nomeadamente o facto destes sofrerem de falta de contexto, ou o facto de usarem linguagem não regular. O trabalho desenvolvido resultou num protótipo, capaz de reconhecer e ligar entidades em textos curtos à página da Wikipedia correspondente. O sistema foi construido usando software previamente desenvolvido, adaptado para ser executado especificamente para texto do Twitter. As experiências feitas neste trabalho provam que, treinando um model de reconhecimento de entidades com dados do Twitter e realizando alterações no texto dos tweets, melhora as performances de ligação de entidades neste tipo de textos.
Processamento de Linguagem Natural, Aprendizagem Automática, Extração de Informação, Reconhecimento de Entidades, Ligação de Entidades

novembro 14, 2016, 9:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Pável Pereira Calado

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar