Dissertação
Text Mining Methods for Mapping Opinions from Georeferenced Documents EVALUATED
Com a crescente disponibilidade de grandes volumes de informação textual na Internet, técnicas de text mining têm vindo a ganhar um interesse crescente. Um dos problemas específicos de text mining diz respeito à detecção de expressões textuais que se referem a opiniões sobre determinados temas e serviços. Um segundo problema de text mining, que tem vindo a ganhar atenção por parte da comunidade científica, é a identificação da localização geográfica que melhor se relaciona com o conteúdo de documentos. Na minha tese de mestrado, eu comparei empiricamente técnicas automatizadas, baseadas em modelos de linguagem, para a atribuição de documentos a classes de opinião e às coordenadas geoespaciais de latitude e longitude que melhor resumem os seus conteúdos. Usando essa informação, analisei a possibilidade de construção de mapas temáticos que retratam a incidência de determinadas classes de opiniões, extraídos de documentos, em diferentes áreas geográficas. O melhor método desempenho para a geocodificação de documentos textuais obteve um erro de previsão médio de 265 quilómetros. No que diz respeito ao mining de opiniões, a análise de opiniões foi feita numa escala binária e um esquema de escala de cinco pontos, onde a escala binária obteve uma exatidão de 0,80, enquanto que a escala de cinco pontos obteve uma exatidão de 0,50. Utilizou-se uma técnica conhecida como estimativa da densidade Kernel para o desenvolvimento de mapas temáticos, e uma análise empírica mostrou que os mapas obtidos através de extracção automática de facto correspondem a uma representação precisa para a distribuição geográfica de opiniões.
novembro 8, 2012, 13:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Bruno Emanuel Da Graça Martins
Departamento de Engenharia Informática (DEI)
Professor Auxiliar