Voltar à Página Principal
Jornal Online da UBI, da Covilhã, da Região e do Resto
Director: António Fidalgo Directores-adjuntos: Anabela Gradim e João Canavilhas
 
Esta tese de mestrado aborda um campo informático ainda pouco explorado

Os segredos de Alexia

Uma dissertação de mestrado na área da informática, apresentada na UBI, avança com algumas soluções para a procura mais detalhada e rápida de informação na Internet. As conclusões deste estudo são pioneiras em Portugal.

> Eduardo Alves

A procura de uma qualquer palavra nos motores de busca da Internet resulta em milhões de páginas que contêm o termo e que “iludem” o utilizador. O excesso desmedido de informação que está presente na World Wide Web faz com que na maior parte das vezes, não se tenha acesso ao que verdadeiramente se procura. Muito menos, que o utilizador leia e percorra, uma a uma, as milhares de páginas que o motor de busca lhe aponta, de cada vez que faz uma pesquisa na Internet.
Foi com o objectivo de solucionar este tipo de problema que Cláudia Sofia Oliveira Santos se lançou na aventura de uma tese de mestrado que apontasse algumas soluções. A autora do estudo agora apresentado na UBI começa por dizer que “uma simples procura pode retornar milhões de documentos como potencialmente relevantes, que o utilizador terá que consultar de forma a efectivamente julgar a sua relevância. Esta explosão de informação resultou num problema bem conhecido de sobrecarga de informação”. Para lidar com este tipo de problema “a tecnologia da sumarização automática de textos torna-se indispensável”.
Cláudia Santos explica que “a sumarização é uma das áreas mais bem sucedidas do Processamento de Linguagem Natural (PLN) e o objectivo da sumarização automática é considerando um texto fonte, extrai-se dele o conteúdo mais relevante, o qual é apresentado de uma forma condensada de acordo com as necessidades do utilizador ou da aplicação”. Nesta tese, intitulada “ALEXIA – Acquisition of Lexical Chains for Text Summarization”, em vez de se usar o recurso linguístico padrão WordNet, “o algoritmo identifica relacionamentos lexicais coesivos entre palavras baseando-se na evidência do corpus, utilizando uma base de conhecimento lexico-semântica automaticamente construída”, adianta a autora do trabalho. Os sistemas de aquisição de Cadeias Lexicais anteriormente realizados baseavam-se, sobretudo, no recurso linguístico WordNet “e eram propostos só para textos em Inglês”, mas “este sistema é um sistema independente da linguagem, ou seja, pode-se criar cadeias lexicais em textos de qualquer idioma”, conclui. Esta tese de mestrado foi avaliada por um júri composto por Carlos Manuel Pereira Cabrita, professor catedrático da Universidade da Beira Interior, Gael Harry Dias, professor auxiliar da Universidade da Beira Interior e Guillaume Cleuziou, professor auxiliar de L’Université d’Orleans, tendo obtido a classificação final de Muito Bom.


Esta tese de mestrado aborda um campo informático ainda pouco explorado
Esta tese de mestrado aborda um campo informático ainda pouco explorado


Data de publicação: 2006-10-24 00:03:26
Voltar à Página principal

2006 © Labcom - Laboratório de comunicação e conteúdos online, UBI - Universidade da Beira Interior