Proposals 
Navigation Title

Categories
Search Title
Art.PT
From Web 2.0 Wiki, Proposals::Art PT

Art.PT - Wiki and Open Collection of Portuguese Artists's Portfolio



Enquadramento: Trabalho enquadrado na área de Plataformas Wikis, CMS (content management systems), Linked Data, Web Mashups, Information Extraction.

Objectivos:
Pretende-se que o aluno tenha a oportunidade de investigar a área de linked data, extracção automática de informação na Internet, publicação aberta (ver Linked Data) e o seu impacto na  gestão de conhecimento de comunidades online. Pretende-se que o aluno conceba e implemente um sistema (crawler) que permita a extracção automática de informação (através de interfaces do tipo Feed  RSS, REST ou Web Services) sobre artistas a partir de diferentes fontes/sites web (e.g., wikipedia.pt, fineartamerica.com, portal-earte.com, artmajeur.com) com vista a produzir o seu respectivo Portfolio.
Por outro lado, deverá ser produzido um sistema wiki, com uma base de dados aberta, publicada de acordo com os princípios subjacentes à área de Linked Data.

Descrição:
O aluno deverá:

  1. Identificar os modelos e técnicas de extracção de informação na internet.

  2. Analisar e avaliar as ferramentas e frameworks disponíveis para extracção de informação na internet (e.g., Robomaker, Lixto, BREx, Web-Harvest).

  3. Propor uma solução adequada para extracção de informação sobre artistas e respectivas obras e eventos.

  4. Testar e avaliar a eficácia e eficiência da solução proposta em situações controladas e tentativamente próximas da realidade (a definir).




Resultado esperado: Pretende-se neste trabalho:

  1. Defina um modelo de referência para análise das ferramentas e frameworks disponíveis para extracção de informação na internet;

  2. Aplique esse modelo na análise e avaliação das tecnologias existentes;

  3. Conceba e implemente o sistema/crawler "Art.PT"

  4. Avalie os resultados com base em cenários controlados.