|
| | |
|
|
|
Art.PT
From Web 2.0 Wiki, Proposals::Art PT |
Art.PT - Wiki and Open Collection of Portuguese Artists's Portfolio
Enquadramento: Trabalho enquadrado na área de Plataformas Wikis, CMS (content management systems), Linked Data, Web Mashups, Information Extraction.
Objectivos: Pretende-se que o aluno tenha a oportunidade de investigar a área de linked data, extracção automática de informação na Internet, publicação aberta (ver Linked Data) e o seu impacto na gestão de conhecimento de comunidades online. Pretende-se que o aluno conceba e implemente um sistema (crawler) que permita a extracção automática de informação (através de interfaces do tipo Feed RSS, REST ou Web Services) sobre artistas a partir de diferentes fontes/sites web (e.g., wikipedia.pt, fineartamerica.com, portal-earte.com, artmajeur.com) com vista a produzir o seu respectivo Portfolio. Por outro lado, deverá ser produzido um sistema wiki, com uma base de dados aberta, publicada de acordo com os princípios subjacentes à área de Linked Data.
Descrição: O aluno deverá:
- Identificar os modelos e técnicas de extracção de informação na internet.
- Analisar e avaliar as ferramentas e frameworks disponíveis para extracção de informação na internet (e.g., Robomaker, Lixto, BREx, Web-Harvest).
- Propor uma solução adequada para extracção de informação sobre artistas e respectivas obras e eventos.
- Testar e avaliar a eficácia e eficiência da solução proposta em situações controladas e tentativamente próximas da realidade (a definir).
Resultado esperado: Pretende-se neste trabalho:
- Defina um modelo de referência para análise das ferramentas e frameworks disponíveis para extracção de informação na internet;
- Aplique esse modelo na análise e avaliação das tecnologias existentes;
- Conceba e implemente o sistema/crawler "Art.PT"
- Avalie os resultados com base em cenários controlados.
|
|
| | |
| | |
| | | |