Visualização de Dados TP1 - Prog Archives - DCC/UFMG
Nessa opção disponibilizamos os dados do site Prog Archives. Essa é uma comunidade que reúne álbuns e artistas do gênero musical Rock Progressivo, além de notas e resenhas contribuídas por usuários.
Dataset
Os dados disponibilizados representam os álbuns mais bem avaliados para os anos de 1945 a 2014 (limite de 100 por ano) e informações dos artistas. As primeiras linhas da tabela de álbuns:
id | ratings | rating | title | qwr | year | genre | artist_id |
---|---|---|---|---|---|---|---|
2 | 2492 | 4.61 | Foxtrot | 4.57 | 1972 | Symphonic Prog | 1 |
3 | 2155 | 4.42 | Nursery Crime | 4.38 | 1971 | Symphonic Prog | 1 |
5 | 1756 | 3.34 | A Trick of the Tail | 4.24 | 1976 | Symphonic Prog | 1 |
7 | 52 | 4.10 | Gratuitous Flash | 3.31 | 1984 | Neo-Prog | 2 |
A coluna ratings
indica o número de avaliações para o álbum, rating
é a nota média e qwr
é a nota média ponderada pelo número de votos entre os àlbuns do ano - ambas as notas admitem valor máximo 5
. Abaixo as primeiras linhas da tabela de artistas:
id | genre | country | name |
---|---|---|---|
1 | Symphonic Prog | United Kingdom | Genesis |
2 | Neo-Prog | United Kingdom | Abel Ganz |
3 | Neo-Prog | Poland | Abraxas |
9 | Symphonic Prog | Hungary | After Crying |
Estamos disponibilizando os dados em dois formatos:
- TSV (Tab Separated Values) albums, artists - Note que strings com mais de uma palavra são envoltas por aspas duplas
- SQLite database
Tarefa
Sua tarefa é:
- Estudar os dados disponibilizados.
- Escolher um pequeno conjunto de perguntas que você deseja responder.
- Desenvolver ao menos duas visualizações que respondem o conjunto de perguntas que você definiu no passo anterior.
- Documentar de forma clara e objetiva (máximo de 4 parágrafos) quais decisões você tomou ao construir suas visualizações.
Idealmente, as duas tabelas disponibilizados devem ser capazes de responder suas perguntas. Sinta-se livre para manipular os dados da maneira que achar conveniente (lembre-se de anotar suas decisões). Você também pode incorporar outros dados relacionados ao Dataset inicial.
Na sua curta documentação, procure descrever os elementos visuais que utilizou e por que eles são apropriados. Como eles ajudam a responder as suas perguntas? Alguma parte dos dados ficou obscura? É importante lembrar que as visualizações devem ser capazes de transmitir e responder suas perguntas sem o auxílio da documentação.
Visualizações e ferramentas
Você está livre para escolher a ferramenta que desejar para construir a visualização. A única restrição é que ela deve ser interativa e potencialmente disponibilizada online, produzida através de uma linguagem de programação. Ou seja, ferramentas como Processing e d3.js são boas opções.
Note que apesar de muitas dessas ferramentas possuírem rotinas ou exemplos que podem facilitar a implementação, nem sempre elas produzem visualizações que refletem as boas práticas e conceitos aprendidos em sala.
Avaliação
Essa opção deverá ser feita individualmente. O seu trabalho será avaliado pelo seu processo de análise dos dados e pelas visualizações produzidas:
- Perguntas claras, sofisticadas e aplicáveis aos dados disponibilizados.
- Interpretação e manipulação correta dos dados.
- Visualizações que respondem as perguntas de maneira convincente.
- Visualizações que se sustentam por si só.
- Correto uso dos conceitos e elementos visuais aprendidos, incluindo título, legendas e eixos.
Entrega
Você deve entregar:
- As visualizações produzidas (se for online, indicar o endereço).
- Documentação como descrito acima (máximo de 4 parágrafos e uma página) em
PDF
, incluindo as perguntas. - Código fonte e uma curtíssima descrição (em formato
TXT
) das ferramentas utilizadas e de como abrir e utilizar sua visualização, caso aplicável.