Descrição do dataset
Este dataset possui comentários de leitores sobre as notícias publicadas no G1 antes de 2010. Desta forma, esse conjunto de dados possui 54.634 comentários distribuídos entre 4.549 notícias, que incluem informações como data de publicação da notícia, texto dos comentários e data de publicação dos comentários. Esse dataset omite intencionalmente os títulos, links, nomes de usuário e outros tipos de dados que podem revelar a identidade de alguém.
Estrutura de dados
O dataset está no formato JSON, estruturado conforme o exemplo abaixo:
[
{
"createdAt": "2006-09-01T03:06:28.000Z",
"editorial": "Tech & Games",
"comments": [
{
"createdAt": "2006-09-19T01:22:00.000Z",
"text": "pena aplicada conforme a realidade brasileira. afinal, o prejuízo lá é bem maior. são dois pesos e duas medidas, isso é óbvio, mas proporcionais."
}
]
},
{
"createdAt": "2006-09-01T03:06:28.000Z",
"editorial": "Tech & Games",
"comments": [
{
"createdAt": "2006-09-08T18:53:00.000Z",
"text": "Isso é uma máfia!!!!"
},
{
"createdAt": "2006-09-16T05:01:00.000Z",
"text": "boa"
}
]
}
]
Solicitar acesso
O acesso a este dataset pode ser solicitado através do link na plataforma Zenodo.