Descrição do dataset
Este dataset contém dados de comentários de leitores sobre as notícias publicadas no G1, enviadas entre 28 de março de 2020 e 11 de setembro de 2020. Esse conjunto de dados possui 1.059.672 comentários distribuídos entre 18.014 notícias, os quais incluem data de publicação da notícia, entidades citadas, textos dos comentários, quantidade de curtidas e data de publicação. Esse dataset omite intencionalmente os títulos, links, nomes de usuário e quaisquer outros dados que podem revelar a identidade de alguém.
Os dados foram utilizados no trabalho "O que os textos dizem sobre Jair Bolsonaro? Desenvolvimento de uma rede de coincidência lexical dos comentários de um portal de notícias", publicado no "XIII Simpósio Nacional da ABCiber".
Estrutura de dados
O dataset está no formato JSON, estruturado conforme o exemplo abaixo:
[
{
"createdAt": "2020-03-29T23:05:56.524Z",
"editorial": "Rio de Janeiro",
"entities": [
"Crivella",
"Rio de Janeiro"
],
"comments": [
{
"createdAt": "2020-03-30T03:45:05.620Z",
"text": "aonde estão internados?",
"likes": 0,
"replies": []
}
]
},
{
"createdAt": "2020-03-29T12:31:33.385Z",
"editorial": "Bem Estar",
"entities": [],
"comments": [
{
"createdAt": "2020-03-29T20:24:28.984Z",
"text": "Não sou contra e nem a favor de emissora alguma...os que fala mau dessa em questão. Se falam é por que estão acompanhando as informações postadas por ela... omo explicar isso?",
"likes": 1,
"replies": []
},
{
"createdAt": "2020-03-29T20:01:46.128Z",
"text": "OMS e nada dá na mesma. Sem plano de ação, sem ação sem orientação, nada. Virou só um órgão papagaio. Repete o que ouve e nada mais.",
"likes": 0,
"replies": []
}
]
}
]
Solicitar acesso
O acesso a este dataset pode ser solicitado através do link na plataforma Zenodo.