Barómetro MediaLab-Priberam: Metodologia

Síntese

O Barómetro de Notícias analisa, periodicamente, as grandes ‘histórias’ mediáticas que recebem maior atenção na comunicação social online, em Portugal. Desta forma, pretende-se identificar, sistematicamente e com uma metodologia consistente ao longo do tempo, a tematização da agenda de debate público através da comunicação social.

A noção de grande ‘história’ mediática provém do termo anglo-saxónico “top story”. Pode ser mais facilmente identificável quando se trata de um acontecimento imprevisto que se impõe pela sua natureza disruptiva e valor-notícia associado, mas também pode ser um assunto ou problema público que os media mantêm na agenda durante algum tempo.

A opção pela comunicação social online prende-se com a importância crescente e forma de circulação das notícias online, que corresponde a mudanças nas práticas jornalísticas – maior diversidade de plataformas, conteúdos, estilo e formas de destaque – e nos hábitos de consumo, também eles em mudança e que passam, em boa medida, pela circulação de notícias publicadas em plataformas online, sejam elas redes sociais ou aplicações ‘mobile’.

Como construímos o barómetro

Todo o trabalho de análise é feito sobre os dados fornecidos pela plataforma Priberam. O sistema desenvolvido pela Priberam permite agregar artigos noticiosos em ‘histórias mediáticas’ (no sentido anglo-saxónico, conforme referido anteriormente) agrupadas em clusters. Este processo tem a dificuldade adicional de exigir a análise automática, completamente online e escalável de um fluxo ininterrupto de dados em contínua atualização. Este método implica a capacidade de autocorreção de decisões passadas de uma forma eficiente por forma a manter a coerência dos clusters.

A plataforma capta, de forma dinâmica, todas as publicações noticiosas disponíveis em mais de mil entidades (fontes de informação). A partir da organização automática, pelo algoritmo, das 50 ‘histórias’ mais significativas, agrupadas em clusters, procede-se a uma validação e análise semântica no MediaLab do CIES-Iscte, com recurso a técnicas tradicionais de análise de conteúdo.

Para o relatório final, publicado mensalmente, considera-se o conjunto de fontes que correspondem a órgãos de comunicação social generalista (publicações periódicas, empresas jornalísticas e noticiosas não especializadas) de âmbito nacional. Esta seleção das fontes é feita através de um filtro aplicado após a recolha dos dados.

O barómetro tem como objetivo secundário registar a variação em percentagem e longevidade das histórias noticiosas mais relevantes, ao longo dos meses. Os dados quantitativos fornecidos pelo algoritmo, apesar de constituirem um indicador muito importante, não devem ser considerados como valores definitivos, dada a natureza dinâmica da rede, com a impossibilidade de captar a totalidade dos conteúdos publicados, com um grau de certeza absoluta. Desta forma, o barómetro privilegia frequências relativas e variações em percentagem no processo de definição da respetiva importância relativa.

Quem somos

O barómetro de notícias é fruto de uma parceria entre o MediaLab CIES-Iscte e a Priberam.

O MediaLab é uma unidade integrada no Centro de Investigação e Estudos em Sociologia (CIES-Iscte). Na sua atividade, desenvolve e apoia projetos em fase de recolha ou tratamento de dados, que estejam relacionados com Estudos dos novos media (Internet e redes sociais), produção de conteúdos multimédia, estudos dos media ditos tradicionais (rádio, televisão e imprensa).

A Priberam é líder mundial na oferta de processamento de linguagem natural e tecnologias de pesquisa para a língua portuguesa e líder de mercado em sistemas de gestão do conhecimento jurídico em Portugal. Equipas multidisciplinares de engenheiros de software, linguistas e advogados, entre outros, desenvolvem o portfólio de produtos e serviços da empresa que são usados ​​por milhões de pessoas em todo o mundo.

Bibliografia essencial sobre o algoritmo Priberam

Rúben Cardoso, Zita Marinho, Afonso Mendes and Sebastião Miranda. 2021. Priberam at MESINESP Multi-label Classification of Medical Texts Task, CLEF.

Rúben Cardoso, Afonso Mendes and André Lamurias. 2020. Priberam Labs at the NTCIR-15 SHINRA2020-ML: Classification Task, Proceedings of the 15th NTCIR Conference on Evaluation of Information Access Technologies, December 8-11,Tokyo Japan.

Afonso Mendes, Shashi Narayan, Sebastião Miranda, Zita Marinho, André F. T. Martins and Shay B. Cohen. 2019. Jointly Extracting and Compressing Documents with Summary State Representations, Annual Conference of the North American Chapter of the Association for Computational Linguistics (NAACL), Minneapolis, USA

Zita Marinho, Afonso Mendes, Sebastião Miranda and David Nogueira. 2019. Hierarchical Nested Named Entity Recognition, The 2nd Clinical Natural Language Processing Workshop (within NAACL 2019), Minneapolis, USA

Sebastião Miranda, Arturs Znotins, Shay B. Cohen and Guntis Barzdins. 2018. Multilingual Clustering of Streaming News. Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing (EMNLP), Brussels, Belgium.

Toda a bibliografia relevante na página de publicações Priberam Labs.

Bibliografia relevante sobre o Barómetro de Notícias

Livino Neto, Gustavo Cardoso, Décio Telo. 2021. A montra jornalística na estação pandémica: análise das capas do Correio da Manhã, Jornal de Notíciías e Público. Lisboa: Observatorio (OBS*) Journal. Special issue, pp. 24-44.

Paulo Couraceiro, Miguel Paisana, José Moreno, Décio Telo, Ana Pinto-Martinho, Gustavo Cardoso. 2018. Estado das Notícias 2018. Lisboa. MediaLab e OberCom.
Ana Pinto-Martinho, Gustavo Cardoso, Décio Telo. 2017. Barómetro de Notícias ISCTE-IUL: 4 anos de análise ao destaque noticioso em Portugal. Lisboa. Comunicação no 4.º Congresso dos Jornalistas.
Gustavo Cardoso, Susana Santos, Décio Telo (Orgs.). 2016. Jornalismo em tempo de crise. Lisboa. Mundos Sociais.
António Manuel Pinheiro Santos, Imprensa como indicador: a representação dos temas económicos nos media portugueses. 2016. Lisboa: ISCTE-IUL. Dissertação de mestrado.
Décio Telo. 2014. A problemática do acontecimento na produção jornalística: uma análise a partir das notícias sobre a ‘crise no PS’. Lisboa: ISCTE-IUL. Dissertação de mestrado.
Susana Costa Santos, Carlota Pina Bicho. 2016. Eleições autárquicas 2.0: análise das estratégias de comunicação online de candidatos, partidos e movimentos independentes, Lisboa: SOCIOLOGIA, PROBLEMAS E PRÁTICAS, n.º 81. pp. 189-210.

 

Licença de utilização

Licença Creative Commons
Este trabalho está licenciado com uma Licença Creative Commons – Atribuição 4.0 Internacional.

Deixe uma resposta

O seu endereço de email não será publicado.