A partir de dados abertos da Câmara dos Deputados, desenvolvemos uma análise para entender como os partidos políticos se alinham em suas discussões. Usamos uma técnica chamada TF-IDF (Frequência de Termo-Inverso da Frequência nos Documentos) que nos ajuda a medir quão semelhantes são os discursos dos partidos, indicando assim uma possível convergência em temas e prioridades.
Esta análise calcula a semelhança nos discursos dos partidos ao comparar quão frequentes certos termos são usados por um partido em relação aos outros. A semelhança é ajustada removendo as palavras que são comumente usadas por todos, o que nos dá uma visão mais clara do que realmente distingue os discursos de cada partido.
O gráfico de cores que acompanha essa análise varia do azul escuro ao azul claro. O azul escuro mostra que os partidos estão mais próximos em suas discussões, falando sobre temas semelhantes. Já o azul claro indica que há maior distância entre eles, sugerindo divergências nos temas abordados. A análise não diz exatamente se os partidos concordam ou discordam entre si, apenas que estão falando sobre os mesmos assuntos.
Distância dos Discursos
Dados coletados de 1 de janeiro a 17 de abril de 2024 mostram a proximidade dos discursos entre partidos políticos no Brasil, numa escala que vai de 0 a 1. Ao interagir com o gráfico, uma caixa informativa exibe a distância entre os discursos dos partidos selecionados, com o azul mais escuro indicando maior proximidade (distância próxima de zero).
A tabela abaixo do gráfico permite explorar os termos específicos que caracterizam a discussão de dois partidos. Ela mostra o peso de cada termo, que indica sua importância na diferenciação entre os partidos. A tabela também mostra quantas vezes cada termo foi usado pelos partidos comparados.
O gráfico permite a aplicação de filtros para visualizar apenas os discursos que incluem termos específicos. A busca por termos utiliza uma técnica chamada stemming, que reduz as palavras ao seu radical comum. Por exemplo, "andar" seria reduzido para "and", permitindo capturar variações como "andaram" e "andou". Isso ajuda a identificar e comparar como diferentes temas são abordados pelos partidos, mesmo que as palavras sejam ligeiramente diferentes. Tente fazer uma busca e veja como muda o gráfico!
Peso e Frequência do Termo
A distância entre os pontos quer dizer uma proximidade entre as temáticas abordadas pelos particos. Por exemplo, o Rede próximo dos S. Partido significa que estão falando de temas parecidos, mas divergentes dos demais.
Frequência descontadas palavras comuns (stopwords) e palavras de uso recorrente no contexto da câmara, para os 10 termos de maior relevância. O peso é calculado a partir da frequência do termo descontados os termos que não costumam ser usados nos discursos. Termos mencionados pelo partido, ainda que poucas vezes, desde que não mencionados por outros partidos, terão um peso alto.
Os partidos podem ser clusterizados, em termos da coincidência do discurso, como indicado abaixo. Quanto mais próximo um partido está do outro, maior a coincidência de termos usados em seus pronunciamentos. Partidos nas extremidades tem discursos mais peculiares e diversos da pauta comum.