Classificadores Binários, Políticas Públicas Sociais e Dados Desbalanceados

Autores

  • Cinara J. Santos Programa de Pós-Graduaçao em Modelagem Computacional - UFJF / mestranda
  • Vitor Gabriel Barra Souza Faculdade de Medicina - UFJF
  • Victor Teixeira de Melo Mayrink Programa de Pós-Graduaçao em Modelagem Computacional - UFJF / mestre
  • Henrique Steinherz Hippert Programa de Pós-graduação em Modelagem Computacional - Fac. Engenharia - UFJF Depto. Estatística - ICE - UFJF
  • Marcel de Toledo Vieira Programa de Pós-graduação em Economia Aplicada - Fac. Economia - UFJF Depto. Estatística - ICE - UFJF

DOI:

https://doi.org/10.13037/ria.vol13n1.169

Resumo

Neste estudo utilizamos uma base de dados de pesquisa vinculada ao desempenho do Programa Bolsa Família (PBF) no ano de 2009. Este programa implica na transferência direta de renda com condicionantes nas áreas de educação, saúde e assistência social, visando atender famílias pobres e extremamente pobres - assim classificadas segundo um determinado valor percapita mensal. Esta base contem informações de cunho financeiro (renda e gastos das famílias), e também grau de instrução dos indivíduos, e elementos descritores do ambiente domiciliar (moradia e entorno). A aplicação dos algoritmos de predição visou averiguar a eficiência desses processos a partir das variáveis que descrevem as famílias, identificando corretamente se estas atendiam ou não ao perfil de beneficiárias do programa. Os algoritmos utilizados foram regressão logística, árvore binária de decisão e rede neural artificial em múltiplas camadas. Diversas medidas de desempenho foram calculadas, a partir da matriz de confusão resultante de cada algoritmo. Os valores encontrados para estas medidas foram baixos frente a uma das classes a serem identificadas. As intervenções aplicadas foram o reembaralhamento aleatório e também super-amostragem da classe minoritária e sub-amostragem da classe majoritária. Embora tenha ocorrido alguma melhora, o desempenho no reconhecimento da classe minoritária permaneceu baixo o que aponta para a necessidade de novos experimentos.

Downloads

Não há dados estatísticos.

Biografia do Autor

Cinara J. Santos, Programa de Pós-Graduaçao em Modelagem Computacional - UFJF / mestranda

Graduada em Eng.Elétrica, pós lato-sensu em eng. de produção, mestranda em modelagem computacional com foco em políticas públicas sociais.

Downloads

Publicado

2020-05-31

Edição

Seção

Artigos