Classificadores Binários, Políticas Públicas Sociais e Dados Desbalanceados

Cinara J. Santos, Vitor Gabriel Barra Souza, Victor Teixeira de Melo Mayrink, Henrique Steinherz Hippert, Marcel de Toledo Vieira

Resumo


Neste estudo utilizamos uma base de dados de pesquisa vinculada ao desempenho do Programa Bolsa Família (PBF) no ano de 2009. Este programa implica na transferência direta de renda com condicionantes nas áreas de educação, saúde e assistência social, visando atender famílias pobres e extremamente pobres - assim classificadas segundo um determinado valor percapita mensal. Esta base contem informações de cunho financeiro (renda e gastos das famílias), e também grau de instrução dos indivíduos, e elementos descritores do ambiente domiciliar (moradia e entorno). A aplicação dos algoritmos de predição visou averiguar a eficiência desses processos a partir das variáveis que descrevem as famílias, identificando corretamente se estas atendiam ou não ao perfil de beneficiárias do programa. Os algoritmos utilizados foram regressão logística, árvore binária de decisão e rede neural artificial em múltiplas camadas. Diversas medidas de desempenho foram calculadas, a partir da matriz de confusão resultante de cada algoritmo. Os valores encontrados para estas medidas foram baixos frente a uma das classes a serem identificadas. As intervenções aplicadas foram o reembaralhamento aleatório e também super-amostragem da classe minoritária e sub-amostragem da classe majoritária. Embora tenha ocorrido alguma melhora, o desempenho no reconhecimento da classe minoritária permaneceu baixo o que aponta para a necessidade de novos experimentos.

Texto completo:

PDF


DOI: https://doi.org/10.13037/ria.vol13n1.169

Revista de Informática Aplicada - USCS/UFABC

 

Indexadores que a RIA faz parte: