Codificação de vieses no processo de modelagem algorítmica

formas de opacidade e obscurecimento a partir do estudo de caso da base de dados Boston Housing

Autores

Resumo

A multiplicação de atividades mediadas por processos algorítmicos levanta questões sobre seu papel na transformação da sociabilidade, seja sobre na mudança das formas de interação e ação, seja na manutenção de preconceitos e estereótipos, compreendidos como vieses sociais. A opacidade desses processos dificultam o aprofundamento de pesquisas sobre o tema. Este trabalho visa contribuir com a investigação das formas pelas quais esses vieses podem ser codificados e obscurecidos em cada etapa do processo sociotécnico de modelagem algorítmica. O caso em questão é a base de dados Boston Housing, cujo atributo “B” carrega não só um viés racial explícito, mas também um processo de obscurecimento. A partir de pesquisas que tratam de vieses sociais – por exemplo, o redlining e seus desdobramentos, como a demarcação tecnológica – busca-se articular perspectivas sobre opacidade e obscurecimento com a investigação das diversas formas de codificação de vieses. A fim de ilustrar a dimensão técnica e compor a perspectiva interdisciplinar deste trabalho, descreve-se os principais passos envolvidos no treinamento de um modelo simplificado de regressão linear e o papel do atributo em questão nos resultados. Por fim, é realizada uma revisão de literatura a fim de verificar como este atributo foi tratado na produção acadêmica recente. Após este percurso, observa-se que o acesso aos dados e ao treinamento dos modelos permitem abrir o que muitas vezes se apresenta como caixas-pretas, possibilitando a investigação de métodos, decisões e resultados desse processo. O modelo treinado com os dados da base Boston Housing ilustra didaticamente o aprendizado de máquina e mostra que o atributo B pode ser até mesmo prescindível. A revisão de literatura mostra que quase a totalidade dos trabalhos produzidos com esta base de dados abdicam de se aprofundar sobre as implicações dos dados nela contidos

Downloads

Publicado

2023-02-28