
Dando continuidade à série A Sociologia Digital e suas Interfaces, publicamos texto de Leonardo Nascimento (UFBA), onde mapeia as interfaces entre a sociologia digital e campos adjacentes como humanidades digitais, ciência de dados e ciência social computacional.
Explicitando convergências e tensões entre as áreas, o autor argumenta que a rejeição aos métodos computacionais representa uma erosão da autoridade interpretativa da sociologia, e que o avanço metodológico só se completa quando acompanhado de uma reflexão crítica sobre validade, interpretação e regimes de prova, desafio que se intensifica com o avanço da inteligência artificial generativa.
A Sociologia Digital e suas Interfaces é uma série da BVPS Edições, com curadoria de Richard Miskolci. A série vai ao ar semanalmente, sempre às quartas-feiras. Outros posts da série podem ser conferidos aqui.
Para ficar por dentro de todas as nossas postagens, você pode assinar nossa lista de e-mails, seguir nosso Instagram ou entrar no canal da BVPS no WhatsApp. Boa leitura!
Humanidades Digitais, Ciência de Dados e os desafios da IA generativa
Por Leonardo F. Nascimento (UFBA)
Das fitas cassete à coleta de rastros digitais em tempo real
Em 1999, participei de uma pesquisa sobre a experiência de pacientes com infarto agudo do miocárdio[1]. O método era artesanal: gravações em fita cassete, transcrições manuais e categorização com lápis de cor em folhas impressas. Uma década depois, no doutorado, softwares CAQDAS[2] como o ATLAS.ti transformaram essa dinâmica, permitindo codificar centenas de matérias jornalísticas com rigor inviável no regime analógico. Desde 2021, coordeno[3] uma pesquisa sobre desinformação e extrema direita no Telegram que coleta, em tempo real, dezenas de terabytes de dados multimodais – texto, áudio, vídeo e imagem – de milhares de grupos (Cesarino, Nascimento & Fonseca, 2023; Fonseca, Ribeiro & Nascimento, 2022; Jesus et al., 2025; Nascimento et al., 2021, 2022, 2024; Wedderburn et al., 2024). Entre a fita cassete e os servidores atuais, não houve apenas mudança de escala, mas uma verdadeira “mutação epistemológica” (Chartier, 2002: 108): a nova materialidade dos dados digitais alterou a temporalidade da pesquisa e expandiu os limites de como conhecemos a vida social.
Essa trajetória condensa transformações mais amplas. Há dez anos, argumentei que a sociologia precisava de um “upgrade digital” diante da dataficação da vida cotidiana (Nascimento, 2016), esforço que se consolidou com a publicação do primeiro livro sobre o tema no Brasil (Nascimento, 2020). O diagnóstico permanece válido: não basta atualizarmos as competências técnicas. É preciso interrogar as consequências epistemológicas dessa atualização para a imaginação sociológica. O “upgrade” metodológico só se completa quando implica também um upgrade epistemológico – isto é, quando a incorporação de dados e métodos computacionais vem acompanhada de uma reflexão crítica sobre a validade, a interpretação e os regimes de prova[4].
É por isso que a rejeição sistemática de meus colegas aos métodos computacionais não pode ser tratada apenas como conservadorismo disciplinar. Ela opera como vetor de ostracismo intelectual da sociologia, aprofundando o fosso entre os atores que controlam a produção, a extração e a modelagem dos rastros digitais e a disciplina que reivindica para si a tarefa de interpretar o social (Savage & Burrows, 2007; Manovich, 2012; Mahrt & Scharkow, 2013; Lupton, 2015). Não se trata apenas de uma defasagem técnica, mas de uma erosão da própria autoridade interpretativa da sociologia: outros campos passaram a legislar sobre o que conta como dado, como evidência e quais explicações se estabilizam como legítimas na descrição de processos sociais.
Proponho, neste texto, mapear as interfaces entre a Sociologia Digital e campos adjacentes – Humanidades Digitais, Ciência De Dados e Ciência Social Computacional – a fim de explicitar convergências e tensões. A partir desse mapeamento, discuto os deslocamentos epistemológicos produzidos pela incorporação de técnicas computacionais e argumento que a inteligência artificial generativa intensifica esse cenário, pois reorganiza simultaneamente a produção de rastros, os modos de circulação do discurso e as próprias ferramentas de análise.
A Sociologia digital e as Humanidades digitais
Em 2018, fundei – junto com outros colegas – o Laboratório de Humanidades Digitais da UFBA (LABHDUFBA). A decisão de criar um laboratório de Humanidades Digitais, e não de Sociologia Digital, respondia a um diagnóstico intelectual: a transformação digital não reorganizou apenas um subcampo, mas atravessou transversalmente todas as ciências sociais, reconfigurando seus materiais empíricos, seus problemas e seus regimes de verdade.
Essa transversalidade tornou-se evidente no crescimento de agendas como a Sociologia Digital (Lupton, 2015; Marres, 2017; Prior & Orton-Johnson, 2013), a Antropologia Digital (Horst & Miller, 2013), a História Digital (Ayers, 2001; Brasil & Nascimento, 2020; Salmi, 2020; Zaagsma, 2013), a Ciência Social Computacional (Edelmann et al., 2020; Salganik, 2019) e os Métodos Digitais (Omena, 2019; Rieder & Röhle, 2017; Rogers, 2013; Venturini & Rogers, 2025). O laboratório nasceu como “plataforma comum” para pesquisadores que, por razões distintas, precisavam lidar com a nova materialidade dos dados digitais.
As Humanidades Digitais ofereciam não apenas um guarda-chuva institucional. Sua indefinição como campo, frequentemente descrito como espaço “em disputa” ou de contornos abertos (Liu, 2013), apresentava uma vantagem epistemológica: permitia a articulação flexível de autores, métodos e técnicas, sem subordinar a pesquisa a um repertório fechado de ferramentas.
Para as Humanidades Digitais, o “digital” não é apenas um repertório técnico, mas uma resposta a uma transformação ontológica. Quanto mais avançamos em direção ao machine reading (Guillory, 2008; Hayles, 2010), mais nos aproximamos da ideia de que eventos sociais de larga escala são produzidos por confluências multicausais nas quais atuam forças humanas e não humanas (Hayles, 2012; Liu, 2013). Quando o volume e a complexidade excedem a capacidade de síntese do pesquisador, a computação torna-se uma forma de “primeira visibilidade”, ao tornar padrões detectáveis sem dispensar a atitude hermenêutica (Gadamer, 2008). É nesse momento que a sociologia deveria reintroduzir o sentido, a validade conceitual e a explicação dos achados.
A ciência de dados como disciplina propedêutica da sociologia
Foi quase inevitável que a expertise computacional do LABHDUFBA, ao se deparar com os social big data, arrastasse a ciência de dados para dentro da sociologia e de áreas afins. Se a ciência de dados diz respeito a “um conjunto de princípios, definições de problemas, algoritmos e processos para extrair padrões não óbvios e úteis de grandes conjuntos de dados” (Kelleher & Tierney, 2018: 1), é razoável supor que a existência de mais dados sobre a vida em sociedade demande profissionais das humanidades capazes de lidar com esse material.
No entanto, esse encontro não se explica apenas pelo volume. As ciências sociais já lidavam com estatística e N elevados sob a gramática da amostragem e da modelagem explicativa. O que passou a se denominar “ciência de dados” é, em certa medida, uma reconfiguração da estatística: a inferência paramétrica passa a coexistir com uma cultura algorítmica orientada à predição (Breiman, 2001). O ponto decisivo é que esse novo regime de evidências impôs às ciências sociais exigências diante das quais se torna inevitável tomar posição (Conte et al., 2012; Lazer et al., 2009).
A relação entre Sociologia Digital e Ciência de Dados oscila entre uma promessa – a de que os métodos computacionais permitiriam às ciências sociais alcançar o panteão das ciências rigorosas – e um risco simétrico: a subordinação da imaginação sociológica à lógica computacional. Esse impasse não é novo; a disciplina já o enfrentou diante da estatística e da experimentação, horizonte no qual se inscrevem as controvérsias em torno de Rickert e a tentativa weberiana de conciliar explicação causal e compreensão interpretativa (Weber, 1994). A questão decisiva permanece a mesma: não aderir cegamente nem rejeitar categoricamente, mas definir sob quais critérios teóricos e metodológicos a ciência de dados será incorporada à pesquisa social.
Nesse percurso, a corrida ao “eldorado dos dados” frequentemente reativou uma mitologia da transparência e da completude, como se a escala e as visualizações resolvessem, por si sós, as questões de validade. Uma crítica já consolidada insiste na inexistência de “dados brutos”: dados são sempre produzidos por escolhas, instrumentos e instituições (boyd & Crawford, 2012; Gitelman, 2013; Jungherr, 2015). Nos debates que acompanhamos, observa-se quase sempre o mesmo movimento: investigações que constroem sociologicamente o problema, mas negligenciam as etapas metodológicas relativas aos dados digitais, ou, no polo oposto, um desfile pouco teórico de fetichismo dos dados e das ferramentas. Assumir a ciência de dados como disciplina propedêutica das ciências sociais implica superar tais cisões: o cientista social que não dominar minimamente essas ferramentas tende a perder a capacidade de disputar a interpretação do social produzida nas infraestruturas digitais.
A Sociologia Digital e Inteligência Artificial Generativa
A emergência da inteligência artificial generativa e dos grandes modelos de linguagem (LLMs) adiciona uma camada inteiramente nova de complexidade. Os LLMs não são apenas ferramentas de pesquisa; são instrumentos heurísticos (Brasil & Nascimento, 2020). Produzem textos, imagens e códigos; simulam conversas; sintetizam informações – tudo a partir de padrões estatísticos extraídos de corpora massivos cuja composição é, com frequência, opaca.
Do ponto de vista metodológico, os LLMs prometem aliviar o gargalo hermenêutico associado ao volume de dados. Técnicas como RAG (Retrieval-Augmented Generation) e agentes de IA configuram o limiar mais avançado da ciência social computacional, permitindo, em tese, realizar análises qualitativas em escala. Essa promessa, contudo, vem acompanhada de riscos: a opacidade dos processos decisórios do modelo; as “alucinações” – respostas fluentes, porém factualmente incorretas (Filippova, 2020; Gao et al., 2023; Maynez et al., 2020; Singh et al., 2025); e a tentação de delegar ao modelo tarefas que exigem julgamento sociológico. Quando a máquina “escreve”, o que é autoria? Quando “analisa”, o que é dado e o que é artefato do modelo?
A postura que temos adotado no LABHDUFBA é a mesma que adotamos com todas as ferramentas de pesquisa: nem fetichização, nem recusa. As IAs generativas são, simultaneamente, instrumentos de pesquisa e objetos de investigação. No entanto, para lidar com elas adequadamente, enfrentamos um problema epistêmico anterior: as ciências sociais perderam o “bonde epistemológico” da análise dos fenômenos digitais. Nossos currículos ainda operam com uma divisão do trabalho intelectual que separa teoria, métodos qualitativos e quantitativos em compartimentos estanques. A competência computacional, quando existe, aparece como acessório técnico, não como componente integral da imaginação sociológica.
Essa incorporação exige, ainda, cautela: há o risco de reduzirmos o social ao digital, como se aquilo que se torna rastreável em plataformas esgotasse a vida social. A Sociologia Digital só ganha densidade quando trata os rastros como janela situada, e não como sinédoque do mundo social. A proposta que defendo é considerar a Sociologia Digital não como subcampo temático – ao lado da Sociologia do Trabalho, da religião ou da saúde —, mas como disposição metodológica que atravessa toda a disciplina. Todas as áreas são, hoje, potencialmente afetadas pela digitalização: o trabalho (plataformas, gig economy), a saúde (wearables, telemedicina), a política (desinformação, modulação algorítmica). A questão não está em criar mais GTs de sociologia digital apartados, mas em digitalizar – criticamente – a sociologia como um todo.
Como formularam Amaturo e Aragona (2019), é preciso evitar dois extremos: o método que negligencia as implicações epistemológicas converte-se em mero tecnicismo; a teoria que ignora a tecnologia transforma-se em filosofia abstrata da sociedade. O caminho é o de uma “polêmica incessante da razão digital” – uma postura de vigilância crítica que interroga, a cada passo, as condições de produção do conhecimento que estamos gerando.
Sociologia Digital: Quo Vadis?
Concluo com três proposições para uma agenda de pesquisa e formação. Primeiro, investir em uma formação híbrida que articule teoria social, métodos computacionais e reflexão epistemológica – não apenas ensinar Python ou R, mas estimular a pensar sociologicamente com e sobre essas ferramentas. Segundo, fortalecer o diálogo interdisciplinar – com a história digital, a ciência da informação, a comunicação e a ciência da computação – sem dissolver a especificidade da contribuição sociológica: uma tradição de crítica às naturalizações, atenção às relações de poder e uma desconfiança saudável em relação a dados que supostamente falam por si. Terceiro, desenvolver uma postura de engajamento crítico com a IA generativa: nem demonização, nem celebração acrítica.
A recepção da sociologia brasileira a essas ideias foi, e segue sendo, persistentemente refratária (Afonso, 2021; Campos, 2019; Facioli & Padilha, 2018; Miskolci & Balieiro, 2018; Miskolci, 2016). Essa resistência expressa um arranjo profundo de hierarquias epistêmicas, no qual a inovação tende a ser legitimada quando importada de centros consagrados, enquanto experiências periféricas são tratadas como derivativas – uma forma de injustiça epistemológica (Fricker, 2007) à brasileira. O efeito é paradoxal: ao mesmo tempo que se denuncia a subordinação ao “Norte Global”, renuncia-se à construção de infraestrutura, linguagem conceitual e autoridade interpretativa próprias no “Norte-Nordeste” local.
Esse quadro impõe um duplo desafio. De um lado, disputar critérios de excelência no interior da própria comunidade, afirmando que inovação metodológica e rigor teórico são dimensões mutuamente constitutivas. De outro, construir institucionalmente as condições dessa transformação: currículos, redes de cooperação, laboratórios e políticas de financiamento que tratem o digital como dimensão constitutiva da vida social contemporânea. A pergunta quo vadis? não é retórica: convoca a sociologia digital brasileira a decidir se permanecerá como consumidora tardia de agendas formuladas alhures ou se assumirá o risco – teórico, metodológico e político – de produzir conceitos, infraestruturas e interpretações a partir de suas próprias condições históricas. O futuro do campo dependerá menos da adoção de ferramentas específicas e mais da capacidade de articulá-las a um projeto intelectual autônomo, crítico e institucionalmente sustentado.
Notas
[1] Coordenado pelo meu ex-orientador e amigo Paulo César Borges Alves.
[2] CAQDAS é a sigla para Computer-Assisted Qualitative Data Analysis Software (em português: Software para análise qualitativa de dados auxiliada por computador).
[3] Juntamente com a colega Letícia Cesarino (UFSC).
[4] Isto é, os critérios e procedimentos que definem o que conta como evidência válida e convincente em uma investigação sociológica.
Referências
AFONSO, Almerindo Janela. (2021). Sociologia digital: perspectivas e riscos. Revista Brasileira de Sociologia, v. 9, n. 23, p. 112-134.
AMATURO, Eenrica. & ARAGONA, Biagio. (2019). Per un’epistemologia del digitale: note sull’uso di big data e computazione nella ricerca sociale. Quaderni di Sociologia, v. 81, n. 81-LXIII, p. 71–90.
AYERS, E. L. (2001). The Pasts and Futures of Digital History. History News, v. 56, n. 4, p. 5-9
boyd, danah. & CRAWFORD, Kate. (2012). Critical Questions for Big Data. Information, Communication & Society, v. 15, n. 5, p. 662-79.
BRASIL, Eeric & NASCIMENTO, Leonardo. (2020). História digital: reflexões a partir da Hemeroteca Digital Brasileira e do uso de CAQDAS na reinterpretação de fontes históricas. Estudos Ibero-Americanos, v. 46, n. 2.
BREIMAN, L. (2001). Statistical Modeling: The Two Cultures. Statistical Science, v. 16, n. 3.
CAMPOS, C. M. (2019). Ciências sociais e o digital: panorama e perspectivas. Sociologias Plurais, v. 5.
CESARINO, Letícia & NASCIMENTO, Leonardo & FONSECA, Parulo. (2023). Desinformação e extrema-direita no Telegram.
CHARTIER, Roger. (2002). Os desafios da escrita. São Paulo: UNESP.
CONTE, R. et al. (2012). Manifesto of computational social science. The European Physical Journal Special Topics, v. 214, n. 1, p. 325-346.
EDELMANN, Achim et al. (2020). Computational Social Science and Sociology. Annual Review of Sociology, v. 46, p. 61–81.
FACIOLI, Lara. & PADILHA, Felipe. (2018). Sociologia digital: apontamentos e reflexões. Revista de Ciências Sociais Unisinos, v. 54.
FILIPPOVA, Katja. (2020). Controlled Hallucinations: Learning to Generate Faithfully from Noisy Data. EMNLP.
FONSECA, Paulo & RIBEIRO, Barbara & NASCIMENTO, Leonardo. (2022). Demarcating Patriotic Science on Digital Platforms. Science as Culture, v. 31, n. 4, p. 530-54.
FRICKER, Miranda. (2007). Epistemic Injustice: Power and the Ethics of Knowing. Oxford: Oxford University Press.
GADAMER, Hans-Georg. (2008). Verdade e método. Petrópolis: Vozes.
GAO, L. et al. (2023). A Survey on Hallucination in Large Language Models.
GITELMAN, Lisa. (2013). Raw Data Is an Oxymoron. Cambridge: MIT Press.
GUILLORY, John. (2008). How Scholars Read. ADE Bulletin, n. 146, p. 8-17.
HAYLES, N. Katherine. (2010). How We Read: Close, Hyper, Machine. ADE Bulletin, n. 150.
HAYLES, N. Katherine. (2012). How We Think: Digital Media and Contemporary Technogenesis. Chicago: University of Chicago Press.
HORST, Heather & MILLER, Daniel. (2013). Digital Anthropology. London: Taylor & Francis.
JESUS, J. P. de et al. (2025). Do Meme ao Ódio: Como o Racismo se Manifesta nas Plataformas Digitais. Salvador: Aláfia Lab e LABHDUFBA.
JUNGHERR, Andreas. (2015). Analyzing Political Communication with Digital Trace Data. Cham: Springer.
KELLEHER, J. D. & TIERNEY, B. (2018). Data Science. Cambridge: MIT Press.
LAZER, D. et al. (2009). Computational Social Science. Science, v. 323, n. 5915, p. 721-723.
LIU, Alan. (2013). The Meaning of the Digital Humanities. PMLA, v. 128, n. 2, p. 409-423.
LUPTON, Deborah. (2015). Digital Sociology. London: Routledge.
MAHRT, Merja & SCHARKOW, Michel. (2013). The Value of Big Data in Digital Media Research. Journal of Broadcasting & Electronic Media, v. 57, n. 1, p. 20-33.
MANOVICH, Lev. (2012). Trending: The Promises and the Challenges of Big Social Data.
MARRES, Noortje. (2017). Digital Sociology: The Reinvention of Social Research. Cambridge: Polity Press.
MAYNEZ, Joshua. et al. (2020). On Faithfulness and Factuality in Abstractive Summarization. ACL.
MISKOLCI, Richard. (2016). Sociologia digital: pensando a pesquisa online. Contemporânea.
MISKOLCI, Richard & BALIEIRO, Fernando. (2018). Sociologia digital: notas sobre pesquisa online. Contemporânea, v. 8.
NASCIMENTO, Leonardo F. (2016). A Sociologia Digital: um desafio para o século XXI. Sociologias, v. 18, n. 41, p. 216-241.
NASCIMENTO, Leonardo F. (2020). Sociologia digital: uma breve introdução. Salvador: EDUFBA.
NASCIMENTO, Leonardo. F. et al. (2021). Poder oracular e ecossistemas digitais de comunicação. Fronteiras – estudos midiáticos, v. 23, n. 2, p. 190-206.
NASCIMENTO, Leonardo F. et al. (2022). Públicos refratados: grupos de extrema-direita brasileiros na plataforma Telegram. internet&sociedade, v. 3, n. 1, p. 31-60.
NASCIMENTO, Leonardo F. et al. (2024). “Intankáveis contra o bostil”: racismo, misoginia e antissemitismo em chats do Telegram. In: COMITÊ GESTOR DA INTERNET NO BRASIL (Ed.). 4ª Coletânea de Artigos. p. 151-198.
OMENA, Janna. (2019). Métodos Digitais: Teoria-Prática-Crítica. Lisboa: ICNOVA.
PRIOR, Nick. & ORTON-JOHNSON, Kale. (2013). Digital Sociology: Critical Perspectives. London: Palgrave Macmillan.
RIEDER, Bernard. & RÖHLE, Theo. (2017). Digital Methods. In: SCHÄFER, Mirko. & VAN ES, Karin. (Eds.). The Datafied Society. Amsterdam: Amsterdam University Press, p. 109-124.
ROGERS, Richard. (2013). Digital Methods. Cambridge: MIT Press.
SALGANIK, Matthew J. (2019). Bit by Bit: Social Research in the Digital Age. Princeton: Princeton University Press.
SALMI, Hannu. (2020). What is Digital History? Cambridge: Polity Press.
SAVAGE, Mike. & BURROWS, Roger. (2007). The Coming Crisis of Empirical Sociology. Sociology, v. 41, n. 5, p. 885-899.
SINGH, C. et al. (2025). Rethinking LLM Hallucinations. (mimeo).
VENTURINI, Tommaso & ROGERS, Richard. (2025). Digital Methods: A Short Introduction. Cambridge: Polity Press.
WEBER, Max. (1994). Economia e Sociedade. 3. ed. Brasília: Editora UNB.
WEDDERBURN, Rosana et al. (2024). Representações meméticas de “nós e eles”: humor e discurso de ódio em chats do Telegram. Aurora, v. 17, n. 49, p. 136-173.
ZAAGSMA, Gerben. (2013). On Digital History. BMGN – Low Countries Historical Review, v. 128, n. 4, p. 3-29.
Sobre a autora
Leonardo F. Nascimento possui formação em Química, Psicologia e Sociologia. Atualmente, é professor da Universidade Federal da Bahia (UFBA), coordena o Laboratório de Humanidades Digitais da UFBA (LABHD) e atua como analista de dados no Departamento de Estudos Econômicos do Conselho Administrativo de Defesa Econômica (DEE/CADE).
