Uso de Python para detecção de fake news sobre a covid-19: desafios e possibilidades

Fernanda Vasques Ferreira; Rafiza Varão; Marco Aurélio Boselli; Leandro Brito Santos; Marcelo A. Moret

doi:10.29397/reciis.v16i2.3253

Usar Python para detectar noticias falsas sobre covid-19: desafíos y posibilidades

Autores/as

Fernanda Vasques Ferreira Centro Universitário Senai Cimatec, Faculdade de Tecnologia. Salvador, BA, Brasil. Universidade Federal do Oeste da Bahia, Centro Multidisciplinar de Santa Maria da Vitória. Santa Maria da Vitória, BA http://orcid.org/0000-0003-4242-0057
Rafiza Varão Universidade de Brasília, Faculdade de Comunicação. Brasília, DF https://orcid.org/0000-0003-0383-5524
Marco Aurélio Boselli Universidade Federal de Uberlândia, Instituto de Física. Uberlândia, MG https://orcid.org/0000-0002-1030-1144
Leandro Brito Santos Universidade Federal do Oeste da Bahia, Centro Multidisciplinar de Bom Jesus da Lapa. Bom Jesus da Lapa, BA https://orcid.org/0000-0003-0132-4712
Marcelo A. Moret Centro Universitário Senai Cimatec, Faculdade de Tecnologia. Salvador, BA, Brasil. Universidade do Estado da Bahia. Salvador, BA https://orcid.org/0000-0003-2624-5754

DOI:

https://doi.org/10.29397/reciis.v16i2.3253

Palabras clave:

Noticias falsas, Inteligencia artificial, Covid-19, Python, Desinformación.

Resumen

Este trabajo tiene como objetivo informar estrategias para recopilar un conjunto de datos en portugués para entrenar modelos de Inteligencia Artificial para identificar automáticamente noticias falsas sobre covid-19 difundidas durante la pandemia, utilizando el código Python. Analizamos un método de detección de noticias falsas basado en una Red Neuronal Recurrente y de aprendizaje supervisado. Seleccionamos un corpus de 7.200 textos recogidos en webs y agencias de noticias por Monteiro et al. (2018) con cada uno catalogado previamente como verdadero o falso como un conjunto de datos de entrenamiento y validación. El modelo se utilizó para detectar noticias falsas sobre covid-19 en un conjunto de noticias recopiladas y clasificadas por los autores de este trabajo. La tasa de acierto fue del 70%, es decir, esta fue la tasa de éxito de detección de los artículos catalogados.

Biografía del autor/a

Fernanda Vasques Ferreira, Centro Universitário Senai Cimatec, Faculdade de Tecnologia. Salvador, BA, Brasil. Universidade Federal do Oeste da Bahia, Centro Multidisciplinar de Santa Maria da Vitória. Santa Maria da Vitória, BA

Doutorado em Comunicação pela Universidade de Brasília.

Rafiza Varão, Universidade de Brasília, Faculdade de Comunicação. Brasília, DF

Doutorado em Comunicação pela Universidade de Brasília.

Marco Aurélio Boselli, Universidade Federal de Uberlândia, Instituto de Física. Uberlândia, MG

Doutorado em Física pela Universidade Estadual de Campinas.

Leandro Brito Santos, Universidade Federal do Oeste da Bahia, Centro Multidisciplinar de Bom Jesus da Lapa. Bom Jesus da Lapa, BA

Doutorado em Modelagem Computacional pelo Senai Cimatec.

Marcelo A. Moret, Centro Universitário Senai Cimatec, Faculdade de Tecnologia. Salvador, BA, Brasil. Universidade do Estado da Bahia. Salvador, BA

Doutorado em Ciências Biológicas (Biofísica) pela Universidade Federal do Rio de Janeiro.

Citas

ALVES, Marco Antônio Sousa; MACIEL, Emanuella Ribeiro Halfeld. O fenômeno das fake news: definição, combate e contexto. Internet & Sociedade, Rio de Janeiro, v. 1, n. 1, p. 144-171, 2020. Disponível em: https://revista.internetlab.org.br/o-fenomeno-das-fake-news-definicao-combate-e-contexto/. Acesso em: 15 nov. 2021.

AMPER ENERGIA HUMANA. We Are Social e HootSuite: Digital 2021 [resumo e relatório completo]. In: AMPER ENERGIA HUMANA. Amper: marketing e comunicação. São Paulo, 03 maio 2022. Disponível em:

https://www.amper.ag/post/we-are-social-e-hootsuite-digital-2021-resumo-e-relatório-completo. Acesso em: 16 maio 2021.

AVAAZ. IBOPE: 1 em cada 4 brasileiros pode não se vacinar contra a covid-19. [S. l.]: Avaaz, 07 set. 2020. Disponível em: https://secure.avaaz.org/campaign/po/brasileiros_nao_vacinar_covid/. Acesso em: 14 nov. 2021.

AVAAZ. O Brasil está sofrendo uma infodemia de covid-19. [S. l.]: Avaaz, 04 maio 2020. Disponível em: https://avaazimages.avaaz.org/brasil_infodemia_coronavirus.pdf. Acesso em: 25 maio 2022.

BOSELLI, Marco Aurélio. Reciis. Uberlândia, 25 maio 2022. Código Python. Disponível em: https://github.com/maboselli/reciis. Acesso em: 14 jun. 2022.

BRUCK, Mozahir Salomão. O jornalismo diante de novos cenários sociais: a imprensa e o surgimento da aids e do crack. São Paulo: Intermeios, 2015.

CHENG, Raymond. Text preprocessing with NLTK. In: TDS Editors; HUBERMAN, Ben; Kindig Caitlin (ed.). Towards Data Science, [s. l.], 29 jun. 2020. Disponível em: https://towardsdatascience.com/nlp-preprocessingwith-nltk-3c04ee00edc0. Acesso em: 28 nov. 2021.

CHOLLET, François. Deep learning with Python. New York: Manning Publications, 2018.

COLLINS COBUILD. Fake news. In: COLLINS. Collins Dictionary. Nova York: Harper Collins, c2022. Disponível em: https://www.collinsdictionary.com/dictionary/english/fake-news. Acesso em: 01 fev. 2022.

FERREIRA, Fernanda Vasques. O papel do factual nos processos de agendamento e de enquadramento no telejornalismo. 2018. 438 f., il. Tese (Doutorado em Comunicação) – Universidade de Brasília, Brasília, 2018. Disponível em: https://repositorio.unb.br/handle/10482/33073. Acesso em: 16 maio 2021.

GOMES, Wilson. O que são fake news?. Brasília, DF: INCT, 2020. 1 vídeo (38 min). Publicado pelo canal INCT em Democracia Digital. Disponível em: https://www.youtube.com/watch?v=8tvJ4cMt YXY]. Acesso em: 16 maio 2021.

GOODFELLOW, Ian; BENGIO, Yoshua; COURVILLE, Aaron. Deep learning. Massachusetts: The MIT Press, Cambridge, 2016.

HASSON, Erez. Bad bot report 2021: the pandemic of the internet. In: IMPERVA, 13 abr. 2021. Disponível em:

https://www.imperva.com/blog/bad-bot-report-2021-the-pandemic-of-the-internet/. Acesso em: 23 jan. 2022.

KERTYSOVA, Katarina. Artificial Intelligence and Disinformation: how AI changes the way disinformation is produced, disseminated, and can be countered. Security and Human Rights, Leiden, v. 29, p. 55-81, 2018. DOI: http://dx.doi.org/10.1163/18750230-02901005. Disponível em: https://brill.com/view/journals/shrs/29/1-4/article-p55_55.xml. Acesso em: 14 jun. 2022.

KHAN, Junaed Younus et al. A benchmark study on Machine Learning Models for online fake news detection. arXiv, Ithaca, 12 maio 2019. Disponível em: https://arxiv.org/abs/1905.04749. Acesso em: 06 jun. 2022.

MAYERS, Gabriel. Detecting fake news using Machine Learning. In: TEAM AV (ed.). Analytics Vidhya, [s. l.], 19 jun. 2020. Disponível em: https://medium.com/analytics-vidhya/detecting-fake-news-using-machinelearning-95efefab08e4. Acesso em: 07 mar. 2022.

MELLO, Patrícia Campos. A máquina do ódio: notas de uma repórter sobre fake news e violência digital. São Paulo: Companhia das Letras, 2020.

MONTEIRO, Rafael A. et al. Contributions to the study of fake news in Portuguese: new corpus and Automatic Detection Results. In: COMPUTATIONAL FOR PORTUGUESE LANGUAGE, 13., 24-26 set. 2018, Canela. Proceedings […]. Cham: Springer, 2018. p. 324-334. (Lecture Notes in Computer Science, v. 11122). DOI:

http://dx.doi.org/10.1007/978-3-319-99722-3_33. Disponível em: https://github.com/roneysco/Fake.br-Corpus. Acesso em: 27 fev. 2022.

NIELSEN, Michael A. Neural networks and deep learning. [S. l.], Determination Press, 2015. Disponível em: http://neuralnetworksanddeeplearning.com/index.html. Acesso em: 27 fev. 2022.

PENNAFORT, Roberta. É #FAKE que foto mostre caixão enterrado vazio para inflar dados de mortos por coronavírus em Manaus. G1, [s. l.], 30 abr. 2020. Fato ou Fake. Disponível em: https://g1.globo.com/fatoou-fake/coronavirus/noticia/2020/04/30/e-fake-que-foto-mostre-caixao-enterrado-vazio-para-inflar-dados-demortos-por-coronavirus-em-manaus.ghtml. Acesso em: 29 maio 2022.

PENNYCOOK, Gordon; RAND, David G. Lazy, not biased: susceptibility to partisan fake news is better explained by lack of reasoning than by motivated reasoning. Cognition, [s. l.], v. 188, p. 39-50, 2019. DOI:

https://doi.org/10.1016/j.cognition.2018.06.011. Disponível em: https://www.sciencedirect.com/science/article/abs/pii/S001002771830163X. Acesso em: 16 maio 2021.

PEREIRA, Denilson Alves. A survey of sentiment analysis in the portuguese language. Artificial Intelligence Review, [s. l.], v. 54, n. 2, p. 1087-1115, 2020. DOI: https://doi.org/10.1007/s10462-020-09870-1. Disponível em: https://link.springer.com/article/10.1007/s10462-020-09870-1. Acesso em: 25 maio 2022.

RECUERO, Raquel et al. Desinformação, mídia social e covid-19 no Brasil: relatório, resultados e estratégias de combate. Pelotas: MIDIARS – Grupo de Pesquisa em Mídia Discurso e Análise de

Redes Sociais, 2021. Relatório de pesquisa. Disponível em: https://wp.ufpel.edu.br/midiars/files/2021/05/Desinformac%CC%A7a%CC%83o-covid-midiars-2021-1.pdf. Acesso em: 14 jun. 2022.

RECUERO, Raquel; SOARES, Felipe Bonow; GRUZD, Anatoliy. Hyperpartisanship, Disinformation and Political Conversations on Twitter: The Brazilian Presidential Election of 2018. In: INTERNATIONAL AAAI CONFERENCE ON WEB AND SOCIAL MEDIA,14., 2020, Atlanta. Proceedings […]. Atlanta: AAAI Digital

Library, 2020. Disponível em: https://ojs.aaai.org//index.php/ICWSM/article/view/7324. Acesso em: 14 jun. 2022.

RICHARDSON, Leonard. Beautiful Soup Documentation. [S. l.]: Leonard Richardson, c2020. Disponível em: https://www.crummy.com/software/BeautifulSoup/bs4/doc/. Acesso em: 06 jun. 2022.

SHARMA, Sagar. Activation functions in neural networks: Sigmoid, tanh, Softmax, ReLU, Leaky ReLU explained!!! In: TDS Editors; HUBERMAN, Ben; Kindig Caitlin (ed.). Towards Data Science, [s. l.], 6 set. 2017. Disponível em: https://towardsdatascience.com/activation-functions-neural-networks-1cbd9f8d91d6. Acesso

em: 06 jun. 2022.

SILVA, Igor Fediczko; ARAÚJO, Rafael de Paula Aguiar. Campanhas políticas em tempos de hiperpolítica: um ensaio sobre Peter Sloterdijk e a campanha de 2018. Ponto e Vírgula, São Paulo, n. 26, p. 138-145, 2019. Disponível em: https://revistas.pucsp.br/index.php/pontoevirgula/article/view/51519/34074. Acesso em: 28 set. 2021.

SLOTERDIJK, Peter. No mesmo barco: ensaio sobre a hiperpolítica. São Paulo: Estação Liberdade, 1999.

SOUSA JUNIOR, João Henriques de; PETROLL, Martin de La Martinière; ROCHA, Rudimar Antunes da. Fake news e o comportamento on-line dos eleitores nas redes sociais durante a campanha presidencial brasileira de 2018. In: SEMINÁRIOS EM ADMINISTRAÇÃO, 22., 6-8 nov, São Paulo. Anais [...], São Paulo: SemeAd, 2019. Disponível em: https://login.semead.com.br/22semead/anais/resumo.php?cod_trabalho=501. Acesso em: 20 dez. 2021.

SOUZA, Frederico Dias; SOUZA FILHO, João Batista de Oliveira. Sentiment analysis on Brazilian Portuguese user reviews. arXiv, Ithaca, 10 dez. 2021. Disponível em: https://arxiv.org/pdf/2112.05459.pdf. Acesso em: 20 dez. 2021.

VARÃO, Rafiza. Há alguma novidade na ideia de fake news? In: SOS IMPRENSA. Blog SOS Imprensa. Brasília, DF, 18 out. 2017. Disponível em: https://sosimprensa.wordpress.com/2017/10/18/ha-algumanovidade-na-ideia-de-fake-news/. Acesso em: 03 jan. 2022.

VIRAHONDA, Sergio. An easy tutorial about sentiment analysis with deep learning and Keras. In: TDS Editors; HUBERMAN, Ben; Kindig Caitlin (ed.). Towards Data Science, [s. l.], 08 out. 2020. Disponível em: https://towardsdatascience.com/an-easy-tutorial-about-sentiment-analysis-with-deep-learning-and-keras-2bf52b9cba91. Acesso em: 03 jan. 2022.

VOLKOFF, Vladimir. Pequena história da desinformação: do cavalo de Troia à internet. Lisboa: Editorial Notícias, 2000.

WARDLE, Claire. Fake News. It’s complicated. In: FIRST DRAFT. First Draft Footnotes, [s. l.], 16 fev. 2017. Disponível em: https://medium.com/1st-draft/fake-news-its-complicated-d0f773766c79. Acesso em: 14 maio 2021.

WÓJCIK, Rafał. Unsupervised sentiment analysis. In: TDS Editors; HUBERMAN, Ben; Kindig Caitlin (ed.). Towards Data Science, [s. l.], 26 nov. 2019. Disponível em: https://towardsdatascience.com/unsupervised-sentiment-analysis-a38bf1906483. Acesso em: 25 de maio 2022.

Descargas

PDF (Português (Brasil))

Publicado

2022-06-30

Cómo citar

Ferreira, F. V., Varão, R., Boselli, M. A., Santos, L. B., & Moret, M. A. (2022). Usar Python para detectar noticias falsas sobre covid-19: desafíos y posibilidades. Revista Eletrônica De Comunicação, Informação E Inovação Em Saúde, 16(2). https://doi.org/10.29397/reciis.v16i2.3253

Descargar cita

Número

Vol. 16 Núm. 2 (2022): Dossiê Perspectivas multidisciplinares sobre desinformação em ciência e saúde

Sección

Dossier Perspectivas multidisciplinares sobre la desinformación en ciencia y salud

Licencia

Derechos de autor: El autor retiene los derechos sobre su obra sin restricciones.

Derechos de reutilización: La Reciis adopta la Licencia Creative Commons, CC BY-NC atribución no comercial conforme la Política de Acceso Abierto al Conocimiento de la Fundación Oswaldo Cruz. Con esa licencia es permitido acceder, bajar (download), copiar, imprimir, compartir, reutilizar y distribuir los artículos, desde que para uso no comercial y con la citación de la fuente, confiriendo los debidos créditos de autoría y mención a la Reciis. En esos casos, ningún permiso es necesario por parte de los autores o de los editores.

Derechos de depósito de los autores/auto-archivado: Los autores son estimulados a realizar el depósito en repositorios institucionales de la versión publicada con el link de su artículo en la Reciis.

Dossier Cuidados-en-interacción: prácticas, conocimientos y reflexividad en salud (v. 18, n. 2) Abr./Jun. 2024

octubre 27, 2023

Concepto inseparable de la comunicación, la interacción es parte constitutiva del acto comunicativo. El campo de los estudios interaccionales de la comunicación humana, aunque amplio y guiado por diferentes enfoques, tiene el desafío analítico común de observar la construcción conjunta de los enunciados y sus valores accionarios en el entorno microecológico en el que ocurren, lo que implica mirar emicamente, es decir, desde dentro, y considerar los procesos reflexivos de las personas que participan en esa interacción comunicacional humana (Rodrigues, 2021).

Este dossier, cuyo título moviliza el concepto de cuidado-en-interacción, aborda los cuidados de la salud desde una perspectiva interaccionista (Ostermann; Meneghel, 2012), con especial interés en investigaciones con un enfoque multimodal que puedan articular desde un trabajo descriptivo finamente detallado estudios del habla y del cuerpo (Mondada, 2018).

La expresión cuidado-en-interacción se origina de una matriz común en el Análisis Etnometodológico de la Conversación (Loder; Jung, 2008), una corriente investigativa originaria de la sociología norteamericana, derivada de la Etnometodología de Harold Garfinkel, que ha sido acogida mundialmente en múltiples áreas disciplinarias (Watson; Gastaldo, 2015), y que en los últimos diez años ha traído el habla-y-el-cuerpo-en-interacción como objeto de estudio.

Guiados por datos (Data driven), los análisis pueden movilizar y articular otras corrientes teóricas, que se centran en una multiplicidad de objetos y fenómenos, o sea, la polifonía y el dialogismo bakhtiniano, el análisis austiniano de los actos de habla, la gestión de imagen (face work) goffmaniana y la cortesía, señales de contextualización de naturaleza prosódica y justificaciones y teoría de la argumentación en el lenguaje.

Los estudios sobre el cuidado-en-interacción, desde la perspectiva del análisis etnometodológico de la conversación, se abren a un abanico de investigaciones sobre las interacciones en diferentes entornos y utilizando variados recursos. Como señala Harvey Sacks en su clásico estudio de conversaciones telefónicas grabadas por un centro de prevención del suicidio en Estados Unidos de América, y, por tanto, mediadas por un dispositivo tecnológico de comunicación a distancia, las investigaciones cuyo material recopilado no incluye todos los recursos multimodales disponibles en las interacciones cara a cara traen desafíos que refuerzan el gran potencial analítico de la actitud de mirar hacia adentro, considerando los dispositivos naturales y artificiales de mediación con el mundo.

Dos preguntas iniciales impulsaron este dossier: a) ¿Cómo se opera la interactividad en diferentes entornos y escenarios, especialmente respecto a los temas de salud? b) ¿De qué manera pueden los enfoques microanalíticos de los estudios sobre interacciones contribuir a la comprensión de los procesos sociales?

Fomentamos contribuciones de autores de diferentes áreas de las ciencias sociales, humanas y de la salud – con especial énfasis en las áreas de estudios de comunicación, lenguaje, antropología, trabajo social y sociología – para subejes temáticos como:

Asimetrías epistémicas, cognición situada, intercomprensión y emociones-en-interacción;
Estudios microanalíticos de marcos conversacionales de intervención social y sanitaria;
Interacciones de telepresencia, mediadas por computadoras multimodales (micrófono, altavoz, cámara web y pantalla);
Marcos interaccionales de prácticas de investigación conjunta y autoconfrontación en la formación de profesionales sociales y de salud;
Participación de los ciudadanos en dispositivos de análisis conjunta de prácticas de servicio y atención (ciencia ciudadana);
Interacciones atípicas en sus dimensiones interdisciplinarias de los estudios sociales de la discapacidad.

Editores invitados: Marcia Rodrigues Lisboa (Fundación Oswaldo Cruz – Laboratorio de Fenomenología, Etnometodología y Análisis Conversacional de la Clusividad Social – Lab-FEACC_CLISSIS) y Michel Binet (Universidade Lusíada – Laboratorio de Fenomenología, Etnometodología y Análisis Conversacional de la Clusividad Social – Lab-FEACC_CLISSIS)

Plazo de presentación: hasta el 20 de febrero de 2024.

Estimación de publicación: v. 18, núm. 2, abril/junio de 2024.

Al enviar el trabajo, utilice la categoría Dossier Cuidados-en-interacción: prácticas, conocimientos y reflexividad en salud.

Referencias

LODER, Letícia Ludwig; JUNG, Neiva Maria (orgs). Fala-em-interação social: introdução à análise da conversa etnometodológica. Campinas: Mercado de Letras, 2008.

MONDADA, Lorenza. Multiple temporalities of language and body in interaction: challenges for transcribing multimodality. Research on Language and Social Interaction, Estados Unidos, v. 51, n. 1, p. 85-106, 2018. DOI: https://doi.org/10.1080/08351813.2018.1413878. Disponible en: https://www.tandfonline.com/doi/full/10.1080/08351813.2018.1413878, Acceso en: 25 out. 2023.

OSTERMANN, Ana Cristina; MENEGHEL, Stela Nazareth (orgs). Humanização Gênero Poder: contribuições dos estudos de fala-em-interação para a atenção à saúde. Campinas: Mercado de Letras; Rio de Janeiro: Fiocruz, 2012.

RODRIGUES, Adriano Duarte. A natureza da atividade comunicativa. Lisboa: Lisbon Press, 2021.

WATSON, Rod; GASTALDO, Édison. Etnometodologia e análise da conversa. Petrópolis: Vozes: PUC-Rio, 2015.

Usar Python para detectar noticias falsas sobre covid-19: desafíos y posibilidades

Autores/as

DOI:

Palabras clave:

Resumen

Biografía del autor/a

Fernanda Vasques Ferreira, Centro Universitário Senai Cimatec, Faculdade de Tecnologia. Salvador, BA, Brasil. Universidade Federal do Oeste da Bahia, Centro Multidisciplinar de Santa Maria da Vitória. Santa Maria da Vitória, BA

Rafiza Varão, Universidade de Brasília, Faculdade de Comunicação. Brasília, DF

Marco Aurélio Boselli, Universidade Federal de Uberlândia, Instituto de Física. Uberlândia, MG

Leandro Brito Santos, Universidade Federal do Oeste da Bahia, Centro Multidisciplinar de Bom Jesus da Lapa. Bom Jesus da Lapa, BA

Marcelo A. Moret, Centro Universitário Senai Cimatec, Faculdade de Tecnologia. Salvador, BA, Brasil. Universidade do Estado da Bahia. Salvador, BA

Citas

Descargas

Publicado

Cómo citar

Número

Sección

Licencia

Idioma

Qualis

Redes sociais

Avisos

Dossier Cuidados-en-interacción: prácticas, conocimientos y reflexividad en salud (v. 18, n. 2) Abr./Jun. 2024

Prorrogação - Dossiê O Povo da rua: saúde, políticas públicas e comunicação

Palabras clave

Número actual

Enviar un artículo

Indexadores e avaliadores

Información