QUINTA
CIENTÍFICA

DIA 06 Abril

Desafios e oportunidades para a saúde pública possibilitados pelos avanços no processamento de linguagem natural

Este texto é baseado na resenha do seguinte artigo: Baclic, O., Tunis, M., Young, K., Doan, C., & Swerdfeger, H. (2020). Challenges and opportunities for public health made possible by advances in natural language processing. Canada Communicable Disease Report, 161–168. https://doi.org/10.14745/ccdr.v46i06a02

Introdução

Este artigo aborda o crescente interesse em utilizar a inteligência artificial (IA) como uma ferramenta para melhorar a saúde pública. Com a disponibilidade de novos conjuntos de dados, ferramentas de vigilância e modelos, o Processamento de Linguagem Natural (PLN) surge como uma opção promissora para solucionar problemas no sistema de saúde oferecido à população.

O objetivo deste trabalho é avaliar as possibilidades de aplicação do PLN em saúde pública. Para isso, o artigo oferece uma breve introdução à IA e ao PLN, destacando as oportunidades em que o PLN pode ser aplicado na área. Além disso, são discutidos os desafios enfrentados na aplicação do PLN em saúde pública, bem como os riscos associados à incorporação de IA/NLP na análise de saúde pública e apoio à tomada de decisão.

Ao final, são apresentadas algumas recomendações para o desenvolvimento de pesquisas futuras que visem aprimorar o uso do PLN em saúde pública.

Inteligência Artificial e Processamento de Linguagem Natural

A Inteligência Artificial e o Processamento de Linguagem Natural são áreas da computação que têm se destacado no avanço da saúde pública e medicina. A IA cria sistemas capazes de realizar tarefas complexas que exigiriam inteligência humana, enquanto o PLN permite o uso da linguagem de forma similar à humana. Na saúde pública e na medicina, a comunicação é essencial e o PLN é vital para desbloquear o potencial da IA.

Os modelos de PLN modernos são baseados em técnicas de aprendizado de máquina refinadas, como o deep learning, que impulsionou avanços significativos na área de PLN. Esses modelos foram aprimorados por meio de inovações em vários tipos, permitindo que os sistemas capturassem e modelassem relacionamentos e conceitos linguísticos mais complexos do que apenas a presença de palavras-chave. Além disso, o pré-processamento dos dados usando abordagens de incorporação de vetores ajudou a tratar as palavras como entidades que existem em um contexto, reconhecendo que seus significados podem variar dependendo desse contexto.

Na saúde, a IA pode ler e fazer a triagem de milhões de artigos de pesquisa, analisar comentários de usuários das redes sociais e interagir com as pessoas em busca de respostas para suas questões e problemas de saúde. Já o PLN possibilita a análise de informações não estruturadas, respostas automáticas a perguntas e verificação de sentimentos. As plataformas modernas são baseadas em modelos refinados que envolvem um modelo, dados, uma função de perda e um algoritmo para treinamento.

O PLN também tem o potencial de melhorar as atividades de promoção da saúde, envolvendo indivíduos e fornecendo suporte ou aconselhamento personalizado. A capacidade dos métodos de PLN de prever a presença de depressão antes de seu aparecimento no registro médico é um exemplo de seu potencial na área da saúde. Além disso, a busca de publicações científicas em tempo real oferece oportunidades para os tomadores de decisão realizarem rapidamente recomendações sobre prevenção ou gerenciamento de doenças.

Oportunidades do uso do PLN na saúde pública

A área da saúde pública tem como objetivo alcançar resultados ideais de saúde em diferentes populações, por meio do desenvolvimento e implementação de intervenções que se concentram em causas modificáveis de problemas de saúde. Para atingir esse objetivo, é fundamental quantificar a carga de doenças ou fatores de risco de doenças na população e, posteriormente, identificar grupos afetados ou em risco desproporcional. A tomada de decisão baseada em evidências é normalmente fundamentada na revisão e síntese sistemática e abrangente de dados de acordo com os elementos da estrutura PICO (Paciente/Problema, Intervenção/Exposição, Comparação, Resultado).

Com a explosão de informações sendo produzidas e publicadas a uma velocidade sem precedentes em diversas fontes, incluindo literatura científica, relatórios técnicos, registros de saúde, mídias sociais, pesquisas e outros documentos, a capacidade de análise eficiente de grandes volumes de texto não estruturado ou semiestruturado oferecida pelo PNL tem possibilitado imensas oportunidades para pesquisa baseada em texto e tomada de decisão baseada em evidências na área da saúde pública.

O PNL está emergindo como uma ferramenta potencialmente poderosa para apoiar a rápida identificação de populações, intervenções e resultados de interesse para vigilância de doenças, prevenção de doenças e promoção da saúde. Por exemplo, plataformas de PNL capazes de detectar características específicas de indivíduos (como população/problema – como uma condição médica ou um fator de risco biológico, comportamental, ambiental ou socioeconômico predisponente) em registros médicos não estruturados ou texto de mídia social podem ser usadas para aprimorar os sistemas de vigilância existentes com evidências do mundo real.

O PNL tem proporcionado grandes oportunidades para pesquisa baseada em texto e tomada de decisão baseada em evidências na área da saúde pública, permitindo a análise rápida de grandes quantidades de informações. Isso tem impulsionado avanços significativos, como a capacidade de identificar rapidamente populações, intervenções e resultados de interesse necessários para vigilância de doenças, prevenção de doenças e promoção da saúde. Além disso, o PNL também tem sido usado para prever a presença de doenças antes de seu registro médico, permitindo uma intervenção mais rápida e eficaz. As plataformas de resposta a perguntas e chatbots com tecnologia NLP têm o potencial de melhorar as atividades de promoção da saúde, fornecendo suporte ou aconselhamento personalizado. Selecionamos exemplos de aplicações que os autores trouxeram no trabalho:

Identificação de surtos de doenças: a análise de textos não estruturados ou semiestruturados de registros eletrônicos de saúde ou mídias sociais pode ajudar a medir a incidência e prevalência de doenças e fatores de risco.
Identificação de intervenções em saúde: o PLN pode realizar uma revisão sistemática automatizada de análises das informações contidas em publicações científicas e ser um instrumento para o desenvolvimento de recomendações de intervenções em saúde pública.
Identificação de reações adversas a medicamentos: por meio da coleta de informações de mídias sociais, é possível utilizar o PLN para identificar o aumento de relatos de eventos adversos de determinados medicamentos.
Varredura de informações sobre eventos específicos: a análise de conteúdo realizada pelo PLN permite a detecção de atividades importantes durante eventos críticos para auxiliar na tomada de decisão em tempo real. Um exemplo recente foi o uso do PLN durante a pandemia de COVID-19 para apoiar as comunidades médicas e científicas na busca por respostas para questões de pesquisa e para rastreamento de informações.

Desafios no uso do PLN

Disponibilidade e qualidade dos conjuntos de dados: o sucesso do uso de técnicas de PLN na saúde depende da disponibilidade de conjuntos de dados devidamente coletados e de alta qualidade. Esses dados são fundamentais para treinar e implementar modelos robustos. No entanto, muitas vezes é difícil obter acesso irrestrito a bancos de dados de cuidados primários/hospitalares que lidam com conceitos de saúde pública.

Viés dos dados: é importante que os modelos de PLN na saúde pública sejam treinados de forma a eliminar o viés dos dados, mas isso nem sempre é possível. Mesmo quando os conjuntos de dados e as avaliações são ajustados para vieses, isso não garante um impacto igual nos estratos moralmente relevantes. Por exemplo, o uso de dados de saúde disponíveis por meio de plataformas de mídia social deve levar em conta a idade específica e os grupos socioeconômicos que os utilizam.

Acesso limitado aos dados: um dos maiores obstáculos para o desenvolvimento de sistemas de PNL na saúde pública é o acesso limitado aos dados. No Canadá, por exemplo, os dados de saúde são geralmente controlados regionalmente e há relutância em fornecer acesso irrestrito a esses sistemas e sua integração com outros conjuntos de dados, devido a questões de segurança e confidencialidade. Além disso, também há desafios com a percepção pública de privacidade e acesso aos dados.

Questões de segurança e privacidade: o uso de dados de saúde em sistemas de PLN levanta preocupações em relação à segurança e privacidade das informações do paciente. É importante garantir que todas as informações de identificação pessoal sejam removidas antes que os dados sejam utilizados para treinar modelos de PLN. Também é crucial garantir que as informações do paciente não sejam acessadas ou compartilhadas sem o seu consentimento explícito.

Falta de compreensão de como os modelos de PLN tomam decisões: outro desafio é a falta de compreensão de como os modelos de PLN tomam decisões. É importante garantir que os modelos sejam transparentes e explicáveis, a fim de que os profissionais de saúde e os pacientes possam confiar nas decisões tomadas pelos modelos. Além disso, a explicabilidade dos modelos também é crucial para garantir que os modelos não estejam perpetuando vieses ou discriminando certos grupos

Conclusão

Neste texto, foi abordado o potencial Processamento de Linguagem Natural (PLN) na análise de dados em saúde pública. A tecnologia de PNL oferece oportunidades extraordinárias para aprimorar a tomada de decisão baseada em evidências na saúde pública. Prevê-se que a aplicação mais ampla do PNL leve à criação de sistemas de vigilância mais eficientes, capazes de identificar doenças e condições de risco em tempo real, assim como facilitar atividades direcionadas de promoção da saúde e prevenção de doenças, potencialmente levando a uma redução das doenças em toda a população e maior equidade na saúde.

Contudo, essas oportunidades não vêm sem riscos. Modelos tendenciosos, dados tendenciosos, perda de privacidade de dados e a necessidade de manter e atualizar modelos para refletir a evolução da linguagem e do contexto da comunicação pública são desafios a serem abordados. Por isso, incentivamos as comunidades de saúde pública e ciência da computação a colaborar e trabalhar juntas para mitigar esses riscos. Dessa forma, garantimos que a prática da saúde pública não fique para trás nessas tecnologias e que não se percam oportunidades de promoção da saúde, vigilância e prevenção de doenças neste cenário em rápida evolução.

Por que indicamos esse artigo:

Indicamos esse artigo porque ele traz exemplos de aplicações de Processamento de Linguagem Natural e Inteligência Artificial à saúde pública. Além de destacar as oportunidades de aplicação do PLN à saúde pública, o artigo debate os desafios e riscos associados à aplicação desse tipo de tecnologia, o que é fundamental para aqueles que estão interessados em incorporar modelos para analisar dados. O artigo oferece exemplos específicos e atuais para ilustrar a amplitude de possíveis aplicações de PLN em saúde pública, demonstrando a relevância dessa abordagem para enfrentar problemas complexos no campo.

Cristina (Tina) Guimarães
Políticas públicas e advocacy em saúde

Profissional com sólida formação acadêmica na área de Demografia da Saúde, experiência acadêmica e de pesquisa na área de saúde populacional com grupos de advocacy e quase 10 anos de experiência em trabalhos de pesquisa e consultoria em políticas de saúde no Brasil e no exterior, Tina Guimarães fundou sua própria consultoria em janeiro de 2020. Seu trabalho é centrado nos pilares de ampliação do conhecimento, por meio de cursos e treinamentos, e projetos de consultoria personalizados, centrados no trabalho em rede para a mudança política.

Tina Guimarães é Bacharel em Economia pela Universidade Federal de Minas Gerais (UFMG), Doutora em Demografia pelo Cedeplar/UFMG e Pós-Doutora pela Universidade de São Paulo. É também professora de Políticas de Saúde no MBA de Economia e Avaliação de Tecnologias de Saúde da FIPE. Dentre suas experiências anteriores como docente ainda estão: EAD em Políticas de Saúde no MBA de Pesquisa Clínica do Hospital Alemão Oswaldo Cruz (PROADI-SUS); Professora no MBA de Avaliação de Tecnologias em Saúde do Hospital Alemão Oswaldo Cruz (PROADI-SUS),no MBA de Gestão Atuarial da FIPECAFI e professora de Demografia no Curso de Ciências Atuariais da Universidade de São Paulo.

QUINTA CIENTÍFICA

DIA 06 Abril

Desafios e oportunidades para a saúde pública possibilitados pelos avanços no processamento de linguagem natural

Desafios e oportunidades para a saúde pública possibilitados pelos avanços no processamento de linguagem natural

Cristina (Tina) GuimarãesPolíticas públicas e advocacy em saúde

Cristina (Tina) GuimarãesPolíticas públicas e advocacy em saúde

QUINTA
CIENTÍFICA

Cristina (Tina) Guimarães
Políticas públicas e advocacy em saúde

Cristina (Tina) Guimarães
Políticas públicas e advocacy em saúde