Saltar al contenido

Los investigadores diseñan una red neuronal para predecir la gravedad de las variantes de COVID-19


Las redes neuronales profundas se están volviendo cada vez más populares en más y más industrias, y si bien los desarrollos recientes en redes diseñadas para jugar Go y videojuegos en línea han despertado la atención de los medios, el uso de estas redes en la investigación también está ganando terreno.

Más recientemente, un grupo de investigadores de la Universidad de Drexel ha construido una red neuronal diseñada para predecir el riesgo de infección por la enfermedad grave por coronavirus 2019 (COVID-19) a partir de la secuencia de la proteína espiga. Este estudio está actualmente disponible en el Plaza de investigación* servidor de preimpresión.

Estudiar: Un modelo de aprendizaje profundo interpretable para predecir el riesgo de COVID-19 grave a partir de la secuencia de proteína Spike. Crédito de la imagen: Terelyuk/Shutterstock

El estudio

*Noticia importante: Plaza de investigación publica informes científicos preliminares que no son revisados ​​por pares y, por lo tanto, no deben considerarse concluyentes, guiar la práctica clínica/el comportamiento relacionado con la salud ni tratarse como información establecida.

El objetivo de los investigadores era traducir los datos de la secuencia al fenotipo viral utilizando modelos de redes neuronales profundas. El modelo se puede entrenar para predecir la función de una secuencia de aminoácidos que se codifican con palabras en una oración en modelos de procesamiento de lenguaje y luego asignarles tokens enteros.

La arquitectura del transformador se utilizó para la codificación de secuencias. El Transformador es una estructura modular de varios cabezales, con cada cabezal compuesto por una capa de atención y una red neuronal de avance, con salidas de cabezal añadidas y normalizadas para proporcionar una codificación de secuencia. Se utiliza una red neuronal convolucional (CNN) con un ancho de kernel de 1; esto ayuda a reducir el tamaño de los cabezales del transformador y mantener la eficiencia de los cálculos.

Las redes neuronales a menudo brindan predicciones precisas, pero puede ser difícil explicar cómo se crearon estas predicciones. Los científicos agregaron una capa de atención directa y una capa intermedia conectada a la dimensión NH para ayudar a clasificar, visualizar e interpretar las predicciones.

El modelo se entrenó en una fracción de datos de secuencias GISAID que contenían metadatos sobre el estado del paciente: alrededor de 147 000 muestras. Una vez que se eliminaron todas las muestras que no se pudieron asignar a leves o graves, quedaron aproximadamente 54 000 muestras. Para crear un modelo preciso, los investigadores se vieron obligados a incluir datos demográficos, incluidos la edad y el sexo, ya que estos pueden alterar significativamente el resultado previsto de la infección por COVID-19.

No se encontraron tendencias consistentes con respecto a los extremadamente jóvenes/viejos, y a los científicos les preocupaba que el sesgo de muestreo pudiera sesgar estos datos: con relativamente pocas muestras de jóvenes y viejos, podría ser más probable que solo se muestrearan personas hospitalizadas.

Se encontró que una tendencia constante en la frecuencia de resultados graves de infección se relaciona con la fecha de recolección de la muestra, con una fuerte disminución desde febrero de 2021. Esta tendencia continúa a lo largo del tiempo, incluso cuando surgen nuevas variantes y se vuelven dominantes, lo que contradice los estudios que muestran que la variante Alpha resulta en un aumento de hospitalizaciones y admisiones en la UCI. Esta reducción de la gravedad probablemente se deba a los cambios en el tratamiento de las personas infectadas y al aumento de las tácticas de prevención, así como a la aparición de tratamientos con anticuerpos monoclonales, así como al inicio de los programas de vacunación masiva.

Los investigadores también encontraron que los datos de la secuencia se vieron afectados por el área en la que se obtuvieron las secuencias; las secuencias obtenidas antes en la pandemia tenían más probabilidades de clasificarse como graves, a pesar de que no aumentaban los síntomas.

El modelo de aprendizaje profundo pudo predecir una proporción significativa de clases leves y graves, y cuando las secuencias y los datos demográficos se incluyeron en el modelo, las predicciones mejoraron significativamente. Cuando se comparó el modelo de aprendizaje profundo con un algoritmo de bosques aleatorios (RF), se descubrió que el modelo de aprendizaje profundo cometía errores a una tasa similar, lo que es impresionante para un modelo desarrollado recientemente. Desafortunadamente, el modelo no pudo detectar una diferencia significativa entre las tasas de gravedad entre los géneros, a pesar de que varios estudios muestran una enfermedad más grave en los hombres.

Los investigadores intentaron utilizar el modelo para predecir la gravedad de la variante Omicron. Después de controlar la edad y la fecha, el modelo entrenado se ejecutó con las mismas entradas de edad, fecha y género que las predicciones para las otras variantes a fin de comparar su gravedad. El modelo predijo una gravedad significativamente menor que Delta, un hallazgo respaldado por las observaciones de varios trabajadores de la salud e investigadores.

Los sitios con la mayor diferencia de atención, lo que implica una relevancia particular en la predicción de la gravedad, incluyeron 69-70, una deleción de Omicron, 95, donde la mutación Delta tiene la mutación T951, así como varios otros sitios de mutaciones clave que se encuentran en las variantes más graves. de preocupación

Conclusión

Los autores destacan que han creado con éxito un modelo que puede hacer predicciones precisas y validadas para la variante de Omicron, a pesar de que Omicron es significativamente diferente de la mayoría de las variantes anteriores.

Señalan que este es un argumento sólido para el uso del modelo en la predicción del comportamiento de variantes futuras y podría ayudar a informar a los trabajadores de la salud y a los encargados de formular políticas de salud pública sobre el impacto de cualquier variante futura que surja.

*Noticia importante: Plaza de investigación publica informes científicos preliminares que no son revisados ​​por pares y, por lo tanto, no deben considerarse concluyentes, guiar la práctica clínica/el comportamiento relacionado con la salud ni tratarse como información establecida.

RSS
Follow by Email
YouTube
Pinterest
LinkedIn
Share
WhatsApp