Caracterización del repertorio de linfocitos T en Covid-19: un enfoque bioinformático para la estratificación de pacientes Marín Benesiu, Fernando Álvarez Cubero, María Jesús Martínez González, Luis Javier Universidad de Granada. Programa de Doctorado en Bioquímica y Biología Molecular La COVID-19, enfermedad provocada por el SARS-CoV-2, ha causado un evento pandémico sin precedentes. Una de las características clínicas más relevantes de la COVID-19 es su amplio espectro sintomatológico, que abarca desde un desarrollo asintomático de la enfermedad hasta cuadros críticos y fatales. Por esta razón, la investigación clínica y biomédica ha centrado esfuerzos en el desarrollo de nuevos tratamientos farmacológicos, vacunas y en encontrar biomarcadores inmunológicos capaces de no solo estratificar a pacientes, sino de anticiparse al desarrollo grave de la COVID-19. En ese contexto la función de los linfocitos T es esencial. Los linfocitos T actúan directamente sobre el virus y coordinando al resto de células del sistema inmunitario y se caracterizan por la persistencia en la respuesta durante la infección y la versatilidad en reaccionar adecuadamente frente a diferentes variantes del SARS-CoV-2. Estas propiedades se deben, entre otros factores al gran número de linfocitos T distintos si se toma como referencia la alta variabilidad de la secuencia de aminoácidos de la región determinante de la complementariedad 3(CDR3) del Receptor de Linfocitos T (TCR), responsable del reconocimiento de antígenos. El conjunto de TCRs distintos y funcionales presentes en un individuo se lo conoce como repertorio de TCR o de linfocitos T y cambios en sus dinámicas poblacionales están estrechamente asociadas con el pronóstico de la enfermedad. Gracias al auge de la inmunoinformática, la caracterización del repertorio de linfocitos T puede abordarse de forma rápida y precisa. Así, en esta tesis doctoral se ha estudiado el repertorio de linfocitos T en pacientes COVID-19 no vacunados, con el objetivo de lograr una estratificación robusta entre pacientes con distinto pronóstico. Para ello se ha realizado un abordaje bioinformático en diferentes modalidades (dinámicas poblacionales, agrupamiento de secuencias CDR3 e identificación de subfenotipos mediante la integración de datos), los cuales han sido divididos en dos estudios. En el primer estudio se caracterizó al repertorio de linfocitos T mediante la secuenciación y posterior análisis bioinformático del TCR (TCRseq) sobre una cohorte de nueva creación de 173 pacientes, incluyendo 98 casos leves y 75 graves y con una edad media de 53 años. Específicamente, se amplificó y secuenció la región determinante de complementariedad 3 de la cadena β del TCR (CDR3b) y se realizaron análisis bioinformáticos para evaluar la diversidad del repertorio, la clonalidad y el uso de alelos V/J según edad, sexo y gravedad. Los resultados mostraron una reducción significativa en la diversidad del repertorio TCR y un aumento en la expansión clonal en pacientes graves menores de 55 años, reflejando tendencias similares a las observadas en pacientes mayores de 55 años, tanto leves como graves. Por otro lado, los análisis de frecuencia de alelos V y J identificaron una reducción en el uso de alelos V clave (TRBV14, TRBV19, TRBV15 y TRBV6-4) asociados con la gravedad de la enfermedad, y se observó que los pacientes graves menores de 55 años presentaban patrones alélicos similares a los de los mayores de 55, junto con una frecuencia sesgada de motivos estructurales reactivos a antígenos del SARS-CoV-2. Por tanto, los resultados obtenidos del primer estudio sugieren que los pacientes graves menores de 55 años podrían tener un repertorio de linfocitos T comprometido, propio al de una persona mayor, lo que contribuiría a un peor pronóstico. El segundo estudio integró la información obtenida del análisis TCRseq con información sobre la respuesta inmunológica innata (conteo de subpoblaciones de monocitos y macrófagos mediante citometría de masas), genotipos de Polimorfismos de Nucleótido Unico (SNPs) asociados a la infección por SARSCoV- 2 y datos sintomatológicos. Se analizó una subcohorte de 61 pacientes (33 leves y 28 graves) que contaban con estos datos junto con los obtenidos mediante TCRseq, con el objetivo de identificar subgrupos de pacientes (subfenotipos) no identificados por el criterio clínico inicial, y así lograr una estratificación robusta de los pacientes. Para ello, utilizamos el algoritmo Latent Class Model con Bayesian Information Criterion (LCM-BIC). Además, se aplicaron técnicas de aprendizaje profundo (deep learning) para examinar las firmas de aminoácidos con potencial valor pronóstico en la región CDR3b de la cadena β del TCR. Los resultados identificaron tres subgrupos de pacientes (Clusters 1, 2 y 3) a partir de 70 variables relevantes seleccionadas por BIC, con diferencias significativas en la clasificación de casos leves y graves. El Clúster 1 mostró un mayor predominio de casos graves, mientras que los clusters 2 y 3 presentaban distribuciones diferenciadas en variables clave como subpoblaciones de monocitos, diversidad del TCR, uso de alelos V y motivos de secuencia. El análisis de deep learning permitió distinguir con precisión el Clúster 1 de los otros dos, destacando la presencia de un gran número de secuencias CDR3b con alto valor predictivo, reactivas a SARS-CoV-2 y asociadas a distintos niveles de gravedad de la enfermedad. Esta capacidad de distinción no se observó cuando las muestras fueron divididas entre leves y graves, siguiendo la clasificación inicial. Con todo ello, en esta tesis doctoral se ha conseguido por un lado dar una descripción de la arquitectura del repertorio de linfocitos T en una cohorte representativa, teniendo en cuenta la complejidad y la alta variabilidad de repertorios entre muestras. Por otro lado, también se ha conseguido abordar una estratificación de pacientes COVID-19 robusta, capaz detectar secuencias hipervariables del TCR reactivas al SARS-CoV-2 con potencial valor en la reclasificación de pacientes. Aun cuando es necesario realizar futuros estudios que confirmen los hallazgos a nivel bioinformático y laboratorio, este trabajo constituye un punto de partida a nuevas aproximaciones que consigan un mejor entendimiento de la respuesta inmunológica de la COVID-19 y de patologías futuras. 2026-02-02T08:17:25Z 2026-02-02T08:17:25Z 2026 2025-07-11 doctoral thesis Marín Benesiu, Fernando. Caracterización del repertorio de linfocitos T en Covid-19: un enfoque bioinformático para la estratificación de pacientes. Granada: Universidad de Granada, 2025. [https://hdl.handle.net/10481/110569] 9788411959667 https://hdl.handle.net/10481/110569 spa http://creativecommons.org/licenses/by-nc-nd/4.0/ open access Attribution-NonCommercial-NoDerivatives 4.0 Internacional Universidad de Granada