Un grupo internacional de investigación, coliderado por el Instituto de Biología Integrativa de Sistemas (I2SysBio), centro mixto del Consejo Superior de Investigaciones Científicas (CSIC) y la Universitat de València (UV), ha publicado el mayor estudio comparativo hasta la fecha sobre los métodos para analizar datos obtenidos por secuenciación de lectura larga del transcriptoma humano. Los resultados, publicados en Nature Methods, ofrecen nuevas perspectivas sobre la diversidad del ARN y sus implicaciones en la enfermedad y el envejecimiento.
El estudio, impulsado por el Proyecto de Evaluación de Anotación del Genoma de Lectura Larga de ARN-Seq (LRGASP), evaluó diversas tecnologías y herramientas informáticas para la secuenciación de lectura larga del ARN, una técnica que permite observar moléculas completas de ARN y detectar pequeños cambios críticos en la formación de proteínas. Estos cambios son esenciales para la constitución de organismos complejos como los humanos y están asociados con diversas enfermedades.
Ana Conesa, profesora de investigación del CSIC en el I2SysBio y una de las líderes del consorcio, explicó que, aunque el genoma humano ha sido secuenciado, aún se enfrentan desafíos significativos para definir cómo los genes generan la diversidad de moléculas de ARN y proteínas que forman un ser vivo. «Este conocimiento es vital porque pequeños cambios en el paso de ADN a ARN pueden causar patologías», señaló Conesa.
El estudio, que generó más de 427 millones de secuencias de lectura larga, analizó datos de humanos, ratones y manatíes. Este último permitió probar métodos en una especie sin un genoma de referencia, destacando la importancia de evaluar técnicas en especies no modelo, cada vez más comunes en estudios de secuenciación larga de ARN.
Francisco J. Pardo Palacios, investigador predoctoral del I2SysBio y primer firmante del estudio, subrayó que la falta de información previa en estas especies puede afectar directamente los resultados del análisis.
El consorcio encontró una diversidad de ARN mayor de lo esperado, descubriendo una cantidad significativa de transcritos no documentados en los genomas humanos y de ratones. «Cada individuo, incluso cada célula, tiene un transcriptoma propio y personal», resumió Conesa. Este hallazgo plantea nuevas preguntas sobre la relevancia de esta diversidad en la enfermedad, el envejecimiento y la diversidad de especies.
El estudio concluye que no existe un enfoque único ideal para la secuenciación de lectura larga de ARN. Las recomendaciones producidas varían según los objetivos de cada estudio, ya que las diferentes tecnologías presentan diferencias en tasas de error, rendimiento de secuenciación y longitud de lectura.
Angela Brooks, investigadora de la Universidad de California Santa Cruz y coautora del estudio, destacó que los resultados ayudarán a mejorar aún más la tecnología, señalando que «todavía hay margen de mejora en muchos de estos métodos».
El trabajo del I2SysBio y sus colaboradores establece una nueva base para la investigación futura en secuenciación de ARN, con potenciales aplicaciones significativas en la comprensión y tratamiento de diversas enfermedades y en el estudio del envejecimiento y la diversidad biológica.
fecha: