Secuenciación paralela de ADN circular extracromosómico y transcriptomas en células cancerosas individuales

Noticias

HogarHogar / Noticias / Secuenciación paralela de ADN circular extracromosómico y transcriptomas en células cancerosas individuales

Jun 09, 2023

Secuenciación paralela de ADN circular extracromosómico y transcriptomas en células cancerosas individuales

Genética de la naturaleza volumen 55,

Nature Genetics volumen 55, páginas 880–890 (2023)Citar este artículo

8707 Accesos

159 Altmetric

Detalles de métricas

Los ADN extracromosómicos (ADNec) son comunes en el cáncer, pero aún quedan por resolver muchas preguntas sobre su origen, dinámica estructural e impacto en la heterogeneidad intratumoral. Aquí describimos el ADN circular extracromosómico de una sola célula y la secuenciación del transcriptoma (scEC&T-seq), un método para la secuenciación paralela de ADN circular y ARNm de longitud completa de células individuales. Al aplicar scEC&T-seq a las células cancerosas, describimos las diferencias intercelulares en el contenido de ecDNA mientras investigamos su heterogeneidad estructural y su impacto transcripcional. Los ecDNA que contienen oncogenes estaban clonalmente presentes en las células cancerosas y provocaban diferencias en la expresión de oncogenes intercelulares. Por el contrario, otros ADN circulares pequeños eran exclusivos de células individuales, lo que indica diferencias en su selección y propagación. Las diferencias intercelulares en la estructura de ecDNA apuntaron a la recombinación circular como un mecanismo de evolución de ecDNA. Estos resultados demuestran que scEC&T-seq es un enfoque para caracterizar sistemáticamente el ADN circular pequeño y grande en las células cancerosas, lo que facilitará el análisis de estos elementos de ADN en el cáncer y más allá.

La medición de múltiples parámetros en las mismas células es clave para comprender con precisión los sistemas biológicos y sus cambios durante las enfermedades1. En el caso de los ADN circulares, es fundamental integrar la información de la secuencia de ADN con las mediciones de salida transcripcional para evaluar su impacto funcional en las células. Se pueden distinguir al menos tres tipos de ADN circular en las células humanas2,3,4,5: (1) ADN circular pequeño (<100 kb)6, que se ha descrito con diferentes nombres, incluidos ADN ecc6, microADN4, ADN circular apoptótico6, ADN pequeño ADNs circulares polidispersos7 y ADNs circulares teloméricos o C-círculos8; (2) círculos de escisión del receptor de células T (TREC)9; y (3) grandes (>100 kb), oncogénicos, ADN extracromosómicos circulares amplificados por el número de copias10,11 (denominados ADNec y visibles como cromosomas de dos minutos durante la metafase12). A pesar de nuestra creciente capacidad para caracterizar múltiples características en células individuales13, una caracterización profunda del contenido, la estructura y la secuencia del ADN circular en células individuales sigue siendo difícil de lograr con los enfoques actuales.

En el cáncer, las amplificaciones de oncogenes en ecDNA son de particular interés porque impulsan de manera potente la heterogeneidad del número de copias intercelulares a través de su capacidad única para replicarse y segregarse de manera desigual durante la mitosis14,15,16,17,18,19. Esta heterogeneidad permite que los tumores se adapten y evadan las terapias2,20,21,22. De hecho, los pacientes con cánceres que albergan ecDNA tienen resultados clínicos adversos11. Investigaciones recientes indican que los ecDNA que contienen potenciadores interactúan entre sí en centros nucleares17,23 y pueden influir en ubicaciones cromosómicas distantes en trans23,24. Esto sugiere que incluso los ecDNA que no albergan oncogenes pueden ser funcionales23,24. Además, recientemente revelamos que los tumores albergan un repertorio inesperado de ADN circulares más pequeños, con un número de copias neutral y una relevancia funcional aún desconocida3.

En este estudio, informamos la secuenciación del transcriptoma y el ADN circular extracromosómico de una sola célula (scEC&T-seq), un método que permite la secuenciación paralela de todos los tipos de ADN circular, independientemente de su tamaño, contenido y número de copias, y el ARNm de longitud completa en un único células. Demostramos su utilidad para perfilar células cancerosas individuales que contienen ADNec multifragmentados estructuralmente complejos y ADN circulares pequeños.

Los enfoques actuales de purificación de ADN circular de última generación implican tres pasos secuenciales, es decir, el aislamiento del ADN seguido de la eliminación del ADN lineal a través de la digestión con exonucleasa y el enriquecimiento del ADN circular mediante la amplificación del círculo rodante3,6,25. Razonamos que este enfoque puede reducirse a células individuales y, cuando se combina con Smart-seq2 (ref. 26), puede permitir la secuenciación paralela de ADN circular y ARNm. Para comparar nuestro método en células individuales, utilizamos líneas celulares de cáncer de neuroblastoma, que previamente habíamos caracterizado en poblaciones a granel3. Usamos FACS para separar las células en placas de 96 pocillos (Fig. 1a, Fig. 1a, by Suplementario 1a, b y Tabla Suplementaria 1). El ADN se separó del ARN poliadenilado, que se capturó en perlas magnéticas acopladas a secuencias monocatenarias de cebadores de desoxitimidina (Oligo dT), de manera similar a enfoques anteriores27. El ADN se sometió a digestión con exonucleasa, como se realizó con éxito en poblaciones de células a granel en el pasado, para enriquecer el ADN circular3,6,25 (Fig. 1b). El ADN sometido a la endonucleasa PmeI antes de la digestión con exonucleasa sirvió como control negativo3. En un subconjunto de casos, el ADN se dejó sin digerir como control adicional (Fig. 1b). Se amplificó el ADN remanente después de los diferentes regímenes de digestión. El ADN amplificado se sometió a la secuenciación de extremos emparejados de Illumina y, en algunos casos, a la secuenciación Nanopore de lectura larga (Fig. 1a). Se analizó la composición de la secuencia de los ADN circulares y se infirió el origen genómico en regiones circularizadas utilizando algoritmos computacionales previamente establecidos para el análisis de ADN circular3.

a, Esquema del método scEC&T-seq. b, Representación esquemática de las condiciones experimentales y los resultados esperados. c, seguimientos del genoma que comparan las densidades de lectura en mtDNA (chrM) en tres células CHP-212 de ejemplo para cada condición experimental probada. De arriba a abajo, sin digestión (púrpura), digestión con exonucleasa de 1 día (verde claro), digestión con exonucleasa de 5 días (verde oscuro) y digestión con endonucleasa con PmeI antes de la digestión con exonucleasa de 5 días (gris). d, Fracción de lecturas de secuenciación asignadas a mtDNA en cada condición experimental en células CHP-212 (roja) y TR14 (azul). e, Fracción de lecturas de secuenciación asignadas a regiones circulares de ADN identificadas por scEC&T-seq en cada condición experimental en células CHP-212 y TR14. f, Fracción de lecturas de secuenciación asignadas a regiones circulares de ADN con la endonucleasa PmeI dirigida a la secuencia identificada por scEC&T-seq en cada condición experimental en células CHP-212 y TR14. d–f, el tamaño de la muestra es idéntico en todas las condiciones: sin digestión (n = 16 células TR14, n = 28 células CHP-212); Digestión con exonucleasa de 1 día (n = 37 células TR14, n = 31 células CHP-212); digestión con exonucleasa de 5 días (n = 25 células TR14, n = 150 células CHP-212); y digestión con endonucleasa con PmeI antes de la digestión con exonucleasa de 5 días (n = 6 células TR14, n = 12 células CHP-212). Todos los análisis estadísticos corresponden a una prueba t de Welch bilateral. Se muestran los valores de P. En todos los diagramas de caja, las cajas representan los percentiles 25 y 75 con la barra central como el valor de la mediana y los bigotes que representan el valor atípico más lejano ≤1,5 ​​× el rango intercuartílico (RIC) de la caja.

Datos fuente

Para evaluar el rendimiento de nuestro método scEC&T-seq, primero evaluamos la detección y el enriquecimiento del ADN mitocondrial (ADNmt) porque el ADNmt está presente en todas las células, es digerido por PmeI y, debido a su circularidad y naturaleza extracromosómica, sirve como control positivo. Se detectó un porcentaje significativamente mayor de lecturas de mapeo de mtDNA después de una exposición más prolongada del ADN de células individuales a exonucleasa (P < 2.2 × 10−16, prueba t de Welch bilateral; Fig. 1c, d y Fig. 1c complementaria, d). Este también fue el caso para todos los demás elementos de ADN circular (P < 2.2 × 10−16, prueba t de Welch bilateral; Fig. 1e), lo que indica un enriquecimiento significativo de ADN circular. Se observó un enriquecimiento significativo de las regiones de ecDNA, es decir, ADN circulares grandes (>100 kb) que contienen oncogenes, después de la digestión con exonucleasa de 1 día (P = 2,10 × 10−5, prueba t de Welch bilateral; Fig. 1e complementaria) . Este enriquecimiento no fue tan pronunciado como el de los ADN circulares más pequeños después de una digestión prolongada con exonucleasa de 5 días, lo que sugiere que el ADNc puede ser menos estable en presencia de exonucleasa en comparación con los ADN circulares más pequeños, o que los ADN circulares pequeños se amplifican de manera más eficiente con la polimerasa φ29 (Fig. 1e,f complementaria). La incubación con endonucleasa PmeI antes de la digestión con exonucleasa de 5 días redujo significativamente el mapeo de lecturas al mtDNA en 404,8 veces (P < 2,2 × 10−16, prueba t de Welch bilateral; Fig. 1c, d y Fig. 1c complementaria). Se observó un agotamiento similar para el mapeo de lecturas en ADN circular que contiene sitios de reconocimiento de PmeI, lo que confirma el enriquecimiento específico del ADN circular a través de nuestro protocolo scEC&T-seq (P < 2.2 × 10−16, prueba t de Welch bilateral; Fig. 1f y Fig. Suplementaria .1g,h). Una concordancia significativa entre la detección de ADN circular basada en Illumina y Nanopore sugirió una detección reproducible independiente de la tecnología de secuenciación (correlación bilateral de Pearson, R = 0.95, P < 2.2 × 10−16; Fig. 2a-d complementaria). Por lo tanto, scEC&T-seq permite el aislamiento y la secuenciación de ADN circular a partir de células individuales.

El ARNm separado de las mismas células se procesó utilizando Smart-seq2 (ref. 26, 27) (Fig. 1a y Nota complementaria 1). Detectamos en promedio 9,058 ± 1,163 (media ± sd) transcripciones completas de ARNm de diferentes genes por célula (Figura complementaria 3a-c y Tabla complementaria 2). El agrupamiento no supervisado separó ambas poblaciones de líneas celulares (Figura complementaria 3d, e). Para probar si scEC&T-seq proporcionó datos de secuenciación de ARNm de alta calidad, evaluamos la expresión génica característica del ciclo celular y clasificamos las células individuales en tres fases del ciclo celular (G1, S, G2/M; figura complementaria 3f). Las distribuciones del ciclo celular deducidas de scEC & T-seq coincidieron con las medidas mediante el análisis del ciclo celular basado en FACS, lo que confirma su precisión (Fig. 3g complementaria). Por lo tanto, scEC&T-seq no solo permite el enriquecimiento y la detección de ADN circular, sino que también permite la medición paralela de ARNm de transcripción completa de alta calidad en células cancerosas individuales.

Se espera que solo los ADN circulares que confieren una ventaja de aptitud estén clonalmente presentes en una población de células cancerosas22. Recientemente descubrimos que los tumores en promedio albergan más de 1000 ADN circulares individuales, la mayoría de los cuales son pequeños (<100 kb), carecen de oncogenes y no contribuyen a la amplificación de oncogenes3. Sin embargo, sus diferencias intercelulares siguen sin explorarse y aún no está claro si los ADN circulares pequeños pueden conferir una ventaja de aptitud y si se propagan clonalmente en las células cancerosas10. De acuerdo con nuestros informes anteriores en poblaciones a granel3, el número promedio de regiones de ADN circulares individuales identificadas mediante scEC&T-seq varió entre 97 y 1939 (mediana = 702) por célula individual en líneas celulares de neuroblastoma (Fig. 2a). La distribución del tamaño del ADN circular y el origen genómico fue similar entre las células individuales y reflejó la distribución observada en la secuenciación en masa3 (mínimo = 30 pb, máximo = 1,2 Mb, mediana = 21 483 kb; Fig. 2a y Fig. 4a,b complementaria). Todas las células analizadas estaban vivas en el momento de la clasificación (Fig. 1a,b complementaria) y la mayoría (> 95%) de los ADN circulares detectados en células individuales eran más grandes que los ADN circulares apoptóticos, lo que sugiere que la mayoría de los ADN circulares no fueron el resultado de la apoptosis. como lo sugieren otros informes6 (Fig. 2a y Fig. 4a complementaria). Por lo tanto, cada célula cancerosa contiene un amplio espectro de ADN circulares individuales de diferentes contextos genómicos.

a, Mapa de calor que muestra el número y la longitud de las regiones de ADN circulares individuales (<100 kb) identificadas por scEC&T-seq en células individuales de neuroblastoma CHP-212 y TR14 (n = 150 células CHP-212, n = 25 células TR14; tamaño del contenedor = 500 pb) con distribución de densidad para tamaños de ADN circular (arriba) y recuentos generales de ADN circular (derecha). b, Mapa de calor de la densidad de ADN circular de todo el genoma en células individuales de neuroblastoma CHP-212 y TR14 (arriba: n = 150 células CHP-212, tamaño de contenedor = 3 Mb; abajo: n = 25 células TR14, tamaño de contenedor = 3 Mb) , y pistas genómicas que muestran la densidad de lectura de todo el genoma de WGS en poblaciones de células a granel. Se muestra la ubicación del gen MYCN en el cromosoma 2. c, d, análisis de recurrencia en células CHP-212 (n = 150) (c) y TR14 (n = 25) (d) mostradas como la fracción de células que contienen un ADN circular detectado de cada tipo de ADN circular. ecDNA se definió como ADN circular que se superpone con regiones amplificadas por número de copias identificadas en secuenciación masiva (verde) y mtDNA o chrM (rojo). 'Otros' se definen como todos los demás ADN circulares pequeños (azul). Los datos se presentan como la media ± sem

Como era de esperar, la mayoría de los ADN circulares pequeños no albergaban oncogenes10. La proporción general de ADN circular pequeño detectado de forma recurrente en las células fue baja (Fig. 2b-d y Fig. 4c complementaria). Esto indica que solo un pequeño subconjunto de pequeños ADN circulares se propaga clonalmente en las células cancerosas. En línea con su papel oncogénico conocido en el cáncer y las ventajas selectivas positivas, los ecDNA amplificados que contienen oncogenes se detectaron recurrentemente en las células (Fig. 2b-d), que fue validado por FISH (Fig. 2b y Fig. 5a-c suplementaria). ). Aunque no se puede excluir la relevancia funcional de los ADN circulares pequeños, la alta subclonalidad observada sugiere que no contribuyen a la aptitud de las células cancerosas en la misma medida que el ecDNA clonal que amplifica el oncogén.

Nosotros y otros mostramos recientemente que los ecDNA son estructuras complejas, que a veces contienen fragmentos reorganizados de diferentes cromosomas23,28,29,30. Teniendo en cuenta que scEC & T-seq pudo detectar de forma recurrente ecDNA del tamaño de una megabase que albergan los oncogenes MYCN, CDK4 o MDM2 (Fig. 2b), preguntamos si scEC & T-seq podría proporcionar información sobre las estructuras de ecDNA. De hecho, scEC & T-seq capturó ecDNA de múltiples fragmentos en casi todas las células individuales que recapitulaban las estructuras de elementos descritas anteriormente que se encuentran en poblaciones masivas23,28 (Fig. 3a, b). Se detectó al menos una lectura compatible con variantes por punto de corte de ecDNA en aproximadamente el 30 % de las células individuales (Tabla complementaria 3). La cuantificación adicional de las lecturas de unión de ecDNA y la detección de variante estructural computacional (SV) tanto de la secuenciación de lectura corta como larga confirmó la interconexión de los segmentos (Figura complementaria 6a-p y Tablas complementarias 4 y 5). Dichos SV pueden conducir a la expresión de la transcripción de fusión en ecDNA3. De hecho, las transcripciones de fusión podrían identificarse en células individuales utilizando scEC & T-seq (Fig. 3c y Fig. 7 complementaria). Por lo tanto, scEC&T-seq es suficientemente sensible para detectar SV asociados con ecDNA y la expresión del gen de fusión resultante en células individuales.

a, b, reconstrucciones de ecDNA basadas en lecturas largas y cortas derivadas de datos WGS en poblaciones de células a granel y cobertura de lectura sobre los fragmentos de ecDNA en células individuales en CHP-212 (n = 150) (a) y TR14 (n = 25 ) células (b) detectadas por scEC&T-seq. De arriba a abajo, reconstrucción de amplicón de ecDNA, perfil de número de copias, anotaciones de genes, densidad de lectura sobre la región de ecDNA en celdas individuales fusionadas y cobertura sobre la región de ecDNA en celdas individuales (filas). c, Transcripción de fusión ejemplar detectada por scEC&T-seq como resultado de la reorganización de segmentos cromosómicos en el ecDNA de CDK4 en TR14. De arriba a abajo, cobertura de lectura de scCircle-seq sobre la región del punto de ruptura en células individuales TR14 fusionadas (a escala logarítmica), anotaciones de transcripción, cobertura de lectura de scRNA-seq sobre las transcripciones fusionadas en células individuales TR14 fusionadas, representaciones de transcripciones nativas y representación de transcripciones de fusión. Los segmentos genómicos interconectados en el ADNc de CDK4 que dan lugar al gen de fusión se indican mediante una línea discontinua roja.

La segregación mitótica desigual de ecDNA implica que el número de copias de ecDNA puede variar mucho entre células individuales17,22. En la mayoría de las células individuales, los ecDNA multifragmentados no diferían en estructura y composición (Fig. 3a, b), lo que sugiere que el ecDNA es estructuralmente estable en líneas celulares cultivadas. Como se predijo por su segregación mitótica binomial y la fuerte ventaja de aptitud conferida2,17, la mayoría de las células TR14 individuales contenían los tres ecDNA independientes que albergan oncogenes también detectados en poblaciones a granel (Fig. 3b y Fig. 4a). Sin embargo, una pequeña cantidad de células solo contenía un subconjunto de ecDNA independientes (Fig. 4a-c). Esto sugiere que la variación del contenido de ecDNA sirve como fuente de heterogeneidad de la población. Curiosamente, los ecDNA que albergan MDM2 se detectaron en todas las células individuales, mientras que los ecDNA que albergan CDK4 y MYCN estaban ausentes en algunas células (Fig. 4b, c), lo que sugiere que pueden existir principios biológicos aún no definidos de la segregación de ecDNA. A continuación, preguntamos si la heterogeneidad del número de copias de ecDNA influía en la expresión de genes codificados en ecDNA. Confirmamos que la distribución del número relativo de copias de ecDNA era consistente con las distribuciones de números de copias medidas con FISH (Fig. 8a-h complementaria). La fase de los SNP sugirió que los ecDNA son de origen monoalélico en cada célula cancerosa individual (Fig. 9a, b complementaria), lo que confirma la observación previa en poblaciones de células a granel3. De acuerdo con las diferencias impulsadas por el número de copias en la expresión génica, el número relativo de copias de ecDNA se correlacionó positivamente con los recuentos de lectura de mRNA de genes contenidos en ecDNA en las mismas células individuales (Fig. 4d-h). A pesar de que las interacciones de potenciadores en el ecDNA agrupado también pueden contribuir a la variabilidad de la expresión del ecDNA intercelular23, proporcionamos evidencia de que la heterogeneidad del número de copias del ecDNA es un determinante importante de las diferencias intercelulares en la expresión del oncogén.

a, Representación esquemática de los tres ecDNA independientes identificados en TR14: MYCN ecDNA (amarillo); ADNc de CDK4 (azul); y ADNc de MDM2 (rojo). b, gráfico UpSet que muestra la coocurrencia de los tres ecDNA identificados en TR14 (MDM2, CDK4, MYCN) en células individuales (n = 25 células TR14). c, Pistas del genoma con densidades de lectura (a escala logarítmica) sobre regiones de ecDNA reconstruidas en tres células TR14 ejemplares que muestran diferentes ecDNA detectados. d, Gráficos de violín de los niveles de expresión de ARNm en células individuales TR14 y CHP-212 (prueba t de Welch bilateral; P = 0,0038 (MYCN), P < 2,2 × 10−16 (LPIN1, TRIB2, CDK4, MDM2, MYT1L) ); n = 171 células CHP-212, n = 42 células TR14. e, f, Comparación por pares entre los recuentos de lectura de ecDNA y mRNA de scEC&T-seq sobre la región MYCN ecDNA reconstruida en células individuales CHP-212 (correlación bilateral de Pearson, P < 2,2 × 10−16, R = 0,86, n = 150 celdas) (e) y en celdas individuales TR14 (correlación bilateral de Pearson, P = 0.0056, R = 0.54, n = 25 celdas) (f). g, h, comparación por pares entre los recuentos de lectura de ecDNA y mRNA de scEC&T-seq sobre los ecDNA de CDK4 (g) y MDM2 (h) reconstruidos en células individuales TR14 (correlación bilateral de Pearson, P = 0,0046, R = 0,55 para CDK4 y P = 0,0019, R = 0,59 para MDM2, n = 25 células TR14).

Datos fuente

Las variantes de un solo nucleótido (SNV) son impulsores importantes de la heterogeneidad intercelular y la evolución tumoral31. Además, los SNV se pueden rastrear en las celdas, lo que permite su uso para aplicaciones de rastreo de linaje32. Para probar si scEC & T-seq podría usarse para detectar SNV, aplicamos algoritmos de detección de SNV en datos combinados de scEC & T-seq de una sola célula y comparamos los SNV detectados con los identificados en las secuencias del genoma completo de poblaciones a granel. La mayoría de los SNV detectados mediante scEC&T también se detectaron en genomas completos (>69,5 %). Debido a que scEC&T-seq también detecta mtDNA (Fig. 2c, d), planteamos la hipótesis de que las mutaciones mitocondriales heteroplásmicas pueden permitir el rastreo del linaje, como se demostró en otros ensayos de células individuales en el pasado32 (Fig. 1c, d y Complementario Fig. 1c). De hecho, la agrupación jerárquica no supervisada por variantes de ADNmt homoplásmico genotipificó con precisión las células (Fig. 10a complementaria). Los SNV heteroplásmicos en mtDNA revelaron una alta heterogeneidad intercelular, y la agrupación jerárquica no supervisada en células individuales individuales los agrupó, lo que indica subclonalidad y puede permitir el rastreo del linaje (Figura complementaria 10b y Figura complementaria 11a, b). Por lo tanto, scEC&T-seq puede detectar variantes heteroplásmicas en mtDNA y ecDNA, lo que permite una amplia gama de aplicaciones y análisis basados ​​en SNV, incluida la inferencia de linaje.

Mientras que el origen y las consecuencias funcionales de los grandes elementos de ADNc que contienen oncogenes se han estudiado con cierto detalle en el pasado33,34, no está claro en gran medida cómo se forman los ADN circulares pequeños y cómo influyen en el comportamiento de las células. Trabajos recientes sugieren que algunos elementos circulares pequeños se forman durante la apoptosis6. Otros informes proporcionan evidencia de la participación de la reparación de daños aberrantes en el ADN en su generación35. De acuerdo con informes anteriores36, identificamos la presencia de microhomología en puntos de ruptura circulares de pequeños ADN circulares, lo que sugiere que la reparación mediada por microhomología puede estar involucrada en su generación (Fig. 12 complementaria). La distribución de tamaño bimodal identificada en células individuales (Fig. 2a) sugirió que existen al menos dos tipos de ADN circulares pequeños en las células. Se encontraron ADN circulares muy pequeños (<3 kb) en todas las células individuales analizadas (Fig. 2a y Fig. 5a). No se observaron diferencias en la fracción de ADN circular muy pequeño entre células en diferentes fases del ciclo celular (Fig. 5b), lo que plantea la cuestión de si estos ADN circulares pequeños pueden replicarse. Para identificar las vías asociadas con los altos contenidos de estos ADN circulares muy pequeños, comparamos la expresión de ARN de las células con una cantidad relativa alta de ADN circulares tan pequeños con la de las células con un contenido relativo bajo (Fig. 5a). Veinte vías se enriquecieron significativamente de manera positiva en los transcriptomas celulares con un alto contenido de ADN circular muy pequeño (Fig. 5c-e y Tabla complementaria 6). De acuerdo con estudios previos, las vías de daño y reparación del ADN35,37,38, la apoptosis6 y el mantenimiento de los telómeros39 se enriquecieron significativamente en células con un alto contenido relativo de este subtipo más pequeño de ADN circular (Fig. 5c-e). Esto demuestra que scEC&T-seq puede ayudar a abordar cuestiones de larga data sobre el origen y las consecuencias funcionales de los ADN circulares pequeños.

a, Gráfica de densidad del contenido relativo de ADN circular pequeño (<3 kb) en células individuales CHP-212 (n = 129). Para los análisis de expresión diferencial, las células se dividieron en dos categorías: 'bajo' (área naranja, 40% inferior) y 'alto' (área púrpura, 40% superior). b, diagrama de violín que compara el número relativo de ADN circulares pequeños (<3 kb) en diferentes fases del ciclo celular en células individuales CHP-212 (rojo, n = 129) y TR14 (azul, n = 20). Se utilizó una prueba t de Welch bilateral entre las condiciones indicadas. Se muestran los valores de P. c, Procesos celulares significativamente enriquecidos en células CHP-212 con alto contenido relativamente pequeño de ADN circular. Se muestran los valores de P ajustados y los recuentos de genes. d, Gráfico de análisis de enriquecimiento de conjuntos de genes (GSEA) de genes implicados en la reparación del ADN (P ajustado = 0,0415). e, gráfico GSEA de genes implicados en la respuesta celular al estímulo de daño del ADN (P ajustado = 0,0008). Los valores de p se ajustaron mediante el método de Bejamini-Hochberg.

La conformación y accesibilidad de la cromatina pueden influir en la susceptibilidad al daño del ADN40. Presumimos que los ADN circulares pequeños pueden ser producto del daño del ADN en sitios de accesibilidad o conformación de cromatina diferencial. Para probar esta hipótesis, medimos el enriquecimiento relativo de la inmunoprecipitación de la cromatina del factor de unión a CCCTC (CTCF) seguido de la secuenciación (ChIP-seq) y el ensayo de cromatina accesible a la transposasa usando picos de secuenciación (ATAC-seq) en regiones de pequeños ADN circulares comparados a otros sitios en el genoma, respectivamente. Para este análisis se usaron pequeños ADN circulares detectados usando scEC&T-seq en células individuales CHP-212 y aquellos detectados usando Circle-seq en las poblaciones de células a granel (Fig. 13a-d complementaria). Curiosamente, los puntos de ruptura circulares del ADN se enriquecieron significativamente en los sitios de unión de CTCF tanto en células individuales como en poblaciones de células a granel. Este enriquecimiento fue aún más sorprendente considerando que las regiones a partir de las cuales se originaron los ADN circulares pequeños se agotaron significativamente en los sitios de señales ATAC-seq altas (Fig. 13e complementaria). Esto sugiere que los sitios de unión de CTCF y la cromatina no accesible, que abunda en los sitios de unión de CTCF41, pueden ser susceptibles de rotura y formación de ADN circular. Para controlar las señales de fondo de ChIP-seq, medimos el enriquecimiento de los picos de H3K4me1, H3K27ac y H3K27me3 ChIP-seq en los sitios de formación de ADN circular pequeño. En todos los casos, se encontraron ADN circulares pequeños con una frecuencia significativamente menor en estos sitios de lo esperado para regiones distribuidas aleatoriamente (Fig. 13f-h complementaria), lo que confirma la especificidad del enriquecimiento de CTCF e indica que los sitios marcados por H3K4me1, H3K27ac y H3K27me3 pueden ser Protegido de rotura y circularización. Teniendo en cuenta el papel de CTCF en la regulación de la estructura tridimensional de la cromatina a través de la mediación de la formación de bucles de cromatina41, nuestros datos plantean la posibilidad de que las roturas de ADN durante la extrusión de bucles mediada por CTCF puedan representar un mecanismo de formación de ADN circular pequeño.

A continuación, aplicamos scEC & T-seq a núcleos únicos de dos neuroblastomas y células T vivas aisladas de las muestras de sangre de dos pacientes (Fig. 6a, Figs. complementarias 14a, b y 15a-t y Nota complementaria 1). El número de elementos de ADN circulares individuales identificados en las células cancerosas fue significativamente mayor en comparación con el de las células T normales y las células de la línea celular, lo que sugiere que la circularización del ADN es más frecuente en los tumores que en las células no transformadas o en las células en cultivo (Fig. 6b). Las distribuciones de tamaño de ADN circular y el contenido genómico relativo fueron comparables a los observados en las líneas celulares, lo que sugiere que scEC&T-seq captura de forma reproducible el ADN circular independientemente del material de entrada (Fig. 6b y Figs. 4a y 16a complementarias). De acuerdo con nuestras observaciones en líneas celulares, la proporción de ADN circulares pequeños identificados recurrentemente fue baja (Fig. 16b-d complementaria). Los ecDNA grandes que contienen oncogenes, por otro lado, se identificaron recurrentemente en los núcleos tumorales pero no en las células T (Fig. 6c y Fig. 16b-d complementaria), de acuerdo con su función oncogénica. Se detectaron ADNc que contenían MYCN en casi todos los núcleos de cáncer de ambos pacientes, lo que se confirmó con FISH (Fig. 16e-g complementaria). Como se observó en las líneas celulares, las diferencias intercelulares en la transcripción de MYCN se correlacionaron positivamente con el contenido relativo de ecDNA (Figura complementaria 16h, i). Por lo tanto, scEC&T-seq se puede aplicar con éxito a tumores humanos.

a, Diagrama esquemático que describe el procesamiento de muestras de sangre y tumores. b, número de regiones de ADN circulares individuales normalizadas por el tamaño de la biblioteca detectadas en núcleos de tumores primarios (n = 93 núcleos del paciente n.º 1, n = 86 núcleos del paciente n.º 2), células individuales de la línea celular de neuroblastoma (n = 25 células TR14, n = 150 células CHP-212) y células T individuales no malignas (n = 38 paciente n.º 3, n = 41 paciente n.º 4). Los valores de P se calcularon utilizando una prueba t de Welch bilateral y se muestran. Los recuadros en los diagramas de caja representan los percentiles 25 y 75 con la barra central como el valor de la mediana y los bigotes representan el valor atípico más alejado ≤1,5 ​​× el IQR del recuadro. c, Mapa de calor de la densidad de ADN circular de todo el genoma en tumores primarios de neuroblastoma y células T normales (n = 93 paciente n.° 1, verde; n = 86 paciente n.° 2, violeta; n = 38 paciente n.° 3, amarillo; n = 41 paciente nº 4, naranja, bin size = 3 Mb). Se muestra la ubicación del gen MYCN en chr2.

Estudios recientes de genomas de cáncer han descrito ADNc estructuralmente complejos3,11,18,19,28,29,42; sin embargo, debido al análisis de las poblaciones de células a granel, tenían una capacidad limitada para inferir la heterogeneidad estructural del ecDNA. Ambos neuroblastomas analizados contenían ecDNA que contenían MYCN grandes y estructuralmente complejos, como se confirmó mediante la secuenciación Nanopore de lectura larga de los mismos núcleos individuales y mediante la secuenciación del genoma completo (WGS) de poblaciones de células a granel (Fig. 7a y Fig. 17a complementaria). Mientras que la estructura de ecDNA en el paciente no. 1 era tan complejo que no se reconstruyó computacionalmente por completo (Fig. 17b complementaria), el ecDNA que contenía MYCN en el otro paciente (paciente n. ° 2) estaba compuesto estructuralmente por cinco fragmentos genómicos individuales, todos derivados del cromosoma 2, que fueron conectado por cuatro SV (núms. 1-4) de una manera que fue lo suficientemente simple como para ser reconstruido de manera confiable en celdas individuales (Fig. 7a). Presumimos que la evaluación de la heterogeneidad estructural del ecDNA intercelular en este paciente podría facilitar la inferencia de la dinámica estructural del ecDNA. De hecho, el ecDNA difería estructuralmente considerablemente entre un subconjunto de células individuales (Fig. 7a, b). SV no. 1 estuvo presente en todas las celdas individuales, lo que sugiere que ocurrió antes que los otros SV y puede representar la variante inicial que conduce a la circularización (Fig. 7b-d). SV núms. 2–4, por otro lado, no se detectaron en un subconjunto de celdas. Además, SV núm. 2 y SV núm. 3 indicó la presencia de una deleción de 6 kb y SV no. 4 respaldaron la presencia de una deleción más grande (aproximadamente 180 kb) en el ecDNA, los cuales estaban presentes en la mayoría pero no en todas las células individuales (94.2%; Fig. 7c, d). Análisis de lecturas divididas en los puntos de corte de SV nos. 2 y 3, es decir, los bordes de la deleción de 6 kb y la cobertura a través de esta deleción en células individuales, sugirieron la presencia de tres poblaciones de células subclonales diferentes que denominamos subclon nos. 1–3. Clon No. 1 contenía un ecDNA intacto sin deleciones. Clon No. 2 albergaba una población mixta de ecDNA con y sin deleciones (Fig. 7b-e). En el clon núm. 3, los SV detectados y la cobertura de secuenciación indicaron la presencia de una población pura de ecDNA que albergaba tanto deleciones como todos los SV (Fig. 7c-e). La secuencia más simple de eventos mutacionales que darían como resultado la heterogeneidad del ecDNA estructural intercelular observada comienza con una simple escisión de un ecDNA que contiene MYCN y regiones cromosómicas vecinas, es decir, SV no.1 que genera la variante de ecDNA no. 1 encontrado en el clon no. 1 (Fig. 7e,f). Esto es seguido por la fusión de dos simples ecDNA no. 1 variantes que generan una variante de ecDNA reorganizada más compleja no. 2 que incluye la pequeña eliminación de 6 kb y SV nos. 2 y 3 además de SV no. 1 (Fig. 7e,f). Tal recombinación circular está de acuerdo con modelos recientes basados ​​en WGS43. Una gran eliminación adicional en este ecDNA crearía la variante 3 de ecDNA con todos los números de SV. 1–4 y ambas deleciones (Fig. 7e,f). El predominio de la variante 3 de ecDNA en estas células de neuroblastoma sugiere que puede conferir una ventaja selectiva positiva. Nuestra demostración de prueba de principio de que scEC&T-seq puede ayudar a inferir la dinámica estructural del ecDNA ilustra que scEC&T-seq puede facilitar estudios futuros que aborden importantes preguntas abiertas sobre el origen y la evolución del ecDNA.

a, Reconstrucciones de ecDNA basadas en lecturas largas derivadas de datos WGS en poblaciones a granel y cobertura de lectura sobre los fragmentos de ecDNA en núcleos únicos en el paciente n. 2 (n = 86 núcleos) detectados por scEC&T-seq de lectura larga o lectura corta. De arriba a abajo, reconstrucción de amplicón de ecDNA (los SV en ecDNA están coloreados; SV n.º 1 a 4), anotación de genes, densidad de lectura sobre la región de ecDNA en datos WGS de Nanopore de lectura larga a granel, densidad de lectura sobre la región de ecDNA en datos únicos combinados núcleos y cobertura sobre la región de ecDNA en núcleos únicos (filas) según lo detectado por scEC&T-seq de lectura larga o corta. La eliminación de 6 kb está resaltada en rojo. El asterisco único indica la región no mapeable del genoma de referencia (hg19). b, mapa de calor del número total de lecturas (a escala logarítmica) en una ventana de 500 pb sobre la eliminación de 6 kb identificada en ecDNA en núcleos únicos en el paciente n. 2 (n = 86 núcleos). c, Pistas ejemplares del genoma de las tres variantes de clones identificadas en el paciente no. 2 basado en la ausencia o presencia de la deleción de 6 kb en el elemento ecDNA. La densidad de lectura total a escala logarítmica se muestra en azul y la densidad de lectura compatible con el borde del círculo se muestra en gris. d, Detección de SV nos. 1–4 que respaldan el elemento de ADNc multifragmentado en ocho células individuales ejemplares que representan los tres grupos de variantes de clones identificados (≥1 lectura que admite el SV, gris; 0 lecturas que respaldan el SV, blanco). e, Representación esquemática de las variantes 1–3 de ecDNA detectadas en d. f, Interpretación esquemática de la evolución de la estructura de ecDNA en el paciente no. 2 basado en las variantes de ecDNA identificadas en los datos de scEC&T-seq. Se muestra la posición del oncogén MYCN y sus elementos potenciadores locales (e1–e5), indicados por asteriscos individuales, en cada variante de ecDNA.

Los elementos reguladores se amplifican comúnmente en ecDNA, tienen un papel esencial en la regulación transcripcional de los oncogenes en ecDNA y se supone que están bajo una fuerte selección positiva28,29. De hecho, al menos uno de los elementos potenciadores específicos de MYCN descritos recientemente28,29 se detectó de forma recurrente en ecDNA que albergan MYCN en más del 82,7% de las células individuales de neuroblastoma (Fig. 7f y Fig. 18a complementaria). Curiosamente, la deleción detectada en el paciente no. 2, es decir, la variante 3 de ecDNA, se predice que resultará en la pérdida de una de las dos copias del gen MYCN, incluidos los elementos reguladores e2 y e3 presentes en la variante 2 de ecDNA (Fig. 7f). Esto plantea la posibilidad de que el cambio en la estequiometría del potenciador:oncogén (6:1 en la variante 3 frente a 8:2 en la variante 2), es decir, la presencia de una copia del oncogén en lugar de dos en un ADNec, pueda ser beneficiosa para la expresión del oncogén. porque puede permitir un uso más eficiente de potenciadores en el ecDNA. Dichos mecanismos pueden explicar el predominio observado de la variante de ecDNA no. 3 en la población de células tumorales.

Informes recientes sugieren que los ecDNA que no albergan oncogenes pero que contienen elementos potenciadores existen y pueden mejorar la producción transcripcional en los cromosomas lineales o en otros ecDNA en trans como parte de los centros de ecDNA17,23. Para identificar tales elementos de ecDNA, analizamos los datos de H3K4me1, H3K27ac, H3K27me3 ChIP-seq y ATAC-seq de células de neuroblastoma y buscamos ecDNA que incluyeran estas regiones pero que no albergaran oncogenes. No se identificó de forma recurrente ningún ecDNA que solo albergara elementos potenciadores en células individuales de neuroblastoma. Todos los ecDNA detectados de forma recurrente contenían al menos un oncogén. Sin embargo, se identificó un gran conjunto de pequeños ADN circulares no recurrentes que solo contenían regiones genómicas con elementos reguladores (Fig. 18b complementaria). Sin embargo, la falta de recurrencia de estos elementos de ADN circular sugiere que no se mantienen en estas células cancerosas o que no confieren ventajas selectivas positivas. Por lo tanto, scEC&T-seq permite la detección de ADN circulares no codificantes y posibilita futuras investigaciones sobre su papel en la regulación transcripcional del cáncer.

Hemos demostrado que mediante la secuenciación paralela de ADN circular y ARNm de células cancerosas individuales, scEC&T-seq no solo distingue fácilmente las consecuencias transcripcionales de la heterogeneidad del número de copias del oncogén intercelular impulsado por ecDNA, sino que también tiene el potencial de descubrir los principios de la evolución estructural del ecDNA. Creemos que el análisis integrado del contenido de ADN circular de una célula y el transcriptoma a través de scEC&T-seq permitirá una comprensión más completa del alcance, la función, la heterogeneidad y la evolución de los ADN circulares en el cáncer y más allá.

scEC&T-seq complementa los métodos publicados recientemente para la secuenciación de ADN unicelular y ARN unicelular (scRNA-seq)23,27, que no pueden distinguir fácilmente los amplicones lineales intracromosómicos de los circulares extracromosómicos. Aunque scEC&T-seq es compatible con la automatización, los elaborados procedimientos circulares de enriquecimiento de ADN solo permiten un bajo rendimiento, lo que aumenta los costos por célula y actualmente representa una limitación de este método. Sin embargo, en comparación con las tecnologías unicelulares microfluídicas basadas en gotas, la scEC&T-seq basada en placas genera una cantidad uniforme de lecturas por celda y produce bibliotecas de secuenciación independientes disponibles para la selección y la resecuenciación, lo que resulta ventajoso cuando se necesita una alta cobertura de secuenciación. De hecho, demostramos que scEC&T se puede combinar con diferentes tecnologías de secuenciación. El nivel de detalle proporcionado por scEC&T-seq supera con creces el de los métodos de alto rendimiento. Emparejar nuestro método con otras tecnologías unicelulares, por ejemplo, Strand-seq44, y enfoques de procesamiento, por ejemplo, procesamiento tricanal de una sola célula45, puede aumentar el espectro de variación somática detectada por scEC&T-seq.

La realización de scEC&T-seq en células cancerosas individuales nos permitió perfilar su contenido de ADN circular independientemente del número de copias y el tamaño del ADN circular. Se identificaron pequeños ADN circulares en células individuales vivas, lo que sugiere que la apoptosis no es el único mecanismo de su generación. Mientras que los ecDNA que contienen oncogenes estaban clonalmente presentes en células individuales, los ADN circulares pequeños eran exclusivos de células individuales. Esto no solo indica que los ADN circulares pequeños probablemente no confieren una ventaja selectiva a las células cancerosas, sino que también sugiere la existencia de requisitos previos aún desconocidos para la selección, propagación y mantenimiento de estos ADN circulares.

La demostración sólida de la integración de la secuenciación circular de ADN y ARNm en células cancerosas individuales indica que el mismo enfoque se puede aplicar a una amplia gama de sistemas biológicos para explorar más a fondo la diversidad y la invariancia del ADN circular en células individuales. Por lo tanto, anticipamos que nuestro método será un recurso para futuras investigaciones en muchos campos más allá de la biología del cáncer y sugerimos que tiene el potencial para abordar muchas cuestiones biológicas actualmente no resueltas con respecto al ADN circular.

Un protocolo detallado paso a paso de scEC&T-seq está disponible en Nature Protocol Exchange46 y se describe a continuación. La duración del protocolo es de aproximadamente 8 días por placa de 96 pocillos.

Las líneas de células tumorales humanas se obtuvieron de ATCC (CHP-212) o fueron proporcionadas por JJ Molenaar (TR14; Princess Máxima Center for Pediatric Oncology). La identidad de todas las líneas celulares se verificó mediante genotipado de repetición corta en tándem (Genetica DNA Laboratories e IDEXX BioResearch); ausencia de Mycoplasma spp. la contaminación se determinó con un sistema de detección Lonza MycoAlert. Las líneas celulares se cultivaron en medio Roswell Park Memorial Institute 1640 (Thermo Fisher Scientific) suplementado con penicilina al 1%, estreptomicina y FCS al 10%. Para evaluar el número de células viables, las células se tripsinizaron (Gibco), se resuspendieron en medio y se sedimentaron a 500 g durante 5 min. A continuación, las células se resuspendieron en medio, se mezclaron en una proporción de 1:1 con azul de tripán al 0,02 % (Thermo Fisher Scientific) y se contaron con un contador de células TC20 (Bio-Rad Laboratories).

Las células se cultivaron hasta un 80 % de confluencia en una placa de 15 cm y se detuvo la metafase añadiendo KaryoMAX Colcemid (10 µl ml−1, Gibco) durante 1–2 h. Las células se lavaron con PBS, se tripsinizaron (Gibco) y se centrifugaron a 200 g durante 10 min. Añadimos 10 ml de KCl 0,075 M precalentado a 37 °C, 1 ml a la vez, agitando en vórtex a máxima velocidad en el medio. Posteriormente, las células se incubaron durante 20 min a 37 °C. Luego, se añadieron 5 ml de MeOH:ácido acético 3:1 enfriado con hielo (mantenido a -20 °C), 1 ml a la vez, seguido de la resuspensión de las células agitando el tubo. La muestra se centrifugó a 200 g durante 5 min. La adición del fijador seguida de centrifugación se repitió cuatro veces. Se dejaron caer dos gotas de células dentro de 200 µl de MeOH:ácido acético sobre portaobjetos precalentados desde una altura de 15 cm. Los portaobjetos se incubaron durante la noche.

Los portaobjetos se fijaron en MeOH:ácido acético durante 10 min a -20 °C seguido de un lavado del portaobjetos en PBS durante 5 min a temperatura ambiente. Los portaobjetos se incubaron en solución de pepsina (HCl 0,001 N) con la adición de 10 µl de pepsina (1 g 50 ml−1) a 37 °C durante 10 min. Los portaobjetos se lavaron en tampón de citrato de sodio y solución salina (SSC) 0,5x durante 5 min y se deshidrataron mediante lavado en etanol frío al 70 %, 90 % y 100 % (almacenado a -20 °C) durante 3 min. Los portaobjetos secos se tiñeron con 10 µl de Vysis LSI N-MYC SpectrumGreen/CEP 2 SpectrumOrange Probes (Abbott), ZytoLight SPEC CDK4/CEN 12 Dual Color Probe (ZytoVision) o ZytoLight SPEC MDM2/CEN 12 Dual Color Probe (ZytoVision), cubiertos con un cubreobjetos y sellado con cemento de caucho. La desnaturalización se produjo en un sistema ThermoBrite (Abbott) durante 5 min a 72 °C seguido de una incubación durante la noche a 37 °C. Los portaobjetos se lavaron durante 5 min a temperatura ambiente en 2x SSC/0,1 % IGEPAL, seguidos de 3 min a 60 °C en 0,4x SSC/0,3 % IGEPAL (Sigma-Aldrich) y un lavado adicional en 2x SSC/0,1 % % IGEPAL durante 3 min a temperatura ambiente. Los portaobjetos secos se tiñeron con 12 µl de Hoechst 33342 (10 µM, Thermo Fisher Scientific) durante 10 min y se lavaron con PBS durante 5 min. Después del secado, se montó un cubreobjetos en el portaobjetos y se selló con esmalte de uñas. Las imágenes se tomaron con un microscopio confocal Leica SP5 (Leica Microsystems).

Las células CHP-212 y TR14 para la interfase FISH se cultivaron en portaobjetos de 8 cámaras (Nunc Lab-Tek, Thermo Scientific Scientific) hasta una confluencia del 80 %. Los pocillos se fijaron en MeOH:ácido acético durante 20 min a -20 °C seguido de un lavado con PBS durante 5 min a temperatura ambiente. Se retiraron los pocillos y los portaobjetos se digirieron en solución de pepsina (HCl 0,001 N) con la adición de 10 µl de pepsina (1 g 50 ml−1) a 37 °C durante 10 min. Después de un lavado en SSC 0,5x durante 5 min, los portaobjetos se deshidrataron lavándolos con etanol frío al 70 %, 90 % y 100 % almacenado a -20 °C (3 min en cada solución). Los portaobjetos secos se tiñeron con 5 µl de Vysis LSI N-MYC SpectrumGreen/CEP 2 SpectrumOrange Probes, ZytoLight SPEC CDK4/CEN 12 Dual Color Probe o ZytoLight SPEC MDM2/CEN 12 Dual Color Probe, cubiertos con un cubreobjetos y sellados con cemento de caucho. . La desnaturalización se produjo en un sistema ThermoBrite durante 5 min a 72 °C seguido de 37 °C durante la noche. Los portaobjetos se lavaron durante 5 min a temperatura ambiente en 2× SSC/0,1 % IGEPAL, seguidos de 3 min a 60 °C en 0,4× SSC/0,3 % IGEPAL y otros 3 min en 2× SSC/0,1 % IGEPAL a temperatura ambiente . Los portaobjetos secos se tiñeron con 12 µl de Hoechst 33342 (10 µM) durante 10 min y se lavaron con PBS durante 5 min. Después del secado, se montó un cubreobjetos en el portaobjetos y se selló con esmalte de uñas. Las imágenes fueron tomadas con un microscopio confocal Leica SP5. Para la estimación del número de copias de ecDNA, contamos los focos usando FIJI v.2.1.0 con la función find maxima. Los límites nucleares se marcaron como regiones de interés. El umbral para la detección de señales dentro de las regiones de interés se determinó manualmente y se usó para todas las imágenes analizadas dentro de un grupo.

Este estudio incluye muestras de tumores y sangre de pacientes diagnosticados con neuroblastoma entre 1991 y 2022. Los pacientes fueron registrados y tratados de acuerdo con los protocolos de prueba de la Sociedad Alemana de Oncología y Hematología Pediátrica (GPOH). Este estudio se realizó de acuerdo con la Declaración de Helsinki de la Asociación Médica Mundial (versión 2013) y las buenas prácticas clínicas; se obtuvo el consentimiento informado de todos los pacientes o sus tutores. La recolección y el uso de muestras de pacientes fueron aprobados por las juntas de revisión institucional de Charité-Universitätsmedizin Berlin y la Facultad de Medicina de la Universidad de Colonia. Las muestras y los datos clínicos fueron archivados y puestos a disposición por Charité-Universitätsmedizin Berlin o el National Neuroblastoma Biobank and Neuroblastoma Trial Registry (University Children's Hospital Cologne) del GPOH. El número de copias de MYCN se determinó utilizando FISH. Las muestras de tumor presentaban al menos un 60 % de contenido de células tumorales según la evaluación de un patólogo.

Las muestras de tejido se homogeneizaron utilizando un homogeneizador de tejido Dounce de vidrio preenfriado (nº de catálogo 357538, Wheaton) en 1 ml de tampón EZ PREP enfriado con hielo (Sigma-Aldrich). Se usaron diez golpes con un mortero suelto seguidos de cinco golpes adicionales con un mortero ajustado para la homogeneización del tejido. Para reducir el calor causado por la fricción, el douncer siempre se mantuvo en hielo durante la homogeneización. El homogeneizado se filtró a través de un tubo Falcon (Becton Dickinson) con una tapa de filtro de células de 35 µm. El número de núcleos intactos se estimó mediante tinción y conteo con azul de tripán al 0,02 % (Thermo Fisher Scientific) mezclado en una proporción de 1:1.

Las células mononucleares de sangre periférica (PBMC) se aislaron mediante centrifugación en gradiente de densidad con Ficoll-Plaque PLUS (Cytiva). Las muestras de sangre total se resuspendieron 1:1 en PBS sin calcio y se agregaron lentamente a 12 ml de Ficoll-Plaque PLUS. La muestra se centrifugó a 200 g durante 30 min sin romperse. La capa superior de PBMC se aisló y se lavó en 40 ml de PBS. Las PBMC se recogieron mediante centrifugación a 500 g durante 5 min y se resuspendieron en dimetilsulfóxido al 10 % en FCS. Las suspensiones de PBMC se almacenaron a -80 °C hasta su uso.

Para la clasificación de células individuales, se tiñeron de 1 a 10 millones de células de neuroblastoma o PBMC con yoduro de propidio (PI) (Thermo Fisher Scientific) en PBS 1x; las células viables se seleccionaron en función de las propiedades de dispersión frontal y lateral y la tinción con PI. Las suspensiones de PBMC se tiñeron adicionalmente con una dilución 1:400 de CD3 antihumano (Ax700, BioLegend). Las suspensiones de núcleos se tiñeron con DAPI (concentración final 2 μM, Thermo Fisher Scientific). Las células viables, los núcleos CD3+ PBMCS o DAPI+ se clasificaron utilizando un citómetro de flujo FACSAria Fusion (BD Biosciences) en 2,5 μl de tampón RLT Plus (QIAGEN) en placas de 96 pocillos de baja unión (4titude) selladas con papel aluminio (4titude) y almacenadas en −80 °C hasta el procesamiento.

La separación física del ADN genómico (ADNg) y el ARNm se realizó como se describió previamente en el protocolo G&T-seq de Macaulay et al.27. Todas las muestras se procesaron utilizando una estación de trabajo de automatización de laboratorio Biomek FXP (Beckman Coulter). Brevemente, el ARNm poliadenilado se capturó usando un cebador Oligo dT modificado (Tabla complementaria 7) conjugado con perlas magnéticas acopladas con estreptavidina (Dynabeads MyOne Streptavidin C1, n.º de catálogo 65001, Invitrogen). Las perlas conjugadas se agregaron directamente (10 μl) al lisado celular y se incubaron durante 20 min a temperatura ambiente con mezcla a 800 rpm (MixMate, Eppendorf). Usando un imán (Alpaqua), el ARNm capturado se separó del sobrenadante que contenía el ADNg. El sobrenadante que contenía ADNg se transfirió a una nueva placa de 96 pocillos (4titude); las perlas capturadas con ARNm se lavaron tres veces a temperatura ambiente en 200 μl de Tris-HCl 50 mM (pH 8,3), KCl 75 mM, MgCl2 3 mM, ditiotreitol (DTT) 10 mM, Tween 20 al 0,05 % y inhibidor de la ARNasa 0,2x. (SUPERase•In, Thermo Fisher Scientific). Para cada paso de lavado, las perlas se mezclaron durante 5 min a 2000 rpm en un MixTape (Eppendorf). El sobrenadante se recogió después de cada lavado y se combinó con el sobrenadante original usando las mismas puntas para minimizar la pérdida de ADN.

El ARNm capturado en las perlas se eluyó en 10 μl de una mezcla maestra de transcripción inversa que incluía 10 U μl−1 de transcriptasa inversa SuperScript II (Thermo Fisher Scientific), 1 U μl−1 de inhibidor de RNasa, 1 × Superscript II First-Strand Buffer (Thermo Fisher Scientific), DTT 2,5 mM (Thermo Fisher Scientific), betaína 1 M (Sigma-Aldrich), MgCl2 6 mM (Thermo Fisher Scientific), oligo de cambio de plantilla 1 μM (Tabla complementaria 7), mezcla de trifosfato de desoxinucleósido (1 mM de dATP, dCTP, dGTP y dTTP) (Thermo Fisher Scientific) y agua libre de nucleasas (Thermo Fisher Scientific) hasta el volumen final (10 μl). La transcripción inversa se realizó en un termociclador durante 60 min a 42 °C seguido de 10 ciclos de 2 min a 50 °C y 2 min a 42 °C y finalizando con una incubación de 10 min a 60 °C. La amplificación del ADN complementario (ADNc) por PCR se realizó inmediatamente después de la transcripción inversa mediante la adición de 12 μl de la mezcla maestra de PCR que incluye 1 × KAPA HiFi HotStart ReadyMix con cebador ISPCR 0,1 μM (10 mM; Tabla complementaria 7) directamente a los 10 μl del mezcla de reacción de transcripción inversa. La reacción se realizó en un termociclador por siete ciclos de la siguiente manera: 98 °C por 3 min, luego 18 ciclos de 98 °C por 15 s, 67 °C por 20 s, 72 °C por 6 min y finalmente 72 °C por 5 minutos. El cDNA amplificado se purificó utilizando una relación volumétrica 1:0,9 de Ampure Beads (Beckman Coulter) y se eluyó en 20 μl de tampón de elución (Buffer EB, QIAGEN).

El ADN aislado se purificó utilizando una proporción volumétrica de 1:0,8 de Ampure Beads. La muestra se incubó con las perlas durante 20 min a temperatura ambiente con mezcla a 800 rpm (MixMate). El aislamiento de ADN circular se realizó como se describió anteriormente en poblaciones a granel3,25. Brevemente, el ADN se eluyó de las perlas directamente en una mezcla maestra de digestión con exonucleasa (20 unidades de ADNasa dependiente de ATP segura para plásmidos (Epicentre), ATP 1 mM (Epicentre), 1x Tampón de reacción segura para plásmidos (Epicentre)) en una placa de 96 pocillos. En un subconjunto de muestras, se añadió 1 μl de la endonucleasa MssI/PmeI (20 U μl, New England Biolabs). La digestión del ADN lineal se realizó durante 1 o 5 días a 37 °C con 10 U de Plasmid-Safe DNasa y 4 μl de ATP (25 mM), que se añadía nuevamente cada 24 h para continuar con la digestión enzimática. Después de 1 o 5 días de digestión enzimática, la exonucleasa se inactivó por calor mediante incubación a 70 °C durante 30 min. El ADN resistente a la exonucleasa se purificó y amplificó utilizando el kit de células únicas REPLIg (QIAGEN) de acuerdo con las instrucciones del fabricante. Para este paso de purificación, se añadieron 32 μl de tampón de polietilenglicol (18% (p/v) (Sigma-Aldrich), NaCl 25 M, Tris-HCl 10 mM, pH 8,0, EDTA 1 mM, Tween 20 al 0,05 %), mezclar e incubar durante 20 min a temperatura ambiente. Después de la incubación, las perlas se lavaron dos veces con etanol al 80 % y el ADN resistente a la exonucleasa se eluyó directamente en la mezcla de reacción amplificación por desplazamiento múltiple con un kit REPLIg Single-Cell (QIAGEN). El ADN circular amplificado se purificó utilizando una proporción volumétrica de 1:0,8 de Ampure Beads y se eluyó en 100 μl de tampón de elución (Tampón EB, QIAGEN).

Se utilizó un total de 20 ng de ADNc amplificado o ADN circular para la preparación de bibliotecas utilizando NEBNext Ultra II FS (New England Biolabs) según el protocolo del fabricante. Las muestras se codificaron con códigos de barras utilizando pares de cebadores de índice dual únicos (New England Biolabs) y las bibliotecas se agruparon y secuenciaron en un instrumento HiSeq 4000 (Illumina) o un instrumento NovaSeq 6000 con lecturas de extremo emparejado de 2 × 150 pb para bibliotecas de ADN circular y 2 × Lecturas de extremos emparejados de 75 pb para bibliotecas de cDNA.

Las lecturas secuenciadas de las bibliotecas de ADNg se recortaron con TrimGalore (v.0.6.4)47 y se asignaron a la versión 19 del genoma humano (GRCh37/hg19). La alineación se realizó con el Burrows–Wheeler Aligner (BWA)-MEM (v.0.7.17)48. Siguiendo la recomendación del proyecto Human Cell Atlas49 (v.2.2.1)50 se utilizó para alinear los datos de RNA-seq obtenidos de Smart-seq2 (ref. 26) con una referencia de transcriptoma creada a partir de la anotación hg19 y ENCODE v.19 (referencia 51). Posteriormente, los genes y las isoformas se cuantificaron utilizando rsem (v.1.3.1)52 con una sola célula previa.

Antes de la secuenciación de Nanopore, el ADN circular amplificado de células individuales se sometió a digestión con endonucleasa T7 para reducir la ramificación del ADN. Luego, 1,5 µg de ADN circular amplificado se incubaron a 37 °C durante 30 min con 1,5 µl de endonucleasa I T7 (10 U µl−1, New England Biolabs) en 3 µl de NEBuffer 2 y agua libre de nucleasas hasta un volumen final de 30 µl. El ADN digerido con endonucleasa se purificó utilizando una proporción volumétrica de 1:0,7 de Ampure Beads y se eluyó en 25 µl de agua libre de nucleasas. Las bibliotecas se prepararon utilizando el ONT Rapid Barcoding Kit (n.º de catálogo SQK-RBK004, Oxford Nanopore Technologies) de acuerdo con las instrucciones del fabricante y se secuenciaron en una celda de flujo R9.4.1 MinION (FLO-MIN106, Oxford Nanopore Technologies). Se multiplexó un máximo de cuatro muestras por ejecución.

Los datos de scCircle-seq Nanopore fueron llamados base y demultiplexados usando Guppy (v.5.0.14; ejecutando guppy_basecaller con modelo dna_r9.4.1_450bps_hac y guppy_barcoder con FLO-MIN106 y parámetros predeterminados). Las lecturas obtenidas se filtraron por calidad usando NanoFilt53 (v.2.8.0) (-l 100--headcrop 50--tailcrop 50) y se alinearon usando ngmlr54 (v.0.2.7) contra el genoma de referencia GRCh37/hg19. Para llamar a los SV, aplicamos Sniffles54 (v.1.0.12) (--min_homo_af 0.7--min_het_af 0.1--min_length 50--min_support 4); para obtener la cobertura binada, usamos deepTools55 (v.3.5.1) bamCoverage. Todos estos pasos están disponibles como canalización de Snakemake (https://github.com/henssen-lab/nano-wgs).

Circle-seq en poblaciones a granel se realizó como se describió anteriormente3. Puede encontrar un protocolo detallado paso a paso en el servidor Nature Protocol Exchange.

Generamos datos H3K27me3 ChIP-seq para CHP-212 de acuerdo con un protocolo descrito previamente28. Brevemente, se fijaron de 5 a 10 millones de células CHP-212 en FCS-PBS al 10 % con paraformaldehído al 1 % durante 10 min a temperatura ambiente. La cromatina se preparó como se describió anteriormente28 y se cortó hasta un tamaño de fragmento de 200 a 500 pb. Los complejos H3K27me3-ADN se inmunoprecipitaron durante 15 ha 4 °C con un anticuerpo policlonal anti-H3K27me3 (n.º de catálogo 07-449, Sigma-Aldrich). En total, se usaron 10-15 μg de cromatina y 2,5 μg de anticuerpo para la inmunoprecipitación. Las bibliotecas para la secuenciación se prepararon con adaptadores Illumina Nextera de acuerdo con las recomendaciones proporcionadas. Las bibliotecas se secuenciaron en modo de lectura única de 50 pb en un secuenciador Illumina HiSeq 4000. La calidad de los archivos FASTQ se controló con FASTQC (v.0.11.8) y los adaptadores se recortaron con BBMap (v.38.58). Las lecturas se alinearon con el hg19 utilizando el BWA-MEM48 (v.0.7.15) con parámetros predeterminados. Las lecturas duplicadas se eliminaron con Picard (v.2.20.4).

Obtuvimos variación pública del número de copias de CHP-212, datos de ChIP–seq (H3K27ac, H3K4me1, CTCF) y ATAC–seq28,56. Para un análisis más detallado, utilizamos las pistas de peces gordos procesadas, filtradas para excluir las regiones incluidas en la lista negra del Centro de análisis de datos (DAC) de ENCODE y normalizadas para leer recuentos por millón (CPM) en contenedores de 10 pb y llamadas máximas proporcionadas por Helmsauer et al.28. Para evaluar la correlación de las marcas epigenéticas con las regiones circulares, solo consideramos las regiones circulares que no se superponen con la variación del número de copias en las regiones incluidas en la lista negra CHP-212 o ENCODE DAC. Para los datos de ChIP–seq y ATAC–seq de H3K27ac, H3K4me1 y H3K27me3, calculamos la señal CPM media en todas las regiones del círculo, ponderada por los respectivos tamaños de círculo. Para probar la asociación estadística, creamos 1,000 conjuntos de datos con posiciones de círculo aleatorias dentro de un genoma enmascarado para la variación del número de copias en las regiones incluidas en la lista negra CHP-212 y ENCODE DAC usando regioneR57 (v.1.24.0). Derivamos un valor P empírico de la distribución de la señal CPM media en las regiones circulares aleatorias. Para los datos de CTCF ChIP-seq, calculamos el porcentaje de bordes circulares que se superponen con un pico de CTCF y evaluamos la significación estadística utilizando la misma estrategia de aleatorización descrita anteriormente.

El análisis de ADN circular extracromosómico se realizó como se describió anteriormente3. Las lecturas se recortaron en 3′ tanto para las secuencias de calidad como para las adaptadoras, y se eliminaron las lecturas si la longitud era inferior a 20 nucleótidos. Se usó BWA-MEM (v.0.7.15) con parámetros predeterminados para alinear las lecturas con el ensamblado de referencia humano GRCh37/hg19; Los duplicados ópticos y de PCR se eliminaron con Picard (v.2.16.0). Los círculos putativos se clasificaron con un procedimiento de dos pasos. En primer lugar, todas las lecturas divididas y los pares de lectura que contenían una orientación de lectura orientada hacia el exterior se colocaron en un nuevo archivo BAM. En segundo lugar, se detectaron regiones enriquecidas para la señal sobre el fondo con una tasa de descubrimiento falso <0,001 en el archivo BAM de "todas las lecturas" utilizando ventanas de ancho variable de Homer v.4.11 findPeaks (http://homer.ucsd.edu/); los bordes de estas regiones enriquecidas se intersecaron con las lecturas de apoyo al círculo. A continuación, se determinó empíricamente el umbral para la detección de círculos basándose en un conjunto de control positivo de ADN circular a partir de datos de secuenciación masiva. Solo las regiones enriquecidas intersecadas por al menos dos lecturas que respaldan círculos se clasificaron como regiones circulares.

Para evaluar el enriquecimiento adecuado del ADN circular, utilizamos cobertura sobre mtDNA como control interno. Las células con menos de diez lecturas por par de bases de profundidad de lectura de secuencia sobre mtDNA o menos del 85 % de bases genómicas capturadas en mtDNA se omitieron de análisis posteriores. Los valores de corte se eligieron en función de los valores máximos de profundidad de lectura detectados en los controles de endonucleasa (con PmeI; Fig. 1c complementaria). Para todos los análisis posteriores, solo consideramos los datos de secuenciación de las células digeridas con exonucleasa durante 5 días. Debido a que el mtDNA no está presente en los núcleos, filtramos los datos de Circle-seq de un solo núcleo solo en función del control de calidad del ARN.

Los recuentos de lectura de los círculos putativos se cuantificaron utilizando bedtools multicov (https://bedtools.readthedocs.io) de archivos BAM de una sola célula en contenedores de 100 kb en todos los cromosomas canónicos del ensamblaje del genoma GRCh37/hg19. Los recuentos se normalizaron a la profundidad de secuenciación en cada celda y cada contenedor se marcó como positivo si contenía un enriquecimiento de lectura circular con P < 0,05 en comparación con la distribución de lectura de fondo. Luego, los contenedores se clasificaron en tres grupos según las coordenadas genómicas: (1) ecDNA si la región se superponía al amplicón ensamblado a partir de los datos de secuenciación a granel; (2) crom; y (3) todos los demás sitios. A continuación, se analizó la recurrencia trazando la fracción de células que contenían un círculo detectado en cada una de las tres categorías.

Se utilizó la fase de referencia para asignar cada SNP a uno de los dos alelos en función de los datos WGS a granel. Luego, se genotiparon células individuales para comparar si se obtuvo el mismo alelo en todas ellas. Para este análisis, utilizamos los SNP conocidos identificados por el Proyecto 1000 Genomas58 y extrajimos la cobertura y los recuentos de nucleótidos para cada posición anotada. En regiones con desequilibrio alélica, como las ganancias de alto número de copias en los loci de ecDNA, la frecuencia del alelo B de un SNP heterocigoto es significativamente diferente de 0,5. Por lo tanto, podríamos asignar cada SNP en estas regiones al alelo ganado o no ganado. Luego, también genotipamos todas las células individuales en cada ubicación SNP conocida y visualizamos los valores de frecuencia del alelo B resultantes mientras mantuvimos la asignación de alelos de los datos WGS a granel.

Se calculó la cobertura promedio de todos los genes anotados y los genes se dividieron en genes de amplicón y no amplicón en función de si su ubicación genómica se superponía con las regiones de ADNec identificadas por célula. La cobertura de todos los genes de amplicón se normalizó mediante la cobertura de fondo, es decir, la cobertura media winsorizada de todos los genes que no son de amplicón. Se eligió una media winsorizada para tener en cuenta el hecho de que la identificación de las regiones de ecDNA podría haber sido incompleta; por lo tanto, el 5% superior e inferior de los valores se eliminaron de la cobertura de fondo. Los valores resultantes se transformaron en log2 y se usaron como proxy para el número de copias de ecDNA.

La solicitud de SV para scCircle-seq se realizó con lumpy-sv55 (v.0.2.14) y SvABA (v.1.1.0). Hasta donde sabemos, no hay disponible una llamada SV dedicada para datos de ADN de una sola célula. Sin embargo, debido al alto número de copias de ecDNA, los métodos masivos funcionan.

Se usó SAMtools59 (v.1.11) para fusionar todos los archivos de alineación de la misma línea celular en una alineación pseudobulk. Para lograr una cobertura más cercana a la secuenciación masiva estándar, el archivo BAM resultante se redujo posteriormente al 10 % de su tamaño original mediante SAMtools. La identificación de SV en WGS y los datos combinados de scCircle-seq para las líneas celulares TR14 y CHP-212 se logró utilizando lumpy-sv60 (v.0.3.1) y SvABA61 (v.1.1.0), ambos con parámetros estándar. El preprocesamiento de los archivos BAM, que incluía el filtrado de lecturas de menor tamaño (<20 pb) y de menor calidad (MAPQ < 5), además de admitir recuentos de lecturas y cálculos VAF, se realizó mediante SAMtools59 (v.1.10). Todos los pasos del análisis se completaron utilizando el genoma de referencia GRCh37/hg19. La identificación y el conteo de lecturas que respaldan los puntos de interrupción de SV se realizaron considerando lecturas divididas y mapeadas anormalmente y filtrando lecturas duplicadas y alineaciones secundarias.

Para garantizar la compatibilidad con los informes de variación mitocondrial estándar62, cada muestra de secuenciación de una sola célula se realineó a GRCh37/hg19 con una referencia mitocondrial de la secuencia de referencia de Cambridge revisada sustituida (GenBank no. NC_012920) usando BWA-MEM63 (v.0.7.17). Las lecturas duplicadas se eliminaron con Picard (v.2.23.8). Se usó GATK4/Mutect264 (v.4.1.9.0) con parámetros predeterminados para llamar variantes en datos de secuenciación scCircle-seq combinados (pseudobulk) y datos de secuenciación de scCircle-seq combinados. Solo se conservaron las variantes en los cromosomas canónicos (incluido chrM) y pasaron GATK4/FilterMutectCalls y posteriormente se filtraron para las regiones previamente reconstruidas para las respectivas líneas celulares (Fig. 3a) usando el filtro bcftools con flag-r.

Para la identificación de SNV mitocondriales en células individuales, aplicamos una canalización personalizada que consiste en GATK4/Mutect2 (ref. 64) (v.4.1.9.0) en modo mitocondrial y Mutserve65 (v.2.0.0-rc12), una variante de llamador optimizada para detectar sitios heteroplásmicos en datos de secuenciación mitocondrial, con parámetros predeterminados. Primero, las variantes fueron llamadas por ambos llamantes para cada celda individual por separado. Luego, las variantes se filtraron en un proceso de dos pasos: (1) las variantes solo se conservaron si el mismo autor de la llamada las había llamado en al menos dos muestras; y (2) las variantes restantes solo se mantuvieron si ambas personas las llamaban. Se eliminaron las variantes etiquetadas como 'lista negra' por Mutserve. Para inferir la frecuencia de alelos para cada variante en el conjunto final, cada célula individual se sometió a genotipado usando alleleCount (v.4.0.2) (https://github.com/cancerit/alleleCount). Solo se mantuvieron las lecturas mapeadas de forma única a la referencia mitocondrial y con una calidad de mapeo ≥ 30. Para cada alelo b alternativo llamado en la posición x, la frecuencia alélica (AF) se calculó como:

La matriz de AF de una sola célula x variante resultante se filtró adicionalmente de forma manual y por separado para cada línea celular. Células individuales con menos de tres variantes y variantes con una frecuencia alélica de columna máxima < 5 %, AF media (MAF) > 30 % y MAF < 0,1 % para CHP-212, así como MAF > 30 % y MAF < 0,1 % para TR14 se consideraron poco informativos para la agrupación y se eliminaron en función de la verificación puntual.

La visualización del mapa de calor de la matriz AF filtrada de una sola celda x variante se generó utilizando el paquete R ComplexHeatmap66 (v.2.6.2). Luego se aplicó el agrupamiento jerárquico a las celdas individuales usando el paquete R hclust con el parámetro del método de aglomeración 'completo'. Los árboles filogenéticos se renderizaron utilizando el paquete R dendextend (v.1.15.2).

El análisis de microhomología se realizó con NCBI BLAST (https://blast.ncbi.nlm.nih.gov/Blast.cgi) con los siguientes parámetros: blastn -task megablast -word_size = 4 -evalue = 1 -outfmt '6 qseqid length evalue ' -subject_bethit -reward = 1 -penalty = -2. Estos parámetros buscan una longitud mínima de microhomología de 4 pb y los valores estándar de recompensa y penalización para la coincidencia y la falta de coincidencia de nucleótidos. Además, solo consideramos resultados significativos con un valor Expect < 1. Para evaluar la presencia de microhomología alrededor de las uniones circulares del ADN, generamos archivos que incluyen 100 pb alrededor del inicio y el final del círculo (50 pb dentro del ADN circular y 50 pb de ADN lineal). Para poder realizar este análisis, filtramos todos los círculos con una longitud <100 pb. Luego, comparamos las secuencias para cada par inicial y final (una unión circular), evaluando y recuperando secuencias microhomólogas alrededor de la unión circular. Este análisis se repitió para cada círculo individual en las líneas celulares CHP-212 y TR14.

Las células y los núcleos se cargaron en Seurat67 (v.4.10); Se incluyeron las características que se detectaron en al menos tres celdas. Posteriormente, se seleccionaron células con 5000 o más características en líneas celulares y 2000 características en células T y núcleos para análisis posteriores. También se excluyeron células o núcleos con alta expresión de genes mitocondriales (>15 % en células individuales y >2,5 % en núcleos). Los datos se normalizaron con un factor de escala de 10.000 y se escalaron utilizando la configuración predeterminada de ScaleData. Para tener en cuenta la longitud del gen y el recuento total de lecturas en cada celda, los datos de Smart-seq2 se normalizaron utilizando transcripciones por millón; luego, se agregó una pseudocuenta de uno y se aplicó la transformación de logaritmo natural. Los primeros cuatro componentes principales fueron significativos; por lo tanto, los primeros cinco componentes principales se usaron para FindNeighbors y RunUMAP para capturar la mayor cantidad de variación posible según lo recomendado por los autores de Seurat. La resolución de FindClusters se estableció en 0,5.

La fase del ciclo celular se asignó a células individuales en función de la expresión de los marcadores de fase G2/M y S utilizando la función Seurat CellCycleScoring.

Los ADN circulares muy pequeños se definieron como círculos de menos de 3 kb. Para calcular el número relativo de este subtipo de ADN circular pequeño por célula, el número de ADN circular <3 kb se dividió por el número total de círculos en una célula. Las celdas se clasificaron por su número relativo y se agruparon tomando el 40% superior e inferior de la lista clasificada, definida como 'alta' y 'baja', respectivamente. El cambio de pliegue logarítmico de la expresión génica entre los dos grupos se calculó utilizando la función FindMarkers en el paquete Seurat R67 (v.4.10) sin umbral de cambio de pliegue logarítmico y una tasa de detección mínima por gen de 0,05. El paquete R clusterProfiler68 (v.4.0.5) se usó para realizar GSEA no supervisada de términos de ontología de genes usando gseGO e incluyendo conjuntos de genes con al menos tres genes y un máximo de 800 genes.

La cobertura de las regiones de amplicón de ecDNA en los archivos BAM de scCircle-seq y scRNA-seq se calculó con bamCoverage55 mediante la normalización de CPM. La correlación entre la cobertura de Circle-seq y RNA-seq se analizó ajustando un modelo lineal.

Se fusionaron los archivos FASTQ de RNA-seq de una sola célula y extremos emparejados (96 células para TR14 y 192 células para CHP-212). Los datos combinados obtenidos se alinearon con STAR69 (v.2.7.9a) al señuelo de referencia GRCh37/hs37d5, utilizando la anotación del gen GENCODE 19, lo que permite la alineación quimérica (--chimOutType WithinBAM SoftClip). Para llamar y visualizar los genes de fusión, se aplicó Arriba70 (v.2.1.0), con los parámetros personalizados -F 150 -U 700. El conjunto de llamadas seguro final incluía solo fusiones con (1) cobertura total en el punto de ruptura ≥ 50× y (2) ≥30 % de las lecturas mapeadas divididas o lecturas discordantes. Solo los genes de fusión en la proximidad (± 10 Mb) de los límites del amplicón se consideraron para el análisis posterior.

Usamos las reconstrucciones de amplicón proporcionadas por Helmsauer et al.28 para CHP-212 y Hung et al.23 para TR14. Brevemente, estas reconstrucciones se obtuvieron organizando un conjunto filtrado de Illumina WGS (CHP-212) y Nanopore WGS (TR14) llamadas SV como gráficos de genoma utilizando gGnome71 (v.0.1) (intervalos genómicos como nodos y referencia o SV como bordes). Luego, se identificaron rutas circulares a través de estos gráficos que incluían los oncogenes amplificados y podrían explicar los principales pasos del número de copias observados en la línea celular respectiva. Para los dos pacientes agregados al estudio, el paciente no. 1 y paciente no. 2, se generaron datos superficiales de Nanopore del genoma completo tal como lo describen Helmsauer et al.28. La llamada base, el filtrado de lectura (NanoFilt −l 300), el mapeo y la llamada SV se realizaron como se describió anteriormente en los Métodos ('Procesamiento de datos Nanopore scCircle-seq'). Para la reconstrucción de ecDNA, se compiló un conjunto de llamadas SV confiables (variante AF> 0.2 y lecturas de soporte ≥ 50 ×). En cuanto a CHP-212 y TR14, se construyó un gráfico de genoma usando gGnome61 (v.0.1) y se comisariado manualmente. Para verificar la corrección de la estructura del amplicón para las muestras de pacientes, se tomaron muestras de lecturas de Nanopore simuladas in silico del amplicón reconstruido usando una versión adaptada de PBSIM2 (ref. 72) (https://github.com/madagiurgiu25/pbsim2) y preprocesadas como el muestras originales de pacientes. Por último, se compararon los perfiles SV entre las muestras originales y la simulación in silico. Todos los amplicones reconstruidos se visualizaron utilizando gTrack (v.0.1.0; https://github.com/mskilab/gTrack), incluido el genoma de referencia GRCh37/hg19 y la pista GENCODE 19.

Utilizamos el algoritmo de clasificación circular descrito anteriormente para definir regiones circulares enriquecidas con ADN en células individuales. Para cada célula individual, definimos si las regiones circulares enriquecidas con ADN se superponían con el amplicón de ADNc (MYNC, CDK4, MDM2) ensamblado a partir de datos de secuenciación masiva de TR14 mediante la función findOverlaps del paquete R GenomicRanges73 (v.1.44.0). Se definió la presencia o ausencia de superposición para cada uno de los tres ADNc de MYNC, CDK4 y MDM2 de forma independiente, excluyendo las regiones de amplicón compartidas por los ADNec de MYCN y CDK4.

No se utilizó ningún método estadístico para predeterminar el tamaño de la muestra. No se excluyeron datos de los análisis. Los experimentos no fueron aleatorios y los investigadores no estaban cegados a la asignación durante los experimentos y la evaluación de los resultados. Los experimentos FISH se realizaron una vez por línea celular y tumor primario.

Más información sobre el diseño de la investigación está disponible en el Resumen de informes de Nature Portfolio vinculado a este artículo.

Los datos de secuenciación generados en este estudio están disponibles en el Archivo Europeo de Genomas y Fenómenos con el número de acceso. EGAS00001007026. Los archivos ChIP–seq estrechoPeak y bigwig se descargaron de https://data.cyverse.org/dav-anon/iplant/home/konstantin/helmsaueretal/. Todos los demás datos están disponibles del autor correspondiente a petición razonable. Los datos de origen se proporcionan con este documento.

El código de análisis de datos asociado con esta publicación se puede encontrar en https://github.com/henssen-lab/scEC-T-seq.

Stuart, T. & Satija, R. Análisis integrativo unicelular. Nat. Rev. Genet. 20, 257–272 (2019).

CAS PubMed Google Académico

Turner, KM et al. La amplificación de oncogenes extracromosómicos impulsa la evolución tumoral y la heterogeneidad genética. Naturaleza 543, 122–125 (2017).

CAS PubMed PubMed Central Google Académico

Koche, RP et al. El ADN circular extracromosómico impulsa la remodelación del genoma oncogénico en el neuroblastoma. Nat. Gineta. 52, 29–34 (2020).

CAS PubMed Google Académico

Shibata, Y. et al. MicroADN extracromosómicos y microdeleciones cromosómicas en tejidos normales. Ciencia 336, 82–86 (2012).

CAS PubMed PubMed Central Google Académico

Moller, HD et al. Los elementos circulares de ADN de origen cromosómico son comunes en el tejido somático humano sano. Nat. común 9, 1069 (2018).

PubMed PubMed Central Google Académico

Wang, Y. et al. Los eccDNAs son productos apoptóticos con alta actividad inmunoestimuladora innata. Naturaleza 599, 308–314 (2021).

CAS PubMed PubMed Central Google Académico

Cohen, S., Regev, A. & Lavi, S. Pequeño ADN circular polidisperso (spcDNA) en células humanas: asociación con inestabilidad genómica. Oncogen 14, 977–985 (1997).

CAS PubMed Google Académico

Henson, JD et al. Los círculos C de ADN son marcadores específicos y cuantificables de la actividad alternativa de alargamiento de los telómeros. Nat. Biotecnología. 27, 1181–1185 (2009).

CAS PubMed Google Académico

Okazaki, K., Davis, DD y Sakano, H. Secuencias del gen β del receptor de células T en el ADN circular de los núcleos de timocitos: evidencia directa de la eliminación del ADN intramolecular en la unión de VDJ. Celda 49, 477–485 (1987).

CAS PubMed Google Académico

Verhaak, RGW, Bafna, V. & Mischel, PS Amplificación de oncogenes extracromosómicos en la patogénesis y evolución de tumores. Nat. Rev. Cáncer 19, 283–288 (2019).

CAS PubMed PubMed Central Google Académico

Kim, H. et al. El ADN extracromosómico se asocia con la amplificación del oncogén y un mal resultado en múltiples tipos de cáncer. Nat. Gineta. 52, 891–897 (2020).

CAS PubMed PubMed Central Google Académico

Cox, D., Yuncken, C. & Spriggs, AI Cuerpos diminutos de cromatina en tumores malignos de la infancia. Lanceta 1, 55–58 (1965).

CAS PubMed Google Académico

Lee, J., Hyeon, DY & Hwang, D. Multiómica unicelular: tecnologías y métodos de análisis de datos. Exp. mol. Medicina. 52, 1428–1442 (2020).

CAS PubMed PubMed Central Google Académico

Levan, A. & Levan, G. ¿Tienen centrómeros que funcionan en minutos dobles? Hereditas 88, 81–92 (1978).

CAS PubMed Google Académico

Barker, PE, Drwinga, HL, Hittelman, WN y Maddox, AM Los minutos dobles se replican una vez durante la fase S del ciclo celular. Exp. Resolución celular 130, 353–360 (1980).

CAS PubMed Google Académico

Mark, J. Double-minutes: una aberración cromosómica en los sarcomas de Rous en ratones. Hereditas 57, 1–22 (1967).

CAS PubMed Google Académico

Yi, E. et al. Las imágenes de células vivas muestran una segregación desigual de elementos de ADN extracromosómico y centros de ADN extracromosómico transcripcionalmente activos en el cáncer. Descubrimiento del cáncer. 12, 468–483 (2022).

CAS PubMed Google Académico

Yi, E., Chamorro González, R., Henssen, AG & Verhaak, RGW Extrachromosomal DNA amplifications in cancer. Nat. Rev. Genet. 23, 760–771 (2022).

CAS PubMed Google Académico

van Leen, E., Brückner, L. & Henssen, AG La movilidad genómica y espacial del ADN extracromosómico y sus implicaciones para la terapia del cáncer. Nat. Gineta. 54, 107–114 (2022).

CAS PubMed Google Académico

deCarvalho, AC et al. La herencia discordante de elementos de ADN cromosómico y extracromosómico contribuye a la evolución dinámica de la enfermedad en el glioblastoma. Nat. Gineta. 50, 708–717 (2018).

CAS PubMed PubMed Central Google Académico

Nathanson, DA et al. Resistencia a la terapia dirigida mediada por la regulación dinámica del ADN EGFR mutante extracromosómico. Ciencia 343, 72–76 (2014).

CAS PubMed Google Académico

Lange, JT et al. La dinámica evolutiva del ADN extracromosómico en cánceres humanos. Nat. Gineta. 54, 1527-1533 (2022).

CAS PubMed PubMed Central Google Académico

Hung, KL et al. Los centros de ecDNA impulsan la expresión cooperativa de oncogenes intermoleculares. Naturaleza 600, 731–736 (2021).

CAS PubMed PubMed Central Google Académico

Zhu, Y. et al. El ADN extracromosómico oncogénico funciona como potenciadores móviles para amplificar globalmente la transcripción cromosómica. Cancer Cell 39, 694–707 (2021).

CAS PubMed PubMed Central Google Académico

Møller, HD, Parsons, L., Jørgensen, TS, Botstein, D. y Regenberg, B. El ADN circular extracromosómico es común en la levadura. proc. Academia Nacional. ciencia EE. UU. 112, E3114–E3122 (2015).

PubMed PubMed Central Google Académico

Picelli, S. et al. Smart-seq2 para perfiles sensibles de transcriptoma de longitud completa en células individuales. Nat. Métodos 10, 1096–1098 (2013).

CAS PubMed Google Académico

Macaulay, IC et al. G&T-seq: secuenciación paralela de transcriptomas y genomas unicelulares. Nat. Métodos 12, 519–522 (2015).

CAS PubMed Google Académico

Helmsauer, K. et al. El secuestro del potenciador determina la arquitectura del amplicón MYCN circular extracromosómico en el neuroblastoma. Nat. común 11, 5823 (2020).

CAS PubMed PubMed Central Google Académico

Morton, AR et al. Los potenciadores funcionales dan forma a las amplificaciones de oncogenes extracromosómicos. Celda 179, 1330–1341 (2019).

CAS PubMed PubMed Central Google Académico

Deshpande, V. et al. Exploración del panorama de las amplificaciones focales en el cáncer con AmpliconArchitect. Nat. común 10, 392 (2019).

CAS PubMed PubMed Central Google Académico

Nowell, PC La evolución clonal de las poblaciones de células tumorales. Ciencia 194, 23–28 (1976).

CAS PubMed Google Académico

Ludwig, LS y col. Rastreo de linaje en humanos habilitado por mutaciones mitocondriales y genómica unicelular. Celda 176, 1325–1339 (2019).

CAS PubMed PubMed Central Google Académico

Wahl, GM La importancia del ADN circular en la amplificación de genes de mamíferos. Cáncer Res. 49, 1333–1340 (1989).

CAS PubMed Google Académico

Shoshani, O. et al. La cromotripsis impulsa la evolución de la amplificación génica en el cáncer. Naturaleza 591, 137–141 (2021).

CAS PubMed Google Académico

Dillon, LW y col. La producción de microADN extracromosómicos está relacionada con las vías de reparación de errores de emparejamiento y la actividad transcripcional. Representante celular 11, 1749-1759 (2015).

CAS PubMed PubMed Central Google Académico

Tatman, PD & Black, JC El ADN circular extracromosómico de los tumores TCGA se genera a partir de loci genómicos comunes, se caracteriza por autohomología y motivos de ADN cerca de los puntos de ruptura del círculo. Cánceres 14, 2310 (2022).

CAS PubMed PubMed Central Google Académico

Paulsen, T. et al. Los niveles de microDNA dependen de MMEJ, son reprimidos por la vía c-NHEJ y estimulados por el daño del ADN. Ácidos Nucleicos Res. 49, 11787–11799 (2021).

CAS PubMed PubMed Central Google Académico

Sunnerhagen, P., Sjöberg, RM, Karlsson, AL, Lundh, L. & Bjursell, G. Clonación molecular y caracterización de ADN circular polidisperso pequeño de células 3T6 de ratón. Ácidos Nucleicos Res. 14, 7823–7838 (1986).

CAS PubMed PubMed Central Google Académico

Huang, C., Jia, P., Chastain, M., Shiva, O. y Chai, W. El complejo humano CTC1/STN1/TEN1 regula el mantenimiento de los telómeros en las células cancerosas ALT. Exp. Resolución celular 355, 95–104 (2017).

CAS PubMed PubMed Central Google Académico

Downey, M. & Durocher, D. Reparación de cromatina y ADN: los beneficios de la relajación. Nat. Biol celular. 8, 9–10 (2006).

CAS PubMed Google Académico

Phillips, JE & Corces, VG CTCF: maestro tejedor del genoma. Celda 137, 1194–1211 (2009).

PubMed PubMed Central Google Académico

Wu, S. et al. El ecDNA circular promueve la cromatina accesible y la alta expresión de oncogenes. Naturaleza 575, 699–703 (2019).

CAS PubMed PubMed Central Google Académico

Rosswog, C. et al. La cromotripsis seguida de recombinación circular impulsa la amplificación del oncogén en el cáncer humano. Nat. Gineta. 53, 1673–1685 (2021).

CAS PubMed Google Académico

Sanders, AD, Falconer, E., Hills, M., Spierings, DCJ y Lansdorp, PM La secuenciación de cadena de plantilla de una sola célula por Strand-seq permite la caracterización de homólogos individuales. Nat. Protocolo 12, 1151–1176 (2017).

CAS PubMed Google Académico

Sanders, AD et al. Análisis unicelular de variaciones estructurales y reordenamientos complejos con procesamiento de tres canales. Nat. Biotecnología. 38, 343–354 (2020).

CAS PubMed Google Académico

González, RC, Conrad, T., Kasack, K. y Henssen, AG scEC &T-seq: un método para la secuenciación paralela de ADN circular extracromosómico y transcriptomas en células humanas individuales. https://doi.org/10.21203/rs.3.pex-2180/v1

Krueger, F., James, F., Ewels, P., Afyounian, E. y Schuster-Boeckler, B. TrimGalore v.0.6.7. Zenode https://zenode.org/record/5127899#.ZDUyQuzMIqs (2021).

Li, H. Alineación de lecturas de secuencias, secuencias de clones y contigs de ensamblaje con BWA-MEM. Preimpresión en arXiv https://doi.org/10.48550/arXiv.1303.3997 (2013).

Regev, A. et al. Atlas de células humanas. eLife 6, e27041 (2017).

PubMed PubMed Central Google Académico

Kim, D., Paggi, JM, Park, C., Bennett, C. y Salzberg, SL Alineación y genotipado del genoma basado en gráficos con HISAT2 y genotipo HISAT. Nat. Biotecnología. 37, 907–915 (2019).

CAS PubMed PubMed Central Google Académico

Davis, CA et al. La Enciclopedia de elementos de ADN (ENCODE): actualización del portal de datos. Ácidos Nucleicos Res. 46, D794–D801 (2018).

CAS PubMed Google Académico

Li, B. & Dewey, CN RSEM: cuantificación precisa de la transcripción a partir de datos de RNA-Seq con o sin un genoma de referencia. BMC Bioinformática 12, 323 (2011).

CAS PubMed PubMed Central Google Académico

De Coster, W., D'Hert, S., Schultz, DT, Cruts, M. y Van Broeckhoven, C. NanoPack: visualización y procesamiento de datos de secuenciación de lectura larga. Bioinformática 34, 2666–2669 (2018).

CAS PubMed PubMed Central Google Académico

Sedlazeck, FJ et al. Detección precisa de variaciones estructurales complejas mediante secuenciación de una sola molécula. Nat. Métodos 15, 461–468 (2018).

CAS PubMed PubMed Central Google Académico

Ramírez, F. et al. deepTools2: un servidor web de próxima generación para el análisis de datos de secuenciación profunda. Ácidos Nucleicos Res. 44, W160–W165 (2016).

PubMed PubMed Central Google Académico

Boeva, V. et al. Heterogeneidad de la identidad celular de neuroblastoma definida por circuitos transcripcionales. Nat. Gineta. 49, 1408–1413 (2017).

CAS PubMed Google Académico

Gel, B. et al. regioneR: un paquete de R/Bioconductor para el análisis de asociación de regiones genómicas basado en pruebas de permutación. Bioinformática 32, 289–291 (2016).

CAS PubMed Google Académico

Auton, A. et al. Una referencia mundial para la variación genética humana. Naturaleza 526, 68–74 (2015).

Académico de Google de PubMed

Danecek, P. et al. Doce años de SAMtools y BCFtools. Gigaciencia 10, giab008 (2021).

PubMed PubMed Central Google Académico

Layer, RM, Chiang, C., Quinlan, AR & Hall, IM LUMPY: un marco probabilístico para el descubrimiento de variantes estructurales. Genoma Biol. 15, R84 (2014).

PubMed PubMed Central Google Académico

Wala, JA et al. SvABA: detección de variantes estructurales e indeles en todo el genoma mediante ensamblaje local. Genoma Res. 28, 581–591 (2018).

CAS PubMed PubMed Central Google Académico

Bandelt, HJ, Kloss-Brandstatter, A., Richards, MB, Yao, YG & Logan, I. El caso para el uso continuado de la Secuencia de referencia de Cambridge revisada (rCRS) y la estandarización de la notación en estudios de ADN mitocondrial humano. J. Hum. Genet 59, 66–77 (2014).

CAS PubMed Google Académico

Li, H. & Durbin, R. Alineación de lectura larga rápida y precisa con la transformada de Burrows-Wheeler. Bioinformática 26, 589–595 (2010).

PubMed PubMed Central Google Académico

Cibulskis, K. et al. Detección sensible de mutaciones puntuales somáticas en muestras de cáncer impuras y heterogéneas. Nat. Biotecnología. 31, 213–219 (2013).

CAS PubMed PubMed Central Google Académico

Weissensteiner, H. et al. mtDNA-Server: análisis de datos de secuenciación de próxima generación de ADN mitocondrial humano en la nube. Ácidos Nucleicos Res. 44, W64–W69 (2016).

CAS PubMed PubMed Central Google Académico

Gu, Z., Eils, R. & Schlesner, M. Los mapas de calor complejos revelan patrones y correlaciones en datos genómicos multidimensionales. Bioinformática 32, 2847–2849 (2016).

CAS PubMed Google Académico

Hao, Y. et al. Análisis integrado de datos unicelulares multimodales. Celda 184, 3573–3587 (2021).

CAS PubMed PubMed Central Google Académico

Yu, G., Wang, L.-G., Han, Y. y He, Q.-Y. clusterProfiler: un paquete R para comparar temas biológicos entre grupos de genes. OMICS 16, 284–287 (2012).

CAS PubMed PubMed Central Google Académico

Dobin, A. et al. STAR: alineador RNA-seq universal ultrarrápido. Bioinformática 29, 15–21 (2013).

CAS PubMed Google Académico

Uhrig, S. et al. Detección precisa y eficiente de fusiones de genes a partir de datos de secuenciación de ARN. Genoma Res. 31, 448–460 (2021).

PubMed PubMed Central Google Académico

Hadi, K. et al. Distintas clases de variación estructural compleja descubiertas en miles de gráficos del genoma del cáncer. Celda 183, 197–210 (2020).

CAS PubMed PubMed Central Google Académico

Ono, Y., Asai, K. & Hamada, M. PBSIM2: un simulador para secuenciadores de lectura larga con un modelo generativo novedoso de puntajes de calidad. Bioinformática 37, 589–595 (2021).

CAS PubMed Google Académico

Lawrence, M. et al. Software para calcular y anotar rangos genómicos. Cómputo PLoS. Biol. 9, e1003118 (2013).

CAS PubMed PubMed Central Google Académico

Descargar referencias

AGH cuenta con el apoyo de Deutsche Forschungsgemeinschaft (DFG) (subvención n.º 398299703). Este proyecto ha recibido financiación del Consejo Europeo de Investigación en el marco del Programa de Investigación e Innovación Horizonte 2020 de la Unión Europea (subvención n.º 949172). AGH cuenta con el apoyo del programa de cátedra Deutsche Krebshilfe Mildred Scheel no. 70114107. Este proyecto fue apoyado por el Instituto de Salud de Berlín (BIH). El cálculo se realizó en el clúster de HPC para investigación del BIH. El proyecto que dio lugar a estos resultados contó con el apoyo de una beca de la Fundación 'la Caixa' (nº 100010434). El código de la beca es LCF/BQ/EU20/11810051. ER-F. cuenta con el apoyo de la Fundación Alexander von Humboldt. RX cuenta con el apoyo de Deutsche Krebshilfe. RPK es profesor visitante de BIH financiado por Stiftung Charité. MCS está financiado por Research Training Group 2424/CompCancer, financiado por DFG. RFS es profesor en el Centro de Investigación del Cáncer de Colonia Essen, financiado por el Ministerio de Cultura y Ciencia del Estado de Renania del Norte-Westfalia. Este trabajo fue parcialmente financiado por el Ministerio de Educación e Investigación de Alemania como BIFOLD (Instituto de Berlín para los Fundamentos del Aprendizaje y los Datos) (refs. 01IS18025A y 01IS18037A). Este trabajo fue entregado como parte del equipo eDyNAmiC respaldado por la asociación Cancer Grand Challenges financiada por Cancer Research UK (HYC no. CGCATF-2021/100012, AGH no. CGCATF-2021/100017) y el Instituto Nacional del Cáncer (HYC no. OT2CA278688, AGH nº OT2CA278644).

Estos autores supervisaron conjuntamente este trabajo: Richard P. Koche y Anton G. Henssen.

Departamento de Oncología y Hematología Pediátrica, Charité – Universitätsmedizin Berlin, miembro corporativo de Freie Universität Berlin, Humboldt-Universität zu Berlin, Berlín, Alemania

Rocío Chamorro González, Robin Xu, Mădălina Giurgiu, Elias Rodriguez-Fos, Eric van Leen, Konstantin Helmsauer, Heathcliff Dorado Garcia, Yi Bei, Karin Schmelz, Marco Lodrini, Hedwig E. Deubzer, Angelika Eggert, Johannes H. Schulte, Kerstin Haase & Anton G. Henssen

Centro de Investigación Experimental y Clínica del MDC y Charité Berlin, Berlín, Alemania

Rocío Chamorro González, Robin Xu, Mădălina Giurgiu, Elias Rodriguez-Fos, Lotte Brückner, Eric van Leen, Konstantin Helmsauer, Heathcliff Dorado Garcia, Yi Bei, Hedwig E. Deubzer, Kerstin Haase & Anton G. Henssen

Plataforma de Tecnología Genómica, Centro Max Delbrück de Medicina Molecular en la Asociación Helmholtz, Berlín, Alemania

Tomas Conrado

Instituto de Biología de Sistemas Médicos de Berlín, Centro Max Delbrück de Medicina Molecular de la Asociación Helmholtz, Berlín, Alemania

Maja C. Stöber, Sascha Sauer y Roland F. Schwarz

Charité - Universitätsmedizin Berlin, Berlín, Alemania

maya c. stoeber

Facultad de Ciencias de la Vida, Universidad Humboldt de Berlín, Berlín, Alemania

maya c. stoeber

Universidad Libre de Berlín, Berlín, Alemania

Mădălina Giurgiu

Instituto Fraunhofer de Terapia Celular e Inmunología, Rama de Bioanálisis y Bioprocesos IZI-BB, Potsdam, Alemania

Katharina Kasack

Centro Max Delbrück de Medicina Molecular, Berlín, Alemania

Lotte Brückner y Anton G. Henssen

RG Development and Disease, Instituto Max Planck de Genética Molecular, Berlín, Alemania

María E. Stefanova y Stefan Mundlos

Instituto de Genética Médica, Charité - Universitätsmedizin Berlin, Berlín, Alemania

María E. Stefanova y Stefan Mundlos

Centro de Regulomas Dinámicos Personales, Facultad de Medicina de la Universidad de Stanford, Stanford, CA, EE. UU.

Rey L. Hung y Howard Y. Chang

Centro de Terapias Regenerativas Berlin-Brandenburg, Charité - Universitätsmedizin Berlin, Berlín, Alemania

Stefan Mundos

Instituto Médico Howard Hughes, Facultad de Medicina de la Universidad de Stanford, Stanford, CA, EE. UU.

Howard Y Chang

Consorcio Alemán del Cáncer, sitio asociado Berlín y Centro Alemán de Investigación del Cáncer, Heidelberg, Alemania

Hedwig E. Deubzer, Angelika Eggert, Johannes H. Schulte, Kerstin Haase y Anton G. Henssen

Instituto de Salud de Berlín, Berlín, Alemania

Hedwig E. Deubzer, Angelika Eggert y Johannes H. Schulte

Instituto de Biología Computacional del Cáncer, Centro de Oncología Integrada, Centro de Investigación del Cáncer Colonia Essen Facultad de Medicina y Hospital Universitario de Colonia, Universidad de Colonia, Colonia, Alemania

roland f schwarz

Instituto de Berlín para los Fundamentos del Aprendizaje y los Datos, Berlín, Alemania

roland f schwarz

Centro de Investigación Epigenética, Centro de Cáncer Memorial Sloan Kettering, Nueva York, NY, EE. UU.

Richard P. Koche

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

RCG, TC, RPK y AGH contribuyeron al diseño del estudio y la recopilación e interpretación de datos. RCG, TC y KK realizaron los experimentos de una sola célula. RPK, RCG y K.Haase realizaron el análisis de los datos de scCircle-seq y WGS. ER-F. y MG realizó el análisis SV de los datos unicelulares y WGS. EV y MCS realizaron el análisis de datos scRNA-seq. MG realizó los análisis de detección de genes de fusión. RX realizó los análisis SNV en los datos unicelulares y WGS. LB realizó y analizó el FISH. K.Helmsauer y MG realizaron los análisis de reconstrucción de amplicón. MES realizó el ChIP-seq. K.Helmsauer realizó los análisis ChIP-seq. HDG, KS, YB, ML y KLH realizaron los experimentos y contribuyeron al análisis de datos. SM, HYC, HED, SS, AE, JHS y RFS contribuyeron al diseño del estudio. RCG, RPK y AGH dirigieron el diseño del estudio, realizaron el análisis de datos y escribieron el manuscrito, al que contribuyeron todos los autores.

Correspondencia a Anton G. Henssen.

RPK y AGH son fundadores de Econic Biosciences Ltd.

Nature Genetics agradece a Andrea Ventura, Jan Korbel y los otros revisores anónimos por su contribución a la revisión por pares de este trabajo. Los informes de los revisores están disponibles.

Nota del editor Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Figs suplementarias. 1–18, Tabla 7 y Nota 1.

Tablas complementarias 1–7.

Fuente de datos estadísticos para la Fig. 1.

Fuente de datos estadísticos para la Fig. 4.

Fuente de datos estadísticos para la Fig. 5.

Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Chamorro González, R., Conrad, T., Stöber, MC et al. Secuenciación paralela de ADN circular extracromosómico y transcriptomas en células cancerosas individuales. Nat Genet 55, 880–890 (2023). https://doi.org/10.1038/s41588-023-01386-y

Descargar cita

Recibido: 20 de diciembre de 2021

Aceptado: 28 de marzo de 2023

Publicado: 04 mayo 2023

Fecha de emisión: mayo de 2023

DOI: https://doi.org/10.1038/s41588-023-01386-y

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.

Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt