Cromosoma

Blog

HogarHogar / Blog / Cromosoma

Jul 15, 2023

Cromosoma

Biología de las Comunicaciones volumen 6, Número de artículo: 797 (2023) Cite este artículo 2215 Accesos 2 Detalles de Altmetric Metrics La ecologización urbana proporciona importantes servicios ecosistémicos y lugares ideales para las actividades urbanas.

Biología de las comunicaciones volumen 6, número de artículo: 797 (2023) Citar este artículo

2215 Accesos

2 altmétrico

Detalles de métricas

La ecologización urbana proporciona importantes servicios ecosistémicos y lugares ideales para la recreación urbana y es una consideración seria para los tomadores de decisiones municipales. Entre las especies arbóreas cultivadas en espacios verdes urbanos, Robinia pseudoacacia destaca por sus atractivas flores, fragancias, troncos altos, amplia adaptabilidad y servicios ecosistémicos esenciales. Sin embargo, aún se desconocen la base genómica y las consecuencias de su amplia plantación en espacios verdes urbanos. Aquí, informamos el ensamblaje del genoma a nivel cromosómico de R. pseudoacacia, que revela un tamaño de genoma de 682,4 Mb y 33.187 genes codificadores de proteínas. Más del 99,3% del conjunto está anclado a 11 cromosomas con un N50 de 59,9 Mb. Los análisis genómicos comparativos entre 17 especies revelan que las familias de genes relacionadas con rasgos favorecidos por los urbanitas, como la formación de madera, la biosíntesis y la tolerancia a la sequía, se expanden notablemente en R. pseudoacacia. Nuestros análisis genómicos de población recuperan además 11 genes que están bajo selección reciente. En última instancia, estos genes desempeñan funciones importantes en los procesos biológicos relacionados con el desarrollo de las flores, la retención de agua y la inmunización. En conjunto, nuestros resultados revelan las fuerzas evolutivas que dan forma a R. pseudoacacia cultivada para la ecologización urbana. Estos hallazgos también presentan una base valiosa para el desarrollo futuro de rasgos agronómicos y estrategias de mejoramiento molecular para R. pseudoacacia.

La ecologización urbana se refiere a la construcción organizada o semiorganizada de infraestructuras verdes, como espacios verdes urbanos, árboles en las calles y setos en las ciudades, que proporcionan el entorno ideal para la recreación urbana y actúan como un importante servicio ecosistémico para controlar la contaminación, regular la temperatura y gestionar aguas pluviales1,2,3. Con la aceleración de la urbanización en los países de ingresos bajos y medianos bajos, la ecologización urbana está atrayendo más atención por parte de los tomadores de decisiones municipales y los planificadores del paisaje4,5.

En China, 2,5 × 104 km2 de área construida (BUA) aumentaron de 2001 a 2018 y corresponden al 47,5% del aumento global y representan la velocidad de urbanización más rápida del mundo6. La demanda de infraestructura verde, particularmente en términos de plantación urbana, se ha vuelto cada vez más importante para los diseñadores de ciudades chinos debido a la rápida urbanización y al deseo de satisfacer las necesidades recreativas y las percepciones paisajísticas de los habitantes de las ciudades3. Sus logros marcaron a China como el mayor contribuyente a la ecologización urbana de la cobertura territorial en el mundo entre 2001 y 20186. Recientemente, otros estudios han demostrado que el cambio ambiental urbano puede influir en cuatro procesos evolutivos: mutación, deriva genética, flujo de genes y adaptación por selección natural7,8. Estas áreas urbanas representan ecosistemas novedosos donde la construcción de infraestructura verde brinda valiosas oportunidades para que los investigadores observen cómo los efectos genéticos y fenotípicos pueden acompañar el proceso de enverdecimiento urbano introducido por la actividad humana durante la urbanización9.

En las últimas décadas, Robinia pseudoacacia (langosta negra) se ha convertido en una de las especies leñosas más cultivadas y populares en las zonas verdes urbanas de China10,11,12. Estos árboles leguminosos cruzados, de rápido crecimiento y fijadores de nitrógeno pertenecen a la subfamilia Faboideae, familia Fabaceae, y se originaron en América del Norte. Luego fueron introducidos en regiones submediterráneas y templadas, incluidas Europa continental, Australia y Asia oriental (de las cuales China por sí sola posee más de un millón de hectáreas de plantaciones)13,14. En 2010, el área estimada de plantaciones de R. pseudoacacia fuera de su área de distribución nativa era de aproximadamente 3 millones de hectáreas, y el número sigue creciendo15. Actualmente, la especie se ha convertido en la segunda especie arbórea de hoja ancha más plantada en el mundo, después de Eucalyptus spp16.

R. pseudoacacia se introdujo por primera vez en China y se plantó en Nanjing y Qingdao a finales del siglo XIX17. En comparación con otras plantas en espacios verdes urbanos (como Trifolium repens, Cinnamomum camphora y Ligustrum lucidum), los urbanitas chinos prefieren R. pseudoacacia debido a sus ricas flores, fragancias atractivas, hojas anchas de hoja caduca y troncos altos18. Además, su alta tolerancia a una amplia gama de condiciones del suelo19 y su alta adaptabilidad a entornos hostiles y baja fertilidad le permiten prosperar en áreas urbanas en vastas regiones climáticas al tiempo que proporciona servicios ecosistémicos esenciales11,12,20,21,22. Por ejemplo, en la frágil meseta de Loess, ecológicamente frágil, R. pseudoacacia plantada por humanos cubre más de 70 000 ha23,24 y se ha demostrado que altera notablemente las estructuras de la vegetación, las propiedades del suelo y la biomasa y las actividades microbianas19,25. En Shenyang, una de las ciudades más grandes del noreste de China, R. pseudoacacia también ha desempeñado un papel importante en la mejora de la calidad del aire al absorber partículas finas ambientales con un diámetro ≤2,5 µm (PM2,5), que actúa como aire primario. contaminante que causa enfermedades humanas12.

Si bien los efectos ambientales y la morfología de R. pseudoacacia en los ecosistemas urbanos han sido bien investigados en el pasado, actualmente no sabemos mucho sobre la base genómica y las consecuencias de su amplia distribución en los espacios verdes urbanos. En particular, es esencial que identifiquemos un ensamblaje genómico preciso, completo y contiguo para esta especie, a fin de comprender su valiosa variación genética y aplicar tecnologías de biología molecular de vanguardia. Estas limitaciones obstruyen aún más el mejoramiento molecular de R. pseudoacacia y la introducción adecuada de R. pseudoacacia durante la construcción de infraestructura verde en las ciudades.

Aquí, creamos un ensamblaje del genoma a nivel de cromosoma de R. pseudoacacia que se descifró utilizando tecnologías integradas de secuenciación de lectura corta de Illumina, secuenciación de lectura larga de Nanopore y captura conformacional cromosómica (Hi-C). Caracterizamos su genoma en detalle, incluida la estructura genómica, la anotación genética y las secuencias repetidas. También realizamos un análisis de resecuenciación del genoma completo de 59 individuos de R. pseudoacacia en 14 ciudades chinas. Nuestro siguiente estudio genómico poblacional completo reveló relaciones genéticas entre todos los individuos e infirió sus historias demográficas. Además, identificamos firmas de selección que pueden estar involucradas en la plantación urbana. Juntos, nuestro estudio proporciona un recurso valioso para facilitar la genómica comparada, los estudios de evolución adaptativa y el mejoramiento asistido por genómica para R. pseudoacacia, y mejora nuestra comprensión general de la plantación urbana.

Para generar un genoma a nivel cromosómico para R. pseudoacacia (Fig. 1a), se secuenció el genoma de un único individuo de R. pseudoacacia tomado de Lanzhou, China (36°2′57″N, 103°51′34″E). utilizando una estrategia híbrida que combinó la secuenciación de lectura larga Oxford Nanopore, la secuenciación de extremos emparejados de Illumina y tecnologías Hi-C. Específicamente, obtuvimos 75,6 Gb de datos de lectura larga con una lectura N50 de 31,7 kb, lo que confirma la alta calidad de nuestras bibliotecas de secuenciación Oxford Nanopore (Tabla complementaria 1). Con base en estos datos, primero ensamblamos un conjunto de genoma de nivel contig de 682,4 Mb y luego lo pulimos utilizando lecturas de Illumina de alta precisión. Este conjunto contenía solo 55 contigs con un contig N50 de 32,1 Mb, lo que indica su alta continuidad (Tabla 1 y Tabla complementaria 2). Nuestro análisis de K-mer basado en los 111,34 Gb de datos de extremos emparejados de Illumina estimó que el genoma tenía aproximadamente 693,1 Mb con una tasa de heterocigosidad del 1,13% (Figura 1 complementaria y Tabla 3 complementaria), lo que es consistente con nuestro ensamblaje a nivel de contig. .

a El individuo secuenciado de R. pseudoacacia de la Universidad de Lanzhou, provincia de Gansu, China (36°2′57″N, 103°51′34″E). En la figura se muestran las flores de R. pseudoacacia. b Características del genoma del ensamblaje de R. pseudoacacia. De exterior a interior: (1) cromosomas del genoma, (2) densidad de genes, (3) densidad de repeticiones, (4) contenido de GC (guanina-citosina) e (5) información sintética.

Para mejorar aún más el ensamblaje del genoma, establecimos una biblioteca Hi-C y obtuvimos 78,27 Gb de lecturas Hi-C. El ensamblaje de R. pseudoacacia se ancló con éxito en 11 cromosomas con un N50 mejorado de 59,9 Mb que cubría el 99,3% del ensamblaje sin procesar (Fig. 1b, Fig. 2 complementaria y Tabla complementaria 4), lo que sugiere que la mayoría de las regiones del El genoma de R. pseudoacacia se ensamblaron con éxito a nivel cromosómico. Nuestro ensamblaje final mostró una mejor continuidad que la mayoría de los otros genomas de las especies de Fabaceae (Tabla complementaria 5).

La alta calidad de este genoma fue confirmada mediante múltiples métodos. Primero, realizamos análisis BUSCO para determinar la integridad de este ensamblaje del genoma, que informó una puntuación completa del 98,20% e indica una alta integridad (Tabla complementaria 6) y una baja redundancia de secuencias de haplotipos (Tabla complementaria 7). También alineamos los datos de resecuenciación del genoma completo de extremos emparejados de Illumina obtenidos de otros individuos y los datos del transcriptoma con este ensamblaje. Más del 97,9 % de los datos de resecuenciación y más del 96,5 % de los datos del transcriptoma se asignaron con éxito al ensamblaje, lo que sugiere una alta precisión para este ensamblaje.

Anotamos secuencias repetitivas en el genoma de R. pseudoacacia combinando métodos ab initio y basados ​​en homología. Se identificaron más de 405,9 Mb de secuencias como elementos repetitivos. Juntos, constituyeron el 59,47% del conjunto del genoma, predominantemente LTR (Tabla complementaria 8). Estos resultados son consistentes con observaciones previas en especies de leguminosas estrechamente relacionadas Lotus japonicus26, en las que las LTR son también el tipo más abundante de elementos repetidos. Curiosamente, aunque el genoma de R. pseudoacacia tenía un tamaño mayor que el de los estrechamente relacionados Lupinus albus y Cicer arietinum, la proporción (59,47%) de elementos repetitivos seguía siendo similar a la medida en estas dos especies. En concreto, Lupinus albus tiene un genoma de 451 Mb que contiene un 60% de elementos repetitivos27, y C. arietinum tiene un genoma de 545 Mb que contiene un 60% de elementos repetitivos28. La razón principal de esta diferencia en el tamaño del genoma se puede atribuir a la influencia de los retrotransposones repetidos terminales largos (LTR-RT) en el tamaño y la evolución del genoma (Figura complementaria 3). Los LTR-RT son responsables de más del 75% del genoma en algunas especies de plantas y han sido identificados como una fuerza impulsora importante detrás de las expansiones del genoma30. Estos resultados sugieren que el gran tamaño del genoma de R. pseudoacacia puede deberse parcialmente a la explosión de elementos repetitivos (Figura complementaria 3).

Utilizando un proceso de predicción de genes personalizado que incorporó enfoques ab initio, homología y basados ​​en transcriptomas, predijimos 33,187 genes codificadores de proteínas en el genoma de R. pseudoacacia (Tabla complementaria 9). La longitud promedio de los genes fue de 4492 pb con un promedio de 5 exones (Tabla complementaria 9). Emparejamos estos genes predichos con anotaciones funcionales depositadas en cinco bases de datos, incluidas TrEMBL, SWISS-PROT, Gene Ontology (GO), Kyoto Encyclopedia of Genes and Genomes (KEGG) e InterPro. Más del 99% de estos genes estaban funcionalmente anotados (Tabla complementaria 10). Nuestro conjunto de genes oficial para el genoma de R. pseudoacacia cubría más del 97% de los genes centrales de BUSCO (Tabla complementaria 11), lo que sugiere que este conjunto de genes era sólido y que la mayoría de los genes de este genoma estaban funcionalmente conservados. Investigamos más a fondo los genes sinténicos basados ​​en este conjunto de genes y descubrimos que había 2357 bloques sinténicos que variaban en tamaño de 5 a 393 pares de genes en el genoma de R. pseudoacacia (Fig. 1b), lo que indica la aparición de duplicación del genoma completo. (WGD) eventos.

Para revelar la filogenética de R. pseudoacacia y sus trayectorias evolutivas, comparamos su genoma con el de 14 especies de plantas de la familia Fabaceae y utilizamos Arabidopsis thaliana como grupo externo. Basándonos en 273 genes ortólogos estrictamente de copia única de estos 16 genomas de plantas, establecimos un árbol filogenético a escala genómica utilizando métodos de máxima probabilidad (ML) (Fig. 2a). Nuestro árbol filogenético mostró que R. pseudoacacia estaba ubicada cerca del clado formado por Medicago truncatula, Trifolium pratense, C. arietinum y L. japonicus. Estos resultados concuerdan con otros estudios previos31,32. Al estimar el tiempo de divergencia para cada nodo en función de los sitios 4DTv de los genes ortólogos de copia única, encontramos que el tiempo de divergencia entre R. pseudoacacia y otras cuatro especies (M. truncatula, T. pratense, C. arietinum y L. japonicus) fue hace unos 41,31 millones de años (Ma).

un árbol filogenético para R. pseudoacacia y las otras 14 especies de Fabaceae, con A. thaliana como grupo externo. Los valores de Bootstrap para los nodos fueron 100. El tiempo de divergencia estimado para cada nodo se indica con barras como intervalos de confianza (IC) del 95%. También están etiquetados el WGD, el WGT y la restricción de fósil utilizado. Las estadísticas del genoma de cada especie se muestran a la derecha. b Las distribuciones de Ks revelan eventos de WGD durante la evolución de R. pseudoacacia, G. max y M. truncatula, respectivamente (Datos complementarios 3). c La relación colineal entre R. pseudoacacia, G. max y M. truncatula está representada por una proporción de 4:2:2 (G. max: R. pseudoacacia: M. truncatula). Los bloques sinténicos interespecíficos que abarcan más de 14.000 genes se indican con líneas y algunos de los bloques 4:2:2 están resaltados en rojo.

Para proporcionar información sobre la historia de la evolución del genoma de R. pseudoacacia, comparamos sus tasas de sustitución sinónima (Ks) con los genomas de G. max y M. truncatula para identificar los pares de genes homólogos y detectar relaciones sinténicas entre estas especies. La tasa de curvas Ks de pares de genes colineales sugirió que los genomas de R. pseudoacacia se sometieron a dos rondas de duplicación del genoma completo (WGD). El evento más antiguo, conocido como evento γ, es compartido por todos los linajes principales de eudicotiledóneas, mientras que el evento más reciente ocurrió hace aproximadamente 59 millones de años y es compartido por todas las especies de la subfamilia Faboideae33 (Fig. 2b). En particular, a diferencia de G. max34, R. pseudoacacia no experimentó un evento de WGD específico de la especie (Fig. 2b). Además, detectamos un total de 88.836 pares de genes entre estas tres especies y los clasificamos en 2.304 bloques sinténicos, que cubren 662 Mb (97,73%) del conjunto de R. pseudoacacia. De acuerdo con el análisis de Ks, también encontramos una relación sinténica de 2:4 entre R. pseudoacacia y G. max, y una relación sinténica de 2:2 entre R. pseudoacacia y M. truncatula (Fig. 2c y Fig. complementaria 4). Una familia de genes seleccionada estaba compuesta por la misma proporción de copias de genes de diferentes especies analizadas anteriormente, lo que también confirma estos dos eventos de WGD (Figura complementaria 5). Estos resultados proporcionan evidencia adicional de que no hubo ningún evento de WGD específico de R. pseudoacacia.

Durante la historia evolutiva a largo plazo, es probable que la expansión de las familias de genes conduzca a sus diversificaciones funcionales (p. ej., neofuncionalización y subfuncionalización) y se espera que contribuya a adaptaciones dinámicas que aumenten su supervivencia en las plantas35,36. Para comprender las razones principales del gran conjunto de genes en R. pseudoacacia, realizamos análisis de familias de genes de las 16 especies de plantas para revelar su contribución a la divergencia adaptativa. Un total de 31.508 genes de R. pseudoacacia (94,9%) se agruparon en 15.789 familias de genes, de las cuales 612 familias de genes eran específicas de R. pseudoacacia. Nuestros resultados mostraron que 2256 familias de genes se expandieron en el genoma de R. pseudoacacia y ocuparon el tercer lugar entre todas las especies analizadas (Fig. 2a).

A partir de estas comparaciones, es probable que genes duplicados que hayan experimentado diversificaciones funcionales reflejen rasgos nuevos en una especie37. Nuestro análisis de enriquecimiento de GO encontró que las familias de genes expandidas en R. pseudoacacia estaban significativamente sobrerrepresentadas en tres categorías funcionales principales, incluida la formación de madera, la biosíntesis y la tolerancia a la sequía (Q <0,05, recuento> 35; Fig. 3a y Tabla complementaria 12). lo que probablemente contribuyó a las características específicas de las especies que llevaron a su amplio cultivo en la ecologización urbana. Este resultado concuerda con observaciones fisiológicas previas en R. pseudoacacia y resalta los rasgos que la convirtieron en una opción ventajosa para los planificadores urbanos. Específicamente, R. pseudoacacia es visualmente atractiva y económicamente competitiva en plantaciones urbanas debido a su principal mecanismo de crecimiento rápido, seguido de acumulación de nutrientes y muerte temprana que luego abre un lugar de crecimiento38,39.

a Varias 11 categorías GO relacionadas con la formación de madera, la biosíntesis y la tolerancia a la sequía están significativamente enriquecidas en las familias de genes ampliadas de R. pseudoacacia (todos P <0,05). b Números de genes para la familia de genes de lacasa (LAC) identificada entre cada especie. Se realizó la prueba t de Student de una muestra y dos colas para examinar las significaciones estadísticas, que se indican con asteriscos (*** P < 0,001). c Árbol de máxima probabilidad (ML) basado en las secuencias de proteínas de los genes LAC en R. pseudoacacia y A. thaliana. El análisis se realiza bajo el modelo PROTGAMMAGTR con 100 bootstraps.

En este estudio, encontramos que la familia de genes de lacasa (LAC) se expandió significativamente (P <0,05) en el genoma de R. pseudoacacia. La familia de genes de la lacasa (LAC) codifica enzimas que catalizan reacciones de oxidación-reducción y se ha informado ampliamente que está involucrada en la biosíntesis de lignina, que es esencial para la formación de madera y mejora la capacidad de transporte de agua de las plantas40. Aquí, encontramos que había 31 genes que pertenecen a la familia de genes LAC en el genoma de R. pseudoacacia al inspeccionar manualmente estos genes en 15 especies, verificando sus dominios de Cu-oxidasa conservados (Cu-oxidasa, Cu-oxidasa_2, Cu-oxidasa_3 ) y estructuras genéticas (Datos complementarios 1). También encontramos que R. pseudoacacia contenía un número significativamente mayor (P = 7,11 × 10-7) (también el mayor número) de genes LAC que todas las demás especies analizadas en Leguminosae, excepto G. max y G. soja que experimentaron un ronda adicional de WGD (Fig. 3b). Para revelar las trayectorias evolutivas de estos genes LAC, construimos además el árbol filogenético de la familia de genes LAC entre R. pseudoacacia y A. thaliana (Fig. 3c y Tabla complementaria 13). El árbol filogenético agrupó 48 LAC (31 de R. pseudoacacia y 17 de A. thaliana, respectivamente) en siete grupos. Cada grupo estaba compuesto por 8, 5, 9, 5, 8, 4 y 9 miembros. También observamos una notable expansión de LAC para R. pseudoacacia en la mayoría de los grupos, y la expansión de LAC podría resaltar su probable contribución a la mayor capacidad de formación de madera en R. pseudoacacia41,42.

R. pseudoacacia se cultiva ampliamente en las ciudades chinas, especialmente en el centro de China. Para explorar los rasgos adaptativos específicos de la especie de R. pseudoacacia para la plantación urbana, tomamos muestras de 59 individuos de R. pseudoacacia de 14 condados en cinco provincias de China (Fig. 4a y Tabla complementaria 14) con un tamaño de muestra mediano de cinco individuos para cada condado. Los genomas completos de estos 59 individuos fueron resecuenciados a una profundidad promedio de 14×. Aproximadamente el 98% de estos datos de resecuenciación se han alineado con el genoma de referencia y cubren más del 90% del ensamblaje del genoma, lo que refleja la alta calidad de este conjunto de datos de resecuenciación (Tabla complementaria 15). Detectamos un total de 17.986.674 polimorfismos de un solo nucleótido (SNP) de alta calidad de estos 59 individuos.

a Distribución geográfica de las muestras de R. pseudoacacia secuenciadas en este estudio. Las identificaciones de la población estaban etiquetadas en la figura. b Análisis de componentes principales (PCA). Los números entre paréntesis representan la fracción de varianza explicada por cada componente. Los individuos atípicos fueron etiquetados con texto negro. c Árbol de máxima verosimilitud (ML) y análisis de ADMIXTURE. El análisis filogenético se realizó basándose en los SNP del genoma completo de 59 individuos de R. pseudoacacia, con identificaciones individuales marcadas junto a las secciones correspondientes de los resultados de ADMIXTURE. Para cada ID, el prefijo antes de “-” corresponde al número del sitio de muestreo que se muestra en el panel a, mientras que el sufijo después indica el número individual. Se utilizaron tres individuos de L. japonicus como grupo externo. d Historia demográfica inferida por el modelo PSMC. e Diversidad de secuencia observada en todo el genoma (π) para R. pseudoacacia y otras especies. Los nombres de las especies de cultivares (incluidas las variedades locales) y linajes silvestres estaban etiquetados en colores azul y negro, respectivamente.

Para identificar la estructura genética de estas muestras, realizamos un análisis de componentes principales (PCA) basado en sus distancias genéticas por pares que se calculó utilizando datos de SNP autosómicos. Fundamentalmente, las PC del 1 al 10 solo explicaron un total del 14,15% de la varianza genética y no pudieron separar a los individuos recolectados de las diferentes ubicaciones (Fig. 4b y Fig. 6 complementaria). Los dos grupos atípicos se recolectaron de dos condados distintos y estaban compuestos por tres individuos de la población P5 y dos individuos de la población P13, respectivamente (Tabla complementaria 15). Sorprendentemente, no estaban agrupados en el mismo grupo con otros individuos recolectados en el mismo lugar o en un lugar adyacente.

Para examinar más a fondo este resultado contrario a la intuición, evaluamos las relaciones genéticas entre estas muestras estableciendo un árbol filogenético de ML. No se encontró ninguna relación elevada entre los individuos muestreados de la misma ciudad. Por el contrario, los individuos recolectados de distintas ciudades se agruparon (Fig. 4c). Nuestro árbol filogenético también sugirió que la agrupación del grupo P5 y el grupo P13 puede haber resultado de que estas muestras provienen del mismo linaje (es decir, son hijos de los mismos padres y provienen de un vivero de plantas similar). También se proporcionaron más justificaciones a partir de un análisis de mezcla (Fig. 4c). Nuestros resultados mostraron que K = 1 fue la mejor opción de modelado, y que la opción de modelado K = 14 que dividió las muestras de R. pseudoacacia en subpoblaciones locales según la ubicación del muestreo fue firmemente rechazada (Figuras complementarias 7, 8). Nuestra prueba parcial de Mantel, diseñada para evaluar la influencia del aislamiento por distancia (IBD) y el aislamiento por entorno (IBE) en la estructura genética, no reveló ninguna correlación significativa entre la geografía o el entorno y la diferenciación genética (Figura complementaria 9). Estos resultados confirmaron que estos individuos de R. pseudoacacia fueron introducidos mediante cultivo deliberado.

Después de estas comparaciones, realizamos análisis de coalescencia markoviana secuencial por pares (PSMC) y descubrimos que los individuos recolectados en las diferentes ubicaciones compartían historias demográficas antiguas idénticas (Fig. 4d). En conjunto, estos resultados probablemente indiquen que no ha habido tiempo suficiente para divergir entre sí debido al hecho de que todos los individuos de R. pseudoacacia en China fueron introducidos por humanos después de la década de 187043. El tamaño poblacional efectivo estimado (Ne) de la población de R. pseudoacacia alcanzó su punto más alto hace alrededor de 1 millón de años, seguido de una fuerte disminución que coincide con la etapa glacial de Mindel.

Actualmente, la mayoría de las plantas cultivadas sufren los recientes efectos de cuello de botella y la endogamia introducida por actividades humanas, como la domesticación y las introducciones intercontinentales, que siempre podrían reducir la diversidad genética44,45. En comparación con las poblaciones con alta diversidad genética, las poblaciones caracterizadas por una baja diversidad genética son más susceptibles a los efectos perjudiciales de la deriva genética y la acumulación de variaciones nocivas46,47. Por lo tanto, mantener una diversidad genética suficiente es esencial para que las especies se adapten a entornos cambiantes. Aquí, encontramos que R. pseudoacacia mostró una diversidad observada de π = 8,94 × 10−3, que fue notablemente mayor que la de otras especies cultivadas e incluso mayor que la de algunas poblaciones de plantas silvestres (Fig. 4e y Tabla complementaria 16). Estos resaltan la abundancia del acervo genético de R. pseudoacacia y su alto potencial para sobrevivir en entornos cambiantes.

Para revelar la base genética de los rasgos favorecidos por los urbanitas a nivel poblacional, realizamos un análisis exhaustivo de los genomas completos de 59 árboles cultivados de R. pseudoacacia plantados en diversos ambientes y examinamos sus firmas genómicas para barridos selectivos recientes. Los barridos selectivos recientes generalmente se reflejan en haplotipos largos e inusualmente frecuentes y en una alta homocigosidad de haplotipos, que pueden capturarse mediante estadísticas iHS y H12, respectivamente48. Aquí, analizamos las supuestas regiones de barrido selectivo mediante la detección de regiones genéticas que mostraron importancia tanto para iHS como para H12. Estas supuestas regiones de barrido selectivo albergaban un total de 615 genes seleccionados positivamente (PSG), lo que indica su papel potencial involucrado en la adaptación de R. pseudoacacia a entornos urbanos (Fig. 5a, b y Datos complementarios 2). Para comprender mejor las fuerzas evolutivas que acompañan a la plantación urbana, se utilizaron análisis de enriquecimiento de ontología genética (GO) para resumir la función biológica del conjunto de genes ubicado en estas regiones candidatas bajo selección reciente. Estos análisis revelaron varias categorías funcionales con señales enriquecidas para la selección que incluían engrosamiento de la pared celular (GO:0052386), procesamiento biosintético de esporopollenina (GO:0080110), regulación del crecimiento del meristemo de la raíz (GO:0010082) y detección de bacterias (GO:0016045) ( Cuadro complementario 17). Los genes candidatos mostraron varias características clave favorecidas en la plantación urbana.

a, b Los PSG candidatos se identificaron utilizando estadísticas H1 y puntuaciones de haplotipos integrados (iHS), respectivamente. Sólo se muestran los genes con valores significativos. Once PSG candidatos están etiquetados con círculos rojos y el nombre del gen. c – e Valores H1 transformados en Z y valores absolutos del iHS normalizado para MED18 (c), WRKY4 (d) y UBP13 (e), respectivamente. a – e Los valores umbral (valor H1 ≥3 y un valor absoluto de iHS normalizado ≥2) se etiquetaron en las figuras.

En los montajes de comunidades vegetales urbanas, las características de las flores de los árboles son uno de los rasgos más importantes porque mejoran la estética de las calles urbanas y los espacios verdes49,50. En este estudio, se clasificaron dos genes para el desarrollo de las flores como bajo selección y eran consistentes con los rasgos únicos observados en R. pseudoacacia, lo que sugiere que estos genes pueden estar involucrados en los procesos de reproducción que llevaron a su plantación urbana extensiva en China. Por ejemplo, TPS03 codifica una enzima catálisis que desempeña un papel importante en la monoterpeno sintasa y que puede contribuir a la atractiva fragancia de las flores de los árboles aclamada por los urbanitas. Además, MED18 (Fig. 5c) codifica la subunidad del submódulo principal del complejo mediador de la planta y se ha demostrado previamente que regula el tiempo de floración y altera el número de órganos florales51.

En comparación con las áreas no urbanas, los espacios verdes municipales suelen tener una capa de suelo fértil más superficial y una capacidad de retención de agua reducida52,53,54, lo que plantea distintos desafíos para los árboles plantados en áreas urbanas. Aquí, encontramos que el gen SOS4, que es esencial para el desarrollo del cabello radicular, mostró firmas notables para la selección reciente, así como algunos genes relacionados con la utilización del agua, como WRKY4, SCAB1 y RD22 (Fig. 5d). Específicamente, WRKY4 y MYB52 desempeñan papeles importantes en la adaptación al estrés por sequía55,56. Se informa que SCAB1 codifica una proteína de unión a actina que controla el movimiento estomático, lo que es consistente con observaciones previas de que R. pseudoacacia puede adaptarse a condiciones de sequía al reducir la transpiración57. Además, RD22 es un gen que responde a la sequía y se ha descubierto que se expresa diferencialmente durante el déficit hídrico58,59. La evolución de estos genes a nivel poblacional puede ser beneficiosa para aumentar la aptitud de los árboles plantados en espacios verdes, especialmente teniendo en cuenta que R. pseudoacacia suele tener raíces poco profundas.

Junto con estos genes, también se encontró que otros tres genes relacionados con el sistema inmunológico muestran huellas de selección reciente. Por ejemplo, UBP13 (Fig. 5e) codifica una proteasa específica de ubiquitina que es responsable de la percepción inicial del patógeno60, y UBC36 codifica una enzima conjugadora de ubiquitina E2 involucrada en la amortiguación de la señalización inmune61. El gen de la quinasa similar al receptor asociado a la pared, WAK2, también desempeña un papel importante en la resistencia a las enfermedades62. Juntos, estos genes influyen en el sistema inmunológico y pueden reflejar el hecho de que las plantas en las ciudades enfrentan una mayor susceptibilidad a enfermedades causadas por diferentes patógenos y contaminantes en comparación con las que viven en la naturaleza63. En general, nuestros hallazgos resaltan las características genéticas favorecidas en la plantación urbana y arrojan luz sobre las fuerzas evolutivas que acompañan el proceso de enverdecimiento urbano.

En este estudio, aprovechamos métodos genómicos de vanguardia para revelar la base genómica y las consecuencias de la amplia distribución de R. pseudoacacia en espacios verdes urbanos en China, y proporcionar conocimientos novedosos sobre la ecologización urbana. Primero generamos un ensamblaje de genoma a nivel de cromosoma anotado combinando tecnologías de secuenciación de lectura corta de Illumina, secuenciación de lectura larga de nanoporos y captura conformacional cromosómica (Hi-C) para crear el primer genoma de referencia para R. pseudoacacia (Fig. 1). Nuestros siguientes análisis genómicos comparativos mostraron que las familias de genes relacionados con los rasgos favorecidos por los urbanitas se expandieron notablemente e incluyen la formación de madera, la biosíntesis y la tolerancia a la sequía (Figs. 2, 3). Además, encuestamos 14 ciudades, recolectamos 59 individuos de R. pseudoacacia y secuenciamos los genomas completos de estas muestras para revelar aún más cómo los efectos genéticos y fenotípicos acompañan el proceso de plantación urbana introducido por la urbanización (Fig. 4a).

Nuestra estructura genética integral y nuestros análisis demográficos indican firmemente que la presencia de R. pseudoacacia en espacios verdes urbanos es el resultado del cultivo deliberado en lugar de la dispersión natural (Fig. 4b, cy Fig. complementaria 9). Además, R. pseudoacacia plantada en ciudades mostró una rica diversidad genética de π = 8,94 × 10−3 (Fig. 4e) que se distingue de la mayoría de las plantas cultivadas, que sufren efectos recientes de cuello de botella y endogamia. En conjunto, estos efectos resaltan su potencial para resistir las perturbaciones ambientales, lo que favorecen los planificadores urbanos. Además de la resistencia al estrés, la estética es otra consideración importante para los residentes urbanos. Estos caracteres también se han recuperado en nuestros análisis de barrido selectivo. Encontramos que los genes desempeñan papeles importantes en el proceso biológico relacionado con el desarrollo de las flores, la retención de agua y la inmunización que mostraron una selección muy reciente en sus firmas genómicas, lo que sugiere que el proceso de plantación urbana masiva acompaña a efectos genéticos sustanciales en los genomas de las plantas (Fig. 5). .

Gracias a nuestra extensa secuenciación de lectura larga, pudimos descubrir el contenido genómico completo de R. pseudoacacia que permite la identificación correcta de muchas variaciones estructurales desconocidas y elementos repetitivos que serán un recurso valioso para futuros estudios de diversidad genética en taxones de plantas. . Nuestros recursos y resultados informados brindan conocimientos novedosos sobre la construcción de infraestructuras verdes urbanas a niveles genómicos comparativos y poblacionales, así como bases valiosas para la comprensión agronómica y el mejoramiento molecular de R. pseudoacacia en el futuro.

Aun así, nuestro estudio actual sólo se centró en los SNP con un tamaño de muestra relativamente modesto. Aunque el muestreo actual es suficiente para explorar los rasgos adaptativos específicos de la especie de R. pseudoacacia, se necesitan más estudios que involucren una gama más amplia de muestreo que represente diferentes factores estresantes ambientales combinados con datos transcriptómicos y de metilación, así como datos de variación estructural. potenciar nuestros conocimientos sobre ecologización urbana que faciliten su mejora. Además, R. pseudoacacia podría utilizar la proliferación asexual. Durante el proceso de evolución clonal, las mutaciones somáticas son una fuente importante de diversificación genética64. Las mutaciones somáticas en los cítricos condujeron a un amplio espectro de fenotipos, incluidos cambios en la forma, el color, la acidez, la estación de maduración, los cambios en el desarrollo relacionados con la esterilidad, el tiempo de floración y la arquitectura del árbol65. Por lo tanto, la tasa y el patrón de mutación somática deben considerarse en estudios futuros. En última instancia, la evaluación integral de los datos obtenidos de estudios genómicos, fisiológicos y ecológicos será cada vez más importante en contextos aplicados que apuntan a la plantación de árboles en espacios verdes urbanos.

Recolectamos un individuo de R. pseudoacacia (Fig. 1a) en la Universidad de Lanzhou, provincia de Gansu, China (36 ° 2′57 ″ N, 103 ° 51′34 ″ E). Se prepararon una biblioteca de Oxford Nanopore Technologies (ONT), una biblioteca de secuenciación de extremos pares de Illumina, una biblioteca Hi-C y tres bibliotecas de secuenciación de ARN basándose en este individuo. Específicamente, extrajimos ADN de alto peso molecular de las hojas de este individuo, establecimos una biblioteca de Oxford Nanopore Technologies (ONT) y lo secuenciamos en la plataforma ONT PromethION de acuerdo con las instrucciones del fabricante. Luego complementamos estas lecturas largas con lecturas cortas adicionales de alta precisión de una biblioteca de secuenciación de extremos emparejados de Illumina. Extrajimos ADN de hojas del mismo individuo utilizando el método CTAB66,67, después de lo cual se establecieron bibliotecas de secuenciación de extremos emparejados, se amplificaron por PCR y se secuenciaron en una plataforma Illumina NovaSeq 6000 siguiendo el flujo de trabajo recomendado por Illumina. Para obtener información de contacto de los cromosomas y lograr contigüidad a escala cromosómica, extrajimos ADN del mismo individuo y construimos bibliotecas Hi-C siguiendo el protocolo estándar descrito anteriormente68, en el que se usó una enzima de restricción de 4 cortadores, DpnII, para la digestión. Amplificamos estas bibliotecas de secuenciación Hi-C y las secuenciamos en la plataforma Illumina NovaSeq 6000. Para ayudar en la predicción y anotación de genes, se utilizaron flores, tallos y hojas del mismo individuo para la secuenciación del ARN. En resumen, extrajimos el ARN total de estos tres tejidos utilizando kits de purificación de ARN y TRIzol, y preparamos tres bibliotecas TruSeq de ARNm de Illumina, respectivamente, siguiendo las guías del fabricante. La secuenciación de ARN se realizó en la plataforma Illumina NovaSeq 6000.

Después de realizar llamadas de base y filtrado de lectura, corregimos la precisión por base de las lecturas largas de PromethION (~110 ×) y las ensamblamos en contigs usando NextDenovo v2.3 (https://github.com/Nextomics/NextDenovo) ( -tarea todo -parallel_jobs 20 -read_cutoff 1k -genome_size 680 M). Para pulir aún más este ensamblaje de nivel contig, se generaron ~111 Gb (~162×) de lecturas de extremos emparejados de Illumina de alta precisión. Para eliminar haplotigs alélicos, utilizamos Purge Haplotigs v1.1.169, lo que resultó en el ensamblaje final de nivel contig. Basándonos en estas lecturas breves de alta precisión, solucionamos errores de base en el ensamblaje de nivel contig utilizando NextPolish v1.2.270. Estos datos también se utilizaron para realizar análisis de k-mer y estimar el tamaño del genoma de R. pseudoacacia71. Luego evaluamos, filtramos y asignamos las lecturas Hi-C de extremos emparejados (~114 ×) a este ensamblaje de nivel contig utilizando HiCUP v0.8.072. Luego, el archivo BAM resultante se procesó con ALLHiC v0.8.1273, que construyó un ensamblaje a escala cromosómica con el ensamblaje de nivel contig y los datos Hi-C utilizando las innovadoras funciones "poda", "partición", "rescate" y "optimización". " pasos.

Realizamos predicciones de genes y repeticiones siguiendo el proceso personalizado descrito previamente en Pascoal et al. con varias modificaciones74. Brevemente, primero construimos una biblioteca de repetición de novo para R. pseudoacacia usando RepeatModeler v2.075 con RECON v1.0876 y RepeatScout v1.0.677. Para la identificación de elementos repetitivos, utilizamos BLAST+ v2.2.3178 y RepeatMasker v4.1.079 para buscar el genoma de R. pseudoacacia en nuestra biblioteca de repetición de novo y la base de datos Repbase v2380. Luego se implementó LTR_retriever v2.8.781, que integra LTRharvest82, y LTR Finder v1.0783 para predecir retrotransposones repetidos terminales largos (elementos LTR). Después, se integraron los resultados de la identificación repetida de los diferentes paquetes de software y se eliminó la redundancia para producir la anotación repetida final. Calculamos la distancia genética (K) entre las secuencias 5 'LTR y 3' LTR utilizando DnaDiSt, un programa dentro de PhyliP v3.696 (Felsenstein, 2004). Para estimar el tiempo de inserción (T) de cada LTR, utilizamos la fórmula T = K/2r, donde r representa la tasa de sustitución de nucleótidos estimada por BASEML en el paquete PAML v4.9j84.

Después de enmascarar repetidamente el genoma de R. pseudoacacia, se realizaron predicciones ab initio, basadas en transcriptomas y basadas en homología. Para la predicción basada en transcriptoma, utilizamos Trinity v2.6.685 (-seqType fq -max_memory 50 -CPU 20) para obtener un ensamblaje de transcriptoma de novo de R. pseudoacacia basado en nuestros datos de RNA-Seq. Luego procesamos este ensamblaje del transcriptoma utilizando el Programa para ensamblar alineaciones empalmadas (PASA v2.3.3)86. Al mapearlo en el ensamblaje del genoma de referencia, PASA predijo marcos de lectura abiertos (ORF) y estructuras genéticas. También alineamos estas lecturas de RNA-Seq recortadas con el ensamblaje del genoma de R. pseudoacacia utilizando HISAT2 v2.1.087. Después, se generó un archivo de sugerencias de intrón utilizando la función bam2hints en AUGUSTUS v3.3.388. Utilizamos estos resultados para entrenar a AUGUSTUS para realizar la predicción genética ab initio. Para la predicción basada en homología, alineamos secuencias de proteínas de siete especies de plantas de Phytozome v1389 (https://phytozome-next.jgi.doe.gov) (A. thaliana, C. arietinum, Glycine soja, Lupinus albus, Populus trichocarpa, T. pratense y Vigna unguiculata) para repetir la máscara del genoma de R. pseudoacacia usando TBLASTN (E <10-5). Las regiones codificantes de proteínas candidatas resultantes luego se refinaron y procesaron adicionalmente mediante GeneWise v2.4.190 para generar un conjunto de genes basado en homología con uniones de empalme precisas. Todos los conjuntos de genes predichos mediante métodos ab initio, homología y basados ​​en transcriptoma se pasaron a EVidenceModeler v1.1.184 para producir un conjunto de genes de consenso. Actualizamos aún más este conjunto de genes de consenso mediante la predicción de regiones no traducidas (UTR) y, alternativamente, isoformas empalmadas en función de nuestros datos del transcriptoma, que se implementó en PASA v2.3.3. Utilizamos BUSCO v491 con la base de datos embriophyta_odb1092 para evaluar la integridad de los ensamblajes del genoma (-l embriophyta_odb10 -m genoma -c 10 -e 1e-03) y el conjunto de genes oficial (-l embriophyta_odb10 -m proteínas -c 10 -e 1e- 03), respectivamente. Luego se utilizó Circos v0.6993 para visualizar estas métricas genómicas en un diseño circular.

Las anotaciones funcionales de este conjunto de genes oficial de consenso se obtuvieron en base a las bases de datos Swiss-Prot (versión 2020_04)94, TrEMBL (versión 2020_04)94, proteína no redundante NCBI (NR, versión 20200502)95 e InterPro v8496. Específicamente, ejecutamos BLAST+ con un valor E de corte de 1E-05 y un número de secuencia objetivo máximo de 20 para obtener los mejores resultados (-evalue 1e-5 -num_threads 30 -max_target_seqs 20), y asignamos descriptores de estos mejores -Accesos a las transcripciones previstas, respectivamente. Se utilizó InterProScan v.5.2897 para recuperar dominios funcionales y anotaciones de ontología genética (GO) basadas en la base de datos InterPro. Además, utilizamos Blast2GO98 para asignar términos GO a los genes que no fueron anotados por InterProScan. Para la anotación de la Enciclopedia de genes y genomas de Kyoto (KEGG)99, alineamos las secuencias de proteínas del conjunto de genes de R. pseudoacacia con la base de datos KEGG (family_eukaryotes), asignamos los términos de ortología KEGG (KO) y reconstruimos las vías enviando estas secuencias a el servidor de anotación automática KEGG (KAAS)100. Luego implementamos el paquete clusterProfiler v4.1.4101 para realizar pruebas de enriquecimiento GO.

Identificamos genes ortólogos entre 16 especies de plantas mediante la realización de un análisis de agrupamiento de ortólogos implementado en OrthoFinder v2.3.8102 (-S blast -M msa -t 50 -T fasttree -A mafft). Luego, la filogenia general se resolvió realizando el análisis RAxML v8.2.12103, que construyó un árbol filogenético de máxima probabilidad (ML) de genoma completo para estas especies en función de sus sitios degenerados cuádruples concatenados (4DTv) bajo el modelo GTRGAMMA. El grupo externo se estableció en A. thaliana y el análisis se realizó con 100 bootstraps para mayor robustez. Luego estimamos el tiempo de divergencia de cada nodo en este árbol filogenético ejecutando el programa MCMCtree en el paquete PAML v4.9j84 con dos restricciones de fósiles (Arachis duranensis y M. truncatula [hace 49–58 millones de años (Ma)], además como Glycine max y A. thaliana [98–117 Ma]) adquiridos de TimeTree (http://www.timetree.org/). Después de estos análisis de filogenia general, pasamos los resultados obtenidos del canal OrthoFinder a CAFE v4.2104 para probar los patrones en la evolución de la familia de genes (expansión/contracción).

Para explorar más a fondo el mecanismo molecular de la formación de madera en R. pseudoacacia, descargamos las secuencias de la familia de genes de lacasa (LAC) para A. thaliana (Tabla complementaria 11) de la base de datos TAIR (https://www.arabidopsis.org/ ) e identificó las LAC correspondientes para las otras 15 especies. Primero utilizamos BLASTP v2.2.29+ para buscar el candidato ortólogo de LAC frente a los LAC de A. thaliana. Luego se empleó HMMER v3.2.1 (http://hmmer.org/) 105 para escanear la información del dominio para cada gen candidato. Solo se conservaron los genes que tienen tres dominios de Cu-oxidasa conservados (Cu-oxidasa, Cu-oxidasa_2 y Cu-oxidasa_3). También detectamos y retuvimos los genes candidatos con las cuatro regiones de unión al cobre (HxH, HxH, HxxHxH y HCHxxxH). Luego, RAxML llevó a cabo un análisis filogenético para examinar si los genes candidatos de LAC estaban agrupados.

Se identificaron genes homólogos intergenómicos e intragenómicos utilizando ColinearScan106. Primero utilizamos BLASTP v2.2.29+ (valor E <1 × 10−5) para buscar los pares de genes parálogos y ortólogos putativos dentro o entre genomas con un máximo de 20 alineaciones para cada secuencia de consulta. La longitud máxima de la brecha de colinealidad entre genes se estableció en 50 para ColinearScan. Los valores de sustitución sinónima (Ks) de los pares de genes colineales identificados se calcularon utilizando el programa YN00 en el paquete PAML utilizando el método Nei-Gojobori107. El valor medio de Ks para los pares de genes colineales de cada bloque colineal se mostró en los diagramas de puntos sinténicos para ayudar a distinguir las regiones sinténicas relacionadas con eventos. Luego se realizó un ajuste de densidad del núcleo gaussiano para estimar la distribución de densidad de probabilidad de los valores de Ks entre especies e intraespecies con el número de contenedores establecido en 200. Los análisis de sintenia anteriores se realizaron utilizando el kit de herramientas wgdi (https://github.com/SunPengChuan/wgdi )108.

Para explorar los rasgos evolutivos específicos de la especie de R. pseudoacacia, encuestamos 14 condados en cinco provincias que cubrían áreas áridas, húmedas, mesetas y llanuras, para recopilar datos genómicos de la población. En total, se muestrearon 59 individuos. El ADN se extrajo de las hojas de estos individuos mediante el método CTAB. Utilizamos un Nanodrop, electroforesis en gel de agarosa al 1% y Qubit para comprobar la calidad y pureza del ADN extraído. Luego se prepararon bibliotecas de extremos emparejados de Illumina para cada individuo, siguiendo los protocolos de laboratorio de los fabricantes, y se secuenciaron en la plataforma Illumina NovaSeq 6000. También descargamos tres muestras de L. japonicus como grupo externo (número de acceso del NCBI: SRR11495342, SRR11495343 y SRR447704). Para lecturas sin procesar, se utilizaron Scythe (https://github.com/vsbuffalo/scythe) y Sickle (https://github.com/najoshi/sickle) para eliminar las secuencias del adaptador y filtrar las secuencias de baja calidad (calidad puntuación <20), respectivamente. Luego asignamos estas lecturas limpias al genoma de R. pseudoacacia a nivel cromosómico utilizando BWA v0.7.17109.

Genotipamos a los 62 individuos (59 individuos de R. pseudoacacia y tres individuos de L. japonicus) siguiendo las mejores prácticas de GATK110. Antes de que las muestras fueran genotipos, se utilizaron Samtools v1.10111 y Picard v2.23.6 (//broadinstitute.github.io/picard/) para ordenar y formatear los archivos resultantes de BWA y eliminar duplicados de PCR. Para las mejores prácticas de GATK v3.8, se utilizó la función HaplotypeCaller para llamar a SNP e InDels mediante el reensamblaje local de haplotipos. Luego, la función CombineGVCF fusionó las variantes genéticas detectadas en la misma población para acelerar los procesos posteriores. Utilizamos GenotypeGVCF para realizar el regenotipado preciso basado en estos archivos gVCF fusionados. Se decidió un conjunto de criterios de filtrado estrictos en función de los gráficos de densidad del conjunto de datos SNP sin procesar (QD <2.0| |MQ <40.0 || ReadPosRankSum <−8.0||FS >60.0 || HaplotypeScore >13.0 || MQRankSum <−12.5|| SOR >3). Para generar un conjunto sólido de SNP, eliminamos adicionalmente los SNP de baja calidad con una profundidad anormalmente baja (<2 × o 1/5 de la profundidad promedio de la muestra correspondiente), profundidad extremadamente alta (>50 × o cinco veces la profundidad promedio de la muestra). muestra correspondiente) y puntuaciones de baja calidad (<30). Además, descartamos los SNP que estaban etiquetados como indeles y ubicados dentro de los 5 pb de un InDel. Si faltaba la información del genotipo de la mayoría de los individuos (>13 R. pseudoacacia, >1 L. japonicus), el sitio se trataba como desconocido.

Luego, Vcftools v0.1.16112 utilizó el archivo VCF generado para calcular la diversidad genética de todo el genoma. Se estableció un árbol filogenético de ML basado en SNP de genoma completo mediante RAxML v8.2.12103, y PLINK v1.07113 generó un conjunto reducido de SNP sin SNP en alto desequilibrio de ligamiento (LD) entre cada muestra, que se basó en sus pares. Información LD. Luego evaluamos la estructura poblacional de los individuos muestreados pasando este conjunto de SNP reducido a ADMIXTURE v1.3.0114 con números plausibles para las poblaciones ancestrales (K) del 1 al 14. Se eligió el mejor módulo en función de las tasas de error de validación cruzada. Para confirmar aún más la estructura de la población, se utilizaron el programa smartpca en EIGENSOFT v7.2.1115 y el paquete ggplot2 en R para realizar el análisis de componentes principales (PCA) para visualizar sus resultados, respectivamente. Luego realizamos una serie de análisis coalescentes secuencialmente markovianos por pares utilizando PSMC v0.6.5-r67116 para reconstruir las trayectorias históricas de los cambios en los tamaños poblacionales efectivos de R. pseudoacacia. Para convertir el tiempo de escala y el tamaño de la población a valores reales, aplicamos un tiempo de generación de 7 años y una tasa de mutación de 4 × 10-9 por nucleótido por año. Estos factores de conversión nos permitieron estimar el tiempo y el tamaño en términos del mundo real.

Evaluamos los efectos del aislamiento por distancia (IBD) y el aislamiento por ambiente (IBE) sobre la variación genética mediante pruebas de Mantel. Primero, calculamos distancias geográficas por pares entre sitios de muestreo utilizando las coordenadas geográficas con el paquete R Geosphere (https://github.com/rspatial/geosphere). En segundo lugar, calculamos la distancia ambiental (distancia euclidiana) entre las 16 poblaciones en función de las variables ambientales descritas en la sección "Variables ambientales" utilizando la función dist en el software R. Para medir la distancia genética, utilizamos Arlequin v3.5117. Finalmente, realizamos pruebas parciales de Mantel con 9999 permutaciones utilizando el paquete Vegan v.2.5-7118 en R para probar la relación entre distancias geográficas/ambientales y distancias genéticas.

Utilizamos un enfoque combinatorio para garantizar inferencias sólidas para la selección. Brevemente, utilizamos Beagle v5.4119,120 para reconstruir haplotipos a partir de datos de genotipo SNP sin fases e imputar los datos faltantes. Luego se usó el programa SelectionHapStats121 (con los parámetros: -w 50 -j 20) para examinar frecuencias de múltiples haplotipos entre sí y para identificar barridos selectivos tanto duros como suaves y distinguir entre estos dos tipos de barridos de selección basados ​​en H12 y H2. /Estadísticas H1. Además, aplicamos Selscan v2.0.0122 para calcular la puntuación de haplotipo integrada (iHS), que está diseñada para detectar haplotipos inusuales alrededor de un SNP particular en comparación con el genotipo completo. Posteriormente, las métricas detectadas por estos métodos se evaluaron sintéticamente para revelar barridos selectivos sólidos. Los genes con un valor H1 significativo (Z ≥ 3) y un valor iHS significativo (valor absoluto de iHS normalizado ≥2) se identificaron luego como genes seleccionados positivamente.

Los análisis estadísticos (la prueba t de Student de una muestra y dos colas y la prueba de Mantel parcial) se realizaron utilizando R (v4.1). CAFE104 calculó los valores de P asociados con el tamaño de las familias de genes. Los valores Q para las pruebas de enriquecimiento funcional se calcularon utilizando clusterProfiler101. En los análisis genómicos de poblaciones, secuenciamos de tres a cinco individuos para cada población, excepto dos poblaciones, cada una de las cuales solo tenía una muestra en la naturaleza.

Más información sobre el diseño de la investigación está disponible en el Resumen del informe de Nature Portfolio vinculado a este artículo.

Las fuentes numéricas se pueden encontrar en los Datos complementarios 3 para la Fig. 2b y la Tabla complementaria 16 para la Fig. 4e, respectivamente. Todas las lecturas de secuenciación que respaldan los hallazgos de este estudio se han depositado en el Archivo de secuencias del genoma (https://ngdc.cncb.ac.cn/gsa/) con el número de proyecto PRJCA011483. El archivo de ensamblaje del genoma, todos los archivos de anotaciones y los datos de origen para análisis filogenéticos y de población están disponibles en Figshare (doi.org/10.6084/m9.figshare.23301668). Todos los demás datos están disponibles a través de los autores correspondientes previa solicitud razonable.

Los scripts personalizados y los canales de análisis se han puesto a disposición del público a través de repositorios de GitHub (https://github.com/myBioFun/ORTHO2TREE).

Arrington, A. Búsqueda de comida urbana de cinco plantas no nativas en Nueva York: equilibrio de los servicios ecosistémicos y el manejo de especies invasoras. Urbano para. Verde Urbano. 58, 126896 (2021).

Artículo de Google Scholar

Bretzel, F. y col. Flores silvestres: de la conservación de la biodiversidad al enverdecimiento urbano: una revisión. Urbano para. Verde Urbano. 20, 428–436 (2016).

Artículo de Google Scholar

Zhang, H., Chen, B., Sun, Z. & Bao, Z. Percepción del paisaje y necesidades de recreación en espacios verdes urbanos en Fuyang, Hangzhou, China. Urbano para. Verde Urbano. 12, 44–52 (2013).

Artículo de Google Scholar

Blanusa, T., Garratt, M., Cathcart-James, M., Hunt, L. & Cameron, RWF Setos urbanos: una revisión de especies y cultivares de plantas para la prestación de servicios ecosistémicos en el noroeste de Europa. Urbano para. Verde Urbano. 44, 126391 (2019).

Artículo de Google Scholar

Eisenman, TS y cols. Árboles urbanos, calidad del aire y asma: una revisión interdisciplinaria. Landsc. Plano Urbano. 187, 47–59 (2019).

Artículo de Google Scholar

Sun, L., Chen, J., Li, Q. y Huang, D. Urbanización dramática y desigual de las grandes ciudades de todo el mundo en las últimas décadas. Nat. Comunitario. 11, 5366 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Johnson, MTJ & Munshi-South, J. Evolución de la vida en entornos urbanos. Ciencia 358, eaam8327 (2017).

Artículo PubMed Google Scholar

Szulkin, M., Munshi-South, J. y Charmantier, A. Biología evolutiva urbana (Oxford Univ. Press, 2020).

Grimm, NB y cols. El cambio global y la ecología de las ciudades. Ciencia 319, 756–760 (2008).

Artículo CAS PubMed Google Scholar

Ma, J. y col. Las características de la estructura forestal urbana dentro del Sexto Anillo de Circunvalación de Beijing. Mentón. J. Ecología. 38, 2318–2325 (2019).

Google Académico

Wang, K. y col. Composición de especies de árboles urbanos en 35 ciudades de China. Toro. Bot. Res. 40, 568–574 (2020).

Google Académico

Zhao, X. et al. Relación entre la adsorción de PM2,5 y la morfología de la superficie de las hojas en diez especies de árboles urbanos en Shenyang, China. Fuentes de energía A: Recuperación, Utili. Reinar. Ef. 41, 1029-1039 (2019).

Artículo CAS Google Scholar

Tu, B., Gavaland, A., Du, K. & Lu, X. Langosta negra en China (en francés). For.êt-entreprise 177, 50–53 (2007).

Google Académico

Wang, JX y cols. Perfiles transcripcionales de flores emasculadas de acacia negra (Robinia pseudoacacia) determinados mediante la técnica de ADNc-AFLP. Gineta. Mol. Res. 14, 15822–15838 (2015).

Artículo CAS PubMed Google Scholar

Schneck, V. Enfoques de cría de langosta negra y procesos de justificación. En Alemania/Contribuciones del Ministerio Federal de Alimentación, Agricultura y Protección del Consumidor - Agrarholz 2010, Berlín (Alemania) 1–8 (2010).

Nicolescu, V.-N. et al. Ecología, crecimiento y gestión de la acacia negra (Robinia pseudoacacia L.), una especie no autóctona integrada en los bosques europeos. J. Para. Res. 31, 1081-1101 (2020).

Artículo CAS Google Scholar

Kehrer, J. (2020) Nuevos horizontes: ocho perspectivas sobre la arquitectura paisajística china actual (Birkhäuser, 2020).

Ma, X., Chen, J., Lu, X., Zhe, Y. & Jiang, Z. HPLC junto con espectrometría de masas en tándem de tiempo de vuelo de cuadrupolo para el análisis de componentes glicosilados de las flores frescas de dos especies congenéricas: Robinia hispida L. y Robinia pseudoacacia LJ Sep. Sci. 44, 1537-1551 (2021).

Artículo CAS PubMed Google Scholar

Vítková, M., Tonika, J. & Müllerová, J. Langosta negra: invasora exitosa de una amplia gama de condiciones del suelo. Ciencia. Medio ambiente total. 505, 315–328 (2015).

Artículo PubMed Google Scholar

Dini-Papanastasi, O. & Panetsos, CP Relación entre el crecimiento y los rasgos morfológicos y parámetros genéticos de Robinia pseudoacacia var. monophylla DC en el norte de Grecia. Silvae Genet. 49, 37–44 (2000).

Google Académico

Guo, Q. y col. Diversidad genética y estructura poblacional de Robinia pseudoacacia de seis bases de variedades mejoradas en China, según lo revelan marcadores de repetición de secuencia simple. J. Para. Res. 33, 611–621 (2022).

Artículo CAS Google Scholar

Surles, SE, Hamrick, JL y Bongarten, BC Variación de aloenzimas en langosta negra (Robinia pseudoacacia). Poder. J. Para. Res. 19, 471–479 (1989).

Artículo de Google Scholar

Cao, Y. & Chen, Y. Ecosistema C: N: P estequiometría y almacenamiento de carbono en plantaciones y un bosque secundario en la meseta de Loess, China. Ecológico. Ing. 105, 125-132 (2017).

Artículo de Google Scholar

Qiu, L., Zhang, X., Cheng, J. y Yin, X. Efectos de la langosta negra (Robinia pseudoacacia) sobre las propiedades del suelo en la región de barrancos de Loessial de la meseta de Loess, China. Suelo vegetal 332, 207–217 (2010).

Artículo CAS Google Scholar

Mao, P. y otros. Características dinámicas de las propiedades del suelo en una vegetación de Robinia pseudoacacia y ecorestauración costera. Ecológico. Ing. 92, 132-137 (2016).

Artículo de Google Scholar

Sato, S. y col. Estructura del genoma de la leguminosa Lotus japonicus. Res. ADN. 15, 227–239 (2008).

Artículo CAS PubMed PubMed Central Google Scholar

Hufnagel, B. y col. La secuencia del genoma de alta calidad del altramuz blanco proporciona información sobre la exploración del suelo y la calidad de las semillas. Nat. Comunitario. 11, 492 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Varshney, RK y cols. El borrador de la secuencia del genoma del garbanzo (Cicer arietinum) proporciona un recurso para mejorar los rasgos. Nat. Biotecnología. 31, 240–246 (2013).

Artículo CAS PubMed Google Scholar

Bennetzen, JL Patrones en la evolución del genoma del pasto. actual. Opinión. Biol vegetal. 10, 176–181 (2007).

Artículo CAS PubMed Google Scholar

Kim, S. y col. La secuencia del genoma del pimiento picante proporciona información sobre la evolución del sabor picante en las especies de Capsicum. Nat. Gineta. 46, 270–278 (2014).

Artículo CAS PubMed Google Scholar

Zhang, R. y col. La exploración del conflicto filogenómico de los plástidos arroja nuevos conocimientos sobre las relaciones profundas de Leguminosae. Sistema. Biol. 69, 613–622 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Zhao, Y. et al. La filotranscriptómica y la filogenómica nuclear respaldan numerosos eventos de poliploidización e hipótesis para la evolución de la simbiosis rizobiana fijadora de nitrógeno en Fabaceae. Mol. Planta 14, 748–773 (2021).

Artículo CAS PubMed Google Scholar

Wang, J. y col. La alineación jerárquica de 10 genomas de leguminosas establece una plataforma genómica a nivel familiar. Fisiol vegetal. 174, 284–300 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Schmutz, J. y col. Secuencia del genoma de la soja paleopoliploide. Naturaleza 463, 178–183 (2010).

Artículo CAS PubMed Google Scholar

Leebens-Mack, JH et al. Mil transcriptomas de plantas y la filogenómica de las plantas verdes. Naturaleza 574, 679–685 (2019).

Artículo de Google Scholar

Soltis, PS, Marchant, DB, Van de Peer, Y. & Soltis, DE Poliploidía y evolución del genoma en plantas. actual. Opinión. Gineta. Desarrollo. 35, 119-125 (2015).

Artículo CAS PubMed Google Scholar

Hughes, TE, Langdale, JA y Kelly, S. El impacto de la neofuncionalización regulatoria generalizada en la evolución de genes homeólogos después de la duplicación del genoma completo en el maíz. Genoma Res. 24, 1348-1355 (2014).

Artículo CAS PubMed PubMed Central Google Scholar

Boring, LR y Swank, WT El papel de la langosta negra (Robinia Pseudo-Acacia) en la sucesión forestal. J. Ecología. 72, 749–766 (1984).

Artículo de Google Scholar

Huntley, JC en Silvics of North America 2. Hardwoods (eds Burns, RM & Honkala, BH) (Departamento de Agricultura de EE. UU., Servicio Forestal, 1990).

Niu, Z. y col. Un gen que experimentó una evolución adaptativa, LAC2 (LACCASE), en Populus euphratica mejora la tolerancia a la sequía al mejorar la capacidad de transporte de agua. Res. de horticultura. 8, 88 (2021).

Artículo CAS Google Scholar

Yang, J. y col. Nuevos perfiles de expresión genética definen los procesos metabólicos y fisiológicos característicos de la madera y su formación extractiva en una especie de árbol de madera dura, Robinia pseudoacacia. Planta Mol. Biol. 52, 935–956 (2003).

Artículo CAS PubMed Google Scholar

Yang, J., Kamdem, DP, Keathley, DE y Han, KH Cambios estacionales en la expresión genética en la zona de transición entre la albura y el duramen de la acacia negra (Robinia pseudoacacia) revelados por análisis de microarrays de ADNc. Fisiol del árbol. 24, 461–474 (2004).

Artículo CAS PubMed Google Scholar

Kehrer, J. (ed.) Nuevos horizontes: ocho perspectivas sobre la arquitectura paisajística china actual (Birkhäuser, 2020).

Rauf, S., da Silva, JT, Khan, AA y Naveed, A. Consecuencias del fitomejoramiento sobre la diversidad genética. En t. J. Variedad vegetal. 4, 1-21 (2010).

Google Académico

Gaut, BS, Seymour, DK, Liu, Q. y Zhou, Y. La demografía y sus efectos sobre la variación genómica en la domesticación de cultivos. Nat. Plantas 4, 512–520 (2018).

Artículo PubMed Google Scholar

Brütting, C., Hensen, I. & Wesche, K. El cultivo ex situ afecta la estructura genética y la diversidad de las plantas cultivables. Biol vegetal. 15, 505–513 (2013).

Artículo PubMed Google Scholar

Yang, Y. et al. Efectos genómicos del colapso poblacional en un árbol de palo fierro Ostrya rehderiana en peligro crítico de extinción. Nat. Comunitario. 9, 5449 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Voight, BF, Kudaravalli, S., Wen, X. y Pritchard, JK Un mapa de selección positiva reciente en el genoma humano. PLoS Biol. 5, e147 (2007).

Artículo PubMed Central Google Scholar

Avolio, ML, Pataki, DE, Trammell, TLE y Endter‐Wada, J. Ciudades biodiversas: la industria de los viveros, los propietarios de viviendas y las diferencias entre vecindarios impulsan la composición de los árboles urbanos. Ecológico. Monogr. 88, 259–276 (2018).

Artículo de Google Scholar

Lu, P., Yu, Q., Liu, J. y Lee, X. Avance de las fechas de floración de los árboles en respuesta al cambio climático urbano. Agrícola. Para. Meteorol. 138, 120-131 (2006).

Artículo de Google Scholar

Zheng, Z., Guan, H., Leal, F., Gray, PH y Oppenheimer, DG La subunidad mediadora 18 controla el tiempo de floración y la identidad de los órganos florales en Arabidopsis. MÁS UNO 8, e53924 (2013).

Artículo CAS PubMed PubMed Central Google Scholar

De Kimpe, CR & Morel, JL Gestión del suelo urbano: una preocupación creciente. Ciencia del suelo. 165, 31–40 (2000).

Artículo de Google Scholar

Halecki, W. & Stachura, T. Evaluación de los parámetros hidrofísicos del suelo a lo largo de un pequeño río semiurbano: servicios ecosistémicos del suelo para mejorar la retención de agua en áreas verdes urbanas y suburbanas. Cadena 196, 104910 (2021).

Artículo de Google Scholar

Kida, K. & Kawahigashi, M. Influencia de los procesos de construcción de pavimentos asfálticos en la formación del suelo urbano en Tokio. Ciencia del suelo. Nutrición vegetal. 61, 135-146 (2015).

Artículo de Google Scholar

Li, P., Li, X. & Jiang, M. La mutagénesis mediada por CRISPR/Cas9 de la función WRKY3 y WRKY4 disminuye la tolerancia al estrés a la sal y Me-JA en Arabidopsis thaliana. Mol. Biol. Rep. 48, 5821–5832 (2021).

Artículo CAS PubMed Google Scholar

Park, MY, Kang, J. & Kim, SY La sobreexpresión de AtMYB52 confiere hipersensibilidad a ABA y tolerancia a la sequía. Mol. Celdas 31, 447–454 (2011).

Artículo CAS PubMed PubMed Central Google Scholar

Mantovani, D., Veste, M. & Freese, D. Adaptaciones ecofisiológicas y morfológicas de la langosta negra (Robinia pseudoacacia L.) a la sequía y sus consecuencias en la producción de biomasa y la eficiencia en el uso del agua. Nueva Zelanda para. Ciencia. 44, 29 (2014).

Artículo de Google Scholar

Phillips, K. & Ludidi, N. La sequía y el ácido abscísico exógeno alteran la acumulación de peróxido de hidrógeno y regulan diferencialmente la expresión de dos genes similares al RD22 del maíz. Ciencia. Rep. 7, 8821 (2017).

Artículo PubMed PubMed Central Google Scholar

Yamaguchi-Shinozaki, K. & Shinozaki, K. La hormona vegetal ácido abscísico media la expresión inducida por la sequía, pero no la expresión específica de la semilla de rd22, un gen que responde al estrés por deshidratación en Arabidopsis thaliana. Mol. General Genet. 238, 17-25 (1993).

Artículo CAS PubMed Google Scholar

Ewan, R. y col. Las enzimas desubiquitinantes AtUBP12 y AtUBP13 y su homólogo del tabaco NtUBP12 son reguladores negativos de la inmunidad de las plantas. N. fitol. 191, 92-106 (2011).

Artículo CAS Google Scholar

Turek, I., Tischer, N., Lassig, R. y Trujillo, M. Selectividad de emparejamiento de varios niveles entre enzimas conjugadoras de ubiquitina E2 y ligasas E3. J. Biol. Química. 293, 16324–16336 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Gadaleta, A., Colasuonno, P., Giove, SL, Blanco, A. & Giancaspro, A. La clonación basada en mapas de QFhb.mgb-2A identifica un gen WAK2 responsable de la resistencia al tizón de la cabeza por Fusarium en el trigo. Ciencia. Rep. 9, 6929 (2019).

Artículo PubMed PubMed Central Google Scholar

Tello, ML y otros en Urban Forests and Trees (eds Konijnendijk, C., Nilsson, K., Randrup, T. & Schipperijn, J.) Capítulo 12 (Springer, 2005).

Gaut, BS, Díez, CM & Morrell, PL Genómica y las dinámicas contrastantes de la domesticación anual y perenne. Tendencias Genet. 31, 709–719 (2015).

Artículo CAS PubMed Google Scholar

Wang, L. y col. Las variaciones somáticas llevaron a la selección de cultivares de naranja ácidos y no ácidos. Nat. Plantas 7, 954–965 (2021).

Artículo CAS PubMed Google Scholar

Murray, MG & Thampson, WF Aislamiento rápido de ADN vegetal de alto peso molecular. Ácidos nucleicos res. 8, 4321–4325 (1980).

Artículo CAS PubMed PubMed Central Google Scholar

Sahu, SK, Thangaraj, M. & Kathiresan, K. Protocolo de extracción de ADN para plantas con altos niveles de metabolitos secundarios y polisacáridos sin utilizar nitrógeno líquido ni fenol. Mol. ISRN. Biol. 2012, 205049 (2012).

Artículo PubMed PubMed Central Google Scholar

Belton, JM y cols. Hi – C: una técnica integral para capturar la conformación de genomas. Métodos 58, 268–276 (2012).

Artículo CAS PubMed Google Scholar

Roach, MJ, Schmidt, SA y Borneman, AR Purga de haplotigs: reasignación de contig alélicos para ensamblajes de genomas diploides de tercera generación. Bioinformación de BMC. 19, 460 (2018).

Artículo CAS Google Scholar

Hu, J., Fan, J., Sun, Z. y Liu, S. NextPolish: una herramienta de pulido del genoma rápida y eficiente para el ensamblaje de lectura larga. Bioinformática 36, ​​2253–2255 (2020).

Artículo CAS PubMed Google Scholar

Sun, H., Ding, J., Piednoël, M. y Schneeberger, K. findGSE: estimación de la variación del tamaño del genoma en humanos y Arabidopsis utilizando frecuencias de k-mer. Bioinformática 34, 550–557 (2018).

Artículo CAS PubMed Google Scholar

Wingett, S. y col. HiCUP: canalización para mapear y procesar datos Hi-C. F1000 Res. 4, 1310 (2015).

Artículo de Google Scholar

Zhang, X., Zhang, S., Zhao, Q., Ming, R. y Tang, H. Ensamblaje de genomas autopoliploides a escala cromosómica con reconocimiento de alelos basados ​​en datos de Hi-C. Nat. Plantas 5, 833–845 (2019).

Artículo CAS PubMed Google Scholar

Pascoal, S. y col. El genoma del grillo de campo revela la huella de una adaptación reciente y abrupta en la naturaleza. Evolución. Letón. 4, 19–33 (2020).

Artículo PubMed Google Scholar

Flynn, JM y cols. RepeatModeler2 para el descubrimiento genómico automatizado de familias de elementos transponibles. Proc. Acad. Nacional. Ciencia. Estados Unidos 117, 9451–9457 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Bao, Z. & Eddy, SR Identificación automatizada de novo de familias de secuencias repetidas en genomas secuenciados. Genoma Res. 12, 1269-1276 (2002).

Artículo CAS PubMed PubMed Central Google Scholar

Price, AL, Jones, NC y Pevzner, PA Identificación de novo de familias repetidas en genomas grandes. Bioinformática 21, i351 – i358 (2005).

Artículo CAS PubMed Google Scholar

Camacho, C. et al. BLAST+: arquitectura y aplicaciones. Bioinformación de BMC. 10, 421 (2009).

Artículo de Google Scholar

Tarailo-Graovac, M. & Chen, N. Uso de enmascarador repetido para identificar elementos repetitivos en secuencias genómicas. actual. Protocolo. Bioinformática 5, 4.10.1–4.10.14 (2009).

Google Académico

Bao, W., Kojima, KK y Kohany, O. Repbase Update, una base de datos de elementos repetitivos en genomas eucariotas. Multitud. ADN 6, 11 (2015).

Artículo PubMed PubMed Central Google Scholar

Ou, S. & Jiang, N. LTR_retriever: un programa sensible y de alta precisión para la identificación de retrotransposones repetidos terminales largos. Fisiol vegetal. 176, 1410-1422 (2018).

Artículo CAS PubMed Google Scholar

Ellinghaus, D., Kurtz, S. & Willhoeft, U. LTRharvest, un software eficiente y flexible para la detección de novo de retrotransposones LTR. Bioinformación de BMC. 9, 18 (2008).

Artículo de Google Scholar

Xu, Z. & Wang, H. LTR_FINDER: una herramienta eficaz para la predicción de retrotransposones LTR de longitud completa. Ácidos nucleicos res. 35, W265-W268 (2007).

Artículo PubMed PubMed Central Google Scholar

Yang, Z. PAML 4: análisis filogenético por máxima verosimilitud. Mol. Biol. Evolución. 24, 1586-1591 (2007).

Artículo CAS PubMed Google Scholar

Haas, BJ y cols. Reconstrucción de secuencia de transcripción de novo a partir de RNA-seq utilizando la plataforma Trinity para generación y análisis de referencia. Nat. Protocolo. 8, 1494-1512 (2013).

Artículo CAS PubMed Google Scholar

Haas, BJ y cols. Anotación automatizada de la estructura de genes eucarióticos utilizando EVidenceModeler y el programa para ensamblar alineaciones empalmadas. Genoma Biol. 9, R7 (2008).

Artículo PubMed PubMed Central Google Scholar

Kim, D., Langmead, B. & Salzberg, SL HISAT: un alineador empalmado rápido con bajos requisitos de memoria. Nat. Métodos 12, 357–360 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Stanke, M. & Morgenstern, B. AUGUSTUS: un servidor web para la predicción de genes en eucariotas que permite restricciones definidas por el usuario. Ácidos nucleicos res. 33, W465-W467 (2005).

Artículo CAS PubMed PubMed Central Google Scholar

Goodstein, DM y cols. Fitozoma: una plataforma comparativa para la genómica de plantas verdes. Ácidos nucleicos res. 40, D1178–Dd1186 (2012).

Artículo CAS PubMed Google Scholar

Birney, E., Clamp, M. y Durbin, R. GeneWise y genomewise. Genoma Res. 14, 988–995 (2004).

Artículo CAS PubMed PubMed Central Google Scholar

Manni, M., Berkeley, MR, Seppey, M., Simão, FA y Zdobnov, EM Actualización de BUSCO: flujos de trabajo novedosos y optimizados junto con una cobertura filogenética más amplia y profunda para la puntuación de genomas eucariotas, procarióticos y virales. Mol. Biol. Evolución. 38, 4647–4654 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Kriventseva, EV y cols. OrthoDB v10: muestreo de la diversidad de genomas de animales, plantas, hongos, protistas, bacterias y virus para anotaciones evolutivas y funcionales de ortólogos. Ácidos nucleicos res. 47, D807–D811 (2019).

Artículo CAS PubMed Google Scholar

Krzywinski, M. & Schein, JI Circos: una estética de la información para la genómica comparada. Genoma Res. 19, 1639-1645 (2009).

Artículo CAS PubMed PubMed Central Google Scholar

Bairoch, A. & Apweiler, R. La base de datos de secuencias de proteínas SWISS-PROT y su suplemento TrEMBL en 2000. Nucleic Acids Res. 28, 45–48 (2000).

Artículo CAS PubMed PubMed Central Google Scholar

Marchler-Bauer, A. et al. CDD: una base de datos de dominio conservado para la anotación funcional de proteínas. Ácidos nucleicos res. 39, D225-D229 (2011).

Artículo CAS PubMed Google Scholar

Hunter, S. y col. InterPro: la base de datos integradora de firmas de proteínas. Ácidos nucleicos res. 37, D211-D215 (2009).

Artículo CAS PubMed Google Scholar

Zdobnov, EM & Apweiler, R. InterProScan: una plataforma de integración para los métodos de reconocimiento de firmas en InterPro. Bioinformática 17, 847–848 (2001).

Artículo CAS PubMed Google Scholar

Conesa, A. & Götz, S. Blast2GO: una suite integral para análisis funcional en genómica vegetal. En t. J. Genoma vegetal. 2008, 619832 (2008).

Google Académico

Kanehisa, M. & Goto, S. KEGG: enciclopedia de genes y genomas de Kyoto. Ácidos nucleicos res. 28, 27–30 (2000).

Artículo CAS PubMed PubMed Central Google Scholar

Moriya, Y., Itoh, M., Okuda, S., Yoshizawa, AC y Kanehisa, M. KAAS: un servidor automático de anotación genómica y reconstrucción de vías. Ácidos nucleicos res. 35, W182–W185 (2007).

Artículo PubMed PubMed Central Google Scholar

Wu, T. y col. clusterProfiler 4.0: una herramienta de enriquecimiento universal para interpretar datos ómicos. Innovación 2, 100141 (2021).

CAS PubMed PubMed Central Google Académico

Emms, DM y Kelly, S. OrthoFinder: inferencia de ortología filogenética para genómica comparada. Genoma Biol. 20, 238 (2019).

Artículo PubMed PubMed Central Google Scholar

Stamatakis, A. RAxML versión 8: una herramienta para el análisis filogenético y el posanálisis de grandes filogenias. Bioinformática 30, 1312-1313 (2014).

Artículo CAS PubMed PubMed Central Google Scholar

De Bie, T., Cristianini, N., Demuth, JP & Hahn, MW CAFE: una herramienta computacional para el estudio de la evolución de la familia de genes. Bioinformática 22, 1269-1271 (2006).

Artículo PubMed Google Scholar

Eddy, SR Búsquedas HMM de perfil aceleradas. Computación PLoS. Biol. 7, e1002195 (2011).

Artículo CAS PubMed PubMed Central Google Scholar

Wang, X. et al. Inferencia estadística de homología cromosómica basada en la colinealidad genética y aplicaciones a Arabidopsis y arroz. Bioinformación de BMC. 7, 447 (2006).

Artículo de Google Scholar

Nei, M. & Gojobori, T. Métodos simples para estimar el número de sustituciones de nucleótidos sinónimas y no sinónimas. Mol. Biol. Evolución. 3, 418–426 (1986).

CAS PubMed Google Académico

Sol, P. et al. WGDI: un conjunto de herramientas fácil de usar para análisis evolutivos de duplicaciones de genoma completo y cariotipos ancestrales. Mol. Planta 15, 1841–1851 (2022).

Artículo CAS PubMed Google Scholar

Li, H. y Durbin, R. Alineación de lectura corta rápida y precisa con la transformada de Burrows-Wheeler. Bioinformática 25, 1754-1760 (2009).

Artículo CAS PubMed PubMed Central Google Scholar

DePristo, MA y cols. Un marco para el descubrimiento de variaciones y el genotipado utilizando datos de secuenciación de ADN de próxima generación. Nat. Gineta. 43, 491–498 (2011).

Artículo CAS PubMed PubMed Central Google Scholar

Li, H. y col. El formato de alineación/mapa de secuencia y SAMtools. Bioinformática 25, 2078–2079 (2009).

Artículo PubMed PubMed Central Google Scholar

Danecek, P. y col. El formato de llamada variante y VCFtools. Bioinformática 27, 2156–2158 (2011).

Artículo CAS PubMed PubMed Central Google Scholar

Purcell, S. y col. PLINK: un conjunto de herramientas para análisis de asociación de genoma completo y análisis de vinculación basados ​​en poblaciones. Soy. J. Hum. Gineta. 81, 559–575 (2007).

Artículo CAS PubMed PubMed Central Google Scholar

Alexander, DH y Lange, K. Mejoras al algoritmo ADMIXTURE para la estimación de ascendencia individual. Bioinformación de BMC. 12, 246 (2011).

Artículo de Google Scholar

Precio, AL y col. El análisis de componentes principales corrige la estratificación en estudios de asociación de todo el genoma. Nat. Gineta. 38, 904–909 (2006).

Artículo CAS PubMed Google Scholar

Li, H. y Durbin, R. Inferencia de la historia de la población humana a partir de secuencias individuales del genoma completo. Naturaleza 475, 493–496 (2011).

Artículo CAS PubMed PubMed Central Google Scholar

Excoffier, L. & Lischer, HE Arlequin suite ver 3.5: una nueva serie de programas para realizar análisis de genética de poblaciones en Linux y Windows. Mol. Ecológico. Recurso. 10, 564–567 (2010).

Artículo PubMed Google Scholar

Oksanen, J. y col. Paquete de ecología comunitaria vegana Versión 2.5-7 (2020).

Browning, BL, Zhou, Y. & Browning, SR Un genoma imputado de un centavo a partir de paneles de referencia de próxima generación. Soy. J. Hum. Gineta. 103, 338–348 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Browning, BL, Tian, ​​X., Zhou, Y. y Browning, SR Fase rápida en dos etapas de datos de secuencia a gran escala. Soy. J. Hum. Gineta. 108, 1880–1890 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Garud, NR, Messer, PW, Buzbas, EO y Petrov, DA Los recientes barridos selectivos en Drosophila melanogaster norteamericana muestran firmas de barridos suaves. PLoS Genet. 11, e1005004 (2015).

Artículo PubMed PubMed Central Google Scholar

Szpiech, ZA selscan 2.0: escaneo en busca de barridos en datos sin fases. Preimpresión en bioRxiv 2021.10.22.465497. (2021).

Descargar referencias

Agradecemos las excelentes sugerencias de los editores y de los tres revisores para mejorar el manuscrito. Este estudio fue apoyado por la Fundación Nacional de Ciencias Naturales de China (subvención n.º 32001085) y los Fondos de Investigación Fundamental para Universidades Centrales (subvención n.º lzujbky-2020-34).

Estos autores contribuyeron igualmente: Zefu Wang, Xiao Zhang.

Laboratorio Estatal Clave de Mejoramiento de Herbarios y Agroecosistemas de Pastizales, Facultad de Ecología, Universidad de Lanzhou, Lanzhou, 730000, China

Zefu Wang, Weixiao Lei, Hui Zhu, Shengdan Wu y Dafu Ru

Laboratorio clave de conservación y utilización de la diversidad animal de Tianjin, Facultad de Ciencias de la Vida, Universidad Normal de Tianjin, Tianjin, 300387, China

Zefu Wang y Xiao Zhang

Centro de Co-Innovación para la Silvicultura Sostenible en el Sur de China, Facultad de Biología y Medio Ambiente, Universidad Forestal de Nanjing, Nanjing, 210037, China

Zefu Wang

Instituto de la Meseta de Loess, Universidad de Shanxi, Taiyuan, 030006, China

Bing Bing Liu

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

DR, XZ, ZW, SW y BL concibieron el proyecto y diseñaron los análisis; ZW realizó la investigación; ZW, XZ, HZ, WL, SW, BL y DR analizaron los datos; XZ, ZW y DR escribieron el artículo; y todos los autores revisaron y aprobaron el manuscrito final.

Correspondencia a Xiao Zhang, Shengdan Wu, Bingbing Liu o Dafu Ru.

Los autores declaran no tener conflictos de intereses.

Communications Biology agradece a Fang Du, Jianchao Ma y los demás revisores anónimos por su contribución a la revisión por pares de este trabajo. Editores principales: Matteo Dell'Acqua y David Favero. Un archivo de revisión por pares está disponible.

Nota del editor Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Wang, Z., Zhang, X., Lei, W. et al. El ensamblaje del genoma a nivel cromosómico y la genómica poblacional de Robinia pseudoacacia revelan la base genética de su amplio cultivo. Común Biol 6, 797 (2023). https://doi.org/10.1038/s42003-023-05158-6

Descargar cita

Recibido: 14 de febrero de 2023

Aceptado: 19 de julio de 2023

Publicado: 31 de julio de 2023

DOI: https://doi.org/10.1038/s42003-023-05158-6

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.