Item request has been placed!
×
Item request cannot be made.
×

Towards a deeper haplotype mining of complex traits in rice with RFGB v2.0
Item request has been placed!
×
Item request cannot be made.
×

- Author(s): Chunchao Wang; Hong Yu; Ji Huang; Wensheng Wang; Muhiuddin Faruquee; Fan Zhang; Xiuqin Zhao; Binying Fu; Kai Chen; Hong‐Liang Zhang; Shuaishuai Tai; Chaochun Wei; Kenneth L. McNally; Nickolai Alexandrov; Xiuying Gao; Jiayang Li; Zhikang Li; Jianlong Xu; Tianqing Zheng
- Source:
Plant Biotechnol J- Subject Terms:
Multifactorial Inheritance; Genotype; Genome browser; Gamma-Aminobutyric Acid Metabolism in Plants; Oryza sativa; Plant Science; Phenotypic trait; Gene; Agricultural and Biological Sciences; Computational biology; 03 medical and health sciences; INDEL Mutation; Biochemistry, Genetics and Molecular Biology; Germplasm; Databases, Genetic; Genetics; Haplotype; Data Mining; phylogenetic tree; RNA Sequencing Data Analysis; Indel; Molecular Biology; Biology; Single-nucleotide polymorphism; Allele; 0303 health sciences; Genome; Life Sciences; Oryza; Phylogenetic Analysis; Genomics; Agronomy; Rice Genomics; Genetic Mapping; Phenotype; Haplotypes; Genetic Architecture of Quantitative Traits; FOS: Biological sciences; Brief Communications- Document Type:
Article
Conference object
Other literature type- Online Access:
https://onlinelibrary.wiley.com/doi/pdfdirect/10.1111/pbi.13215
https://pubmed.ncbi.nlm.nih.gov/31336017
https://onlinelibrary.wiley.com/doi/epdf/10.1111/pbi.13215
https://onlinelibrary.wiley.com/doi/full/10.1111/pbi.13215
https://europepmc.org/article/MED/31336017
https://pubmed.ncbi.nlm.nih.gov/31336017/
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6920129 - Source:
- Additional Information
- Publication Information: Wiley, 2019.
- Publication Date: 2019
- Abstract: Le riz (Oryza sativa L.) fournit non seulement une assurance couvrant la sécurité alimentaire mondiale, mais sert également de modèle pour la recherche sur les plantes. Actuellement, avec des données de séquençage massivement accumulées, diverses bases de données ont été construites pour différents utilisateurs cibles, y compris la carte des variations du génome (Song et al., 2018), RiceVarMap (Zhao et al., 2015), base de données SNP-Seek (Alexandrov et al., 2015), RPAN (Sun et al., 2017) et MBK V1 (Institute of Genetics and Developmental Biology, C.A.S., 2018). Cependant, aucun d'entre eux n'est conçu pour répondre aux demandes croissantes d'extraction par corrélation entre d'énormes ensembles de données phénotypiques et génotypiques du génome reséquencé. Un outil en ligne pour une exploration plus approfondie des allèles/haplotypes favorables est urgent. En 2015, un prototype de Rice Functional and Genomic Breeding (RFGB) a été développé pour une application de sélection (Zheng et al., 2015) sur la base des données SNP & InDel du projet 3000 Rice Genome (3K-RG) (The-3K-rice-genomes-project, 2014). Afin de combler les énormes écarts entre les ensembles de données phénotypiques et génotypiques du génome séquencé, notre nouveau service Web nommé RFGB v2.0 est maintenant officiellement en ligne (http://www.rmbreeding.cn/Index/). RFGB v2.0 contient cinq modules principaux, dont Phenotype, Haplotype, SNP & InDel, Germplasm et Restore Sequence. Les données phénotypiques pour l'accession 3K ont été intégrées dans le module Phénotype. Actuellement, les données de 12 traits sont déjà accessibles au public. Pour améliorer l'adaptabilité, une fonction d'analyse en temps réel avec des données phénotypiques téléchargées par l'utilisateur est fournie. Dans la fonction d'analyse intégrée dans le module Haplotype, des SNP non synonymes ont été pris en compte. Les fonctions de dépistage de la fréquence allélique (MAF) et de définition de l'échantillon sont également disponibles. Dans le module SNP & InDel, les informations d'une requête de gène sont accessibles en effectuant une recherche avec l'ID du locus, la région chromosomique ou même des mots clés. Dans le module Germplasm, le regroupement des germoplasmes 3K a été mis à jour selon notre récent rapport (Wang et al., 2018). L'ensemble de données sur le germoplasme a été réorganisé pour améliorer l'efficacité des données. De plus, nous avons corrigé les erreurs de calcul dans la version d'essai du module Restore Sequence en tenant pleinement compte d'InDel. Plus de détails sur les méthodologies de construction et d'utilité RFGB v2.0 sont accessibles via nos documents en ligne (http://www.rmbreeding.cn/Index/manual). Quatre cas d'utilisateurs typiques sélectionnés à partir de nos tests Web ont été présentés ici : 1) explorer des donneurs favorables, 2) présélectionner des gènes candidats, 3) extraire des haplotypes favorables et 4) rechercher des variations et restaurer des séquences. Un travail typique de pré-breeding/génétique avancée commence par le phénotypage. Comme le montre la figure 1a, nous avons adopté notre ensemble de données publiées sur la concentration de zinc dans les grains broyés (Zn) (Zhang et al., 2018) avec une distribution normale comme exemple de cas. Fait intéressant, en téléchargeant des données dans le module Phénotype, l'utilisateur a constaté que Zn, le trait personnalisé (données téléchargées), variait entre différents groupes du 3K-RG avec la visionneuse de tracé de boîte. Trois groupes de germoplasmes 3K-RG présentaient les valeurs les plus élevées de Zn, à savoir les groupes Geng/japonica (GJ), Aus et Basmati (bas). Pour les programmes d'élevage travaillant sur le développement de cultivars de Geng/japonica, le germoplasme du groupe GJ avec des valeurs de Zn plus élevées serait recommandé en tant que donneurs reproducteurs. Au contraire, pour un élevage Xian/indica, les donneurs du groupe Aus et/ou bas seraient favorables. De plus amples détails sur les donateurs ci-dessus sont accessibles à l'aide du module de germoplasme. Comme le montre la figure 1b, une voie pour la présélection des gènes candidats avec RFGB v2.0 a été soutenue par un cas d'utilisation travaillant sur la dissection de la longueur des grains (GL) en quatre étapes : 1) construire des lignées quasi-isogéniques (NIL) pour le locus cible ; 2) mettre en place une analyse omique multiple pour le parent NIL et récurrent (RP) pour obtenir une liste de gènes exprimés différentiellement (DEG) ; 3) utiliser le module haplotype pour l'analyse d'association haplotype-phénotype ; et 4) présélectionner la liste DEG sur la base de comparaisons des différences de traits cibles entre les haplotypes. Dans le cas du GL, des analyses transcriptomiques et phosphoprotéomiques ont été effectuées pour NILqgl3 et RP, qui se sont révélées significativement différentes dans le GL. Un total de 22 DEG a été trouvé. Ensuite, nous avons effectué une analyse haplotypique avec l'ensemble de données GL intégré dans RFGB v2.0, qui compte actuellement plus de 2 000 points de données GL valides. Avec le paramètre MAF = non filtré, la liste des gènes candidats a été raccourcie en supprimant 31,8 % des gènes de la liste qui se sont révélés être des GL non liés avec des preuves intuitives à l'appui du module Haplotype. Comme le montre la figure 1c, une voie d'extraction d'haplotypes favorables avec RFGB v2.0 comprend quatre étapes principales : 1) l'évaluation des traits pour les germoplasmes du 3K-RG ; 2) la définition des régions candidates par GWAS/cartographie de liaison ; 3) la présélection des gènes candidats avec de multiples preuves ; et 4) l'exploration des haplotypes favorables des gènes candidats pour les traits cibles. Dans ce cas, par cartographie GWAS, nous avons trouvé un locus qSV3e, qui abritait un gène connu Os03 g0856700 codant la gibbérelline 20 oxydase 1 affectant à la fois le nombre de mottes (TN) et la hauteur de la plante (PH) au stade des semis sous un système de riz à ensemencement direct de riz paddy (PDSR). Étant donné qu'une TN relativement élevée serait un trait favorable pour les sélectionneurs de riz, nous avons effectué notre analyse d'haplotype pour Os03 g0856700 avec des données TN téléchargées à l'aide du module Haplotype. Nous avons constaté que HAP 7 de Os03 g0856700 contribuait davantage à la TN que les autres haplotypes et pouvait être adopté comme haplotypes d'élite candidats pour la sélection moléculaire du riz dans le cadre du système PDSR. Une liste de donneurs de 16 germoplasmes 3K-RG porteurs de Hap 7 était également accessible dans le module Haplotype. En plus des explorations ci-dessus, un itinéraire pour l'exploration de variations avec RFGB v2.0 comprend les trois étapes suivantes (Figure 1d) : 1) définir une région cible pour cibler les traits avec des accessions partielles du 3K-RG, 2) accéder à plus de variations dans la région cible avec le module SNP & InDel et 3) accéder aux séquences de restauration abritant les variations de ciblage à l'aide du module Restore Sequence pour une confirmation supplémentaire en laboratoire humide. Dans notre cas d'utilisateur, une région cible, qRl4-2, a été définie avec GWAS avec pas plus de 1000 accessions pour un trait de ciblage, l'indice de roulis des feuilles (LRI). Avec le moteur JBrowse intégré dans le module SNP & InDel, une exploration plus approfondie des variations au sein de qRl4-2 dans plus de 2000 germoplasmes supplémentaires était possible. Des séquences de restauration de germoplasmes d'élite ont ensuite été téléchargées en fonction de la sous-région abritant les variations du génome en fonction de la navigation du génome avec le module SNP & InDel. D'autres travaux en laboratoire humide seraient effectués sur la base de ces résultats. RFGB v2.0 a offert une vue unique sur les relations entre deux grands ensembles de données (données phénotypiques et génotypiques) du génome séquencé, en particulier une analyse en temps réel pour les associations phénotype-haplotype. Avec différentes combinaisons de modules et de fonctions intégrées dans RFGB v2.0, les utilisateurs peuvent se sentir libres d'avoir une vision plus approfondie du ciblage des traits complexes. Cela peut inspirer plus d'idées sur l'exploration plus approfondie de traits complexes avec des données de génome séquencées. Enfin, afin de mettre en place une plateforme ouverte au public, deux fonctions sont désormais disponibles. L'une est la « demande de semences » (http://www.rmbreeding.cn/public/request_germplasm) qui aide les utilisateurs à accéder plus facilement aux semences 3K-RG pour leurs propres travaux de phénotypage. L'autre est « contribuer vos données à RFGB » (http://www.rmbreeding.cn/Phenotype/contribute_phenotype) qui aide les utilisateurs à télécharger leurs propres données phénotypiques à RFGB. En ce qui concerne la propriété intellectuelle, à l'heure actuelle, seules les données publiées sont entièrement ouvertes au téléchargement. Ce travail a été soutenu par un sous-programme du Key Special Project on Molecular Design Breeding for Rice (2016YFD0101801, 2016YFD0100904), la National Natural Science Foundation of China (31871715), le Guangxi Key Laboratory of Rice Genetics and Breeding (2018-05-Z06-KF01), la Mission de coopération et d'innovation (CAAS-XTCX2016009, CAAS-ZDXT2018001) et le Agricultural Science and Technology Innovation Program, Shenzhen Peacock Plan(20130415095710361), le projet « Green Super Rice » de la Fondation Bill & Melinda Gates (OPP1130530), les Fonds de recherche fondamentale pour les universités centrales (Y201900029) et le Jiangsu Collaborative Innovation Center for Modern Crop Production. Les auteurs déclarent qu'ils n'ont pas d'intérêts concurrents. Ils apprécient grandement les rédacteurs et deux réviseurs anonymes pour leurs précieux commentaires sur l'amélioration des manuscrits. ZKL, JYL, JLX et TQZ ont conçu l'étude et rédigé le manuscrit. CCW et HY ont contribué au codage. JH a contribué au partage des données expérimentales. WSW a contribué au partage des données sur les semences et les phénotypes. MF, ZF, XQZ, BYF, KC, HLZ, KLM, NA et XYG ont contribué aux cas d'utilisation. SST et CW ont contribué à la rédaction et à la révision.
El arroz (Oryza sativa L.) no solo proporciona un seguro que cubre la seguridad alimentaria mundial, sino que también funciona como modelo para la investigación de plantas. Actualmente, con datos de secuenciación acumulados de manera abrumadora, se construyeron varias bases de datos para diferentes usuarios objetivo, incluido el Mapa de Variación Genómica (Song et al., 2018), RiceVarMap (Zhao et al., 2015), base de datos SNP-Seek (Alexandrov et al., 2015), RPAN (Sun et al., 2017) y MBK V1 (Instituto de Genética y Biología del Desarrollo, C.A.S., 2018). Sin embargo, ninguno de ellos está diseñado para satisfacer las crecientes demandas de minería de correlación entre enormes conjuntos de datos fenotípicos y genotípicos del genoma resecuenciado. Se necesita urgentemente una herramienta en línea para una extracción más profunda de alelos/haplotipos favorables. En 2015, se desarrolló un prototipo de Rice Functional and Genomic Breeding (RFGB) para la aplicación de mejoramiento (Zheng et al., 2015) basado en datos SNP e InDel del proyecto 3000 rice genome (3K-RG) (The-3K-rice-genomes-project, 2014). Con el fin de cerrar las enormes brechas entre los conjuntos de datos fenotípicos y genotípicos del genoma secuenciado, nuestro servicio web recientemente diseñado llamado RFGB v2.0 ahora está formalmente en línea (http://www.rmbreeding.cn/Index/). RFGB v2.0 contiene cinco módulos principales, que incluyen Fenotipo, Haplotipo, SNP e InDel, Germoplasma y Secuencia de Restauración. Los datos fenotípicos para la adhesión de 3K se integraron en el módulo Phenotype. Actualmente, los datos de 12 rasgos ya son de acceso público. Para mejorar la adaptabilidad, se proporciona una función de análisis en tiempo real con datos fenotípicos cargados por el usuario. En la función de análisis integrada en el módulo de haplotipos, se consideraron los SNP no sinónimos. También están disponibles las funciones de detección de frecuencia alélica (MAF) y definición de muestras. En el módulo SNP e InDel, se puede acceder a la información de una consulta génica buscando con ID de locus, región cromosómica o incluso palabras clave. En el módulo Germoplasma se ha actualizado la agrupación de los germoplasmas 3K según nuestro reciente informe (Wang et al., 2018). El conjunto de datos de germoplasma se reorganizó para mejorar la eficiencia de los datos. Además, hemos corregido los errores de cálculo en la versión de prueba del módulo Restore Sequence con la plena consideración de InDel. Se puede acceder a más detalles sobre las metodologías de construcción y servicios públicos de RFGB v2.0 a través de nuestros materiales en línea (http://www.rmbreeding.cn/Index/manual). Aquí se presentaron cuatro casos de usuarios típicos seleccionados de nuestras pruebas web: 1) exploración de donantes favorables, 2) preselección de genes candidatos, 3) extracción de haplotipos favorables y 4) búsqueda de variaciones y secuencias de restauración. Un trabajo típico de genética previa a la reproducción/directa comienza con el fenotipado. Como se muestra en la Figura 1a, adoptamos nuestro conjunto de datos publicados de concentración de zinc en granos molidos (Zn) (Zhang et al., 2018) con distribución normal como caso de muestra. Curiosamente, al cargar datos en el módulo Phenotype, el usuario descubrió que Zn, el rasgo personalizado (datos cargados), variaba entre los diferentes grupos del 3K-RG con el visor de diagrama de caja. Se encontró que tres grupos de los germoplasmas 3K-RG presentaban los mejores valores de Zn, que son los grupos Geng/japonica (GJ), Aus y Basmati (Bas). Para los esquemas de mejoramiento que trabajan en el desarrollo de cultivar Geng/japonica, se recomendaría el germoplasma del grupo GJ con valores más altos de Zn como donantes de mejoramiento. Por el contrario, para un esquema de reproducción Xian/indica, los donantes del grupo Aus y/o Bas serían favorables. Se puede acceder a más detalles sobre los donantes anteriores utilizando el módulo Germoplasma. Como se muestra en la Figura 1b, una ruta para la preselección de genes candidatos con RFGB v2.0 fue respaldada por un caso de usuario que trabaja en la disección de longitud de grano (GL) con cuatro pasos: 1) construir líneas casi isogénicas (NULAS) para el locus objetivo; 2) configurar múltiples análisis ómicos para el progenitor NULO y recurrente (RP) para obtener una lista de genes expresados diferencialmente (DEG); 3) usar el módulo de haplotipo para el análisis de asociación haplotipo-fenotipo; y 4) preseleccionar la lista DEG basada en comparaciones de las diferencias de rasgos objetivo entre haplotipos. En el caso de GL, se realizaron análisis transcriptómicos y fosfoproteómicos para NILqgl3 y RP, que se encontraron significativamente diferentes en GL. Se han encontrado un total de 22 DEG. Luego, realizamos un análisis de haplotipos con el conjunto de datos GL incrustado en RFGB v2.0, que tiene más de 2,000 puntos de datos GL válidos en la actualidad. Con el ajuste de parámetros de MAF = sin filtrar, la lista de genes candidatos se acortó al eliminar de la lista el 31,8% de los genes que se encontró que no estaban relacionados con GL con evidencias de apoyo intuitivas del módulo de haplotipos. Como se muestra en la Figura 1c, una ruta para extraer haplotipos favorables con RFGB v2.0 incluye cuatro pasos principales: 1) evaluación de rasgos para los germoplasmas del 3K-RG; 2) definición de regiones candidatas mediante mapeo de GWAS/ligamiento; 3) preseleccionar genes candidatos con múltiples evidencias; y 4) explorar haplotipos favorables de genes candidatos para rasgos diana. En este caso, mediante mapeo GWAS, encontramos un loci qSV3e, que albergaba un gen conocido Os03 g0856700 que codifica la giberelina 20 oxidasa 1 que afecta tanto al número de caña (TN) como a la altura de la planta (PH) en la etapa de plántula bajo un sistema de arroz de siembra directa en arrozales (PDSR). Dado que un TN relativamente más alto sería un rasgo favorable para los criadores de arroz, llevamos a cabo nuestro análisis de haplotipos para Os03 g0856700 con datos de TN cargados utilizando el módulo de haplotipos. Encontramos que HAP 7 de Os03 g0856700 contribuyó más a TN que los otros haplotipos y podría adoptarse como haplotipos de élite candidatos para el mejoramiento molecular del arroz bajo el sistema PDSR. También se pudo acceder a una lista de donantes de 16 germoplasmas 3K-RG que portaban HAP 7 en el módulo de haplotipos. Además de las exploraciones anteriores, una ruta para la minería de variaciones con RFGB v2.0 incluye los siguientes tres pasos (Figura 1d): 1) definir una región objetivo para el rasgo de selección con accesos parciales desde el 3K-RG, 2) acceder a más variaciones dentro de la región objetivo con el módulo SNP e InDel y 3) acceder a las secuencias de restauración que albergan las variaciones de selección utilizando el módulo Restore Sequence para una mayor confirmación de laboratorio húmedo. En nuestro caso de usuario, se definió una región objetivo, qRl4-2, con GWAS con no más de 1000 accesiones para un rasgo de direccionamiento, el índice de balanceo de hojas (LRI). Con el motor JBrowse integrado en el módulo SNP e InDel, era factible una extracción más profunda de variaciones dentro de qRl4-2 en más de 2000 germoplasmas adicionales. Las secuencias de restauración de los germoplasmas de élite se descargaron de acuerdo con la subregión que alberga las variaciones del genoma de acuerdo con la navegación del genoma con el módulo SNP e InDel. Se llevarían a cabo más trabajos de laboratorio húmedo en función de estos resultados. RFGB v2.0 ha ofrecido una visión única sobre las relaciones entre dos grandes conjuntos de datos (datos fenotípicos y genotípicos) del genoma secuenciado, especialmente un análisis en tiempo real de las asociaciones fenotipo-haplotipo. Con diferentes combinaciones de los módulos y funciones integradas en RFGB v2.0, los usuarios pueden sentirse libres de tener una visión más profunda de la orientación de rasgos complejos. Esto puede inspirar más ideas sobre la minería más profunda de rasgos complejos con datos de genoma secuenciados. Finalmente, para establecer una plataforma abierta al público, ahora hay dos funciones disponibles. Una es 'Seed request' (http://www.rmbreeding.cn/public/request_germplasm) que ayuda a los usuarios a acceder a las semillas 3K-RG más fácilmente para sus propios trabajos de fenotipado. El otro es "contribuya con sus datos a RFGB" (http://www.rmbreeding.cn/Phenotype/contribute_phenotype), que ayuda a los usuarios a cargar sus propios datos fenotípicos a RFGB. Con respecto a la propiedad intelectual, en la actualidad, solo los datos publicados están completamente abiertos para su descarga. Este trabajo fue apoyado por un subprograma del Key Special Project on Molecular Design Breeding for Rice (2016YFD0101801, 2016YFD0100904), la National Natural Science Foundation of China (31871715), el Guangxi Key Laboratory of Rice Genetics and Breeding (2018-05-Z06-KF01), la Cooperation and Innovation Mission (CAAS-XTCX2016009, CAAS-ZDXT2018001) y el Agricultural Science and Technology Innovation Program, Shenzhen Peacock Plan(20130415095710361), el proyecto 'Green Super Rice' de la Fundación Bill & Melinda Gates '(OPP1130530), los Fondos de Investigación Fundamental para las Universidades Centrales (Y201900029) y el Jiangsu Collaborative Innovation Center for Modern Crop Production. Los autores declaran que no tienen intereses contrapuestos. Aprecian mucho a los Editores y a dos revisores anónimos por sus valiosos comentarios sobre la mejora del manuscrito. ZKL, JYL, JLX y TQZ concibieron el estudio y redactaron el manuscrito. CCW y HY contribuyeron a la codificación. JH contribuyó al intercambio de datos experimentales. WSW contribuyó al intercambio de datos de semillas y fenotípicos. MF, ZF, XQZ, BYF, KC, HLZ, KLM, NA y XYG contribuyeron a los casos de usuario. SST y CW contribuyeron a la redacción y revisión.
Rice (Oryza sativa L.) not only provides insurance covering global food security but also works as a model for plant research. Currently, with overwhelmingly accumulated sequencing data, various databases were constructed for different target users, including the Genome Variation Map (Song et al., 2018), RiceVarMap (Zhao et al., 2015), SNP-Seek database (Alexandrov et al., 2015), RPAN (Sun et al., 2017) and MBK V1 (Institute of Genetics and Developmental Biology, C.A.S., 2018). However, none of them is designed to meet increasing demands of correlation mining between huge sets of phenotypic and genotypic data of re-sequenced genome. Online tool for deeper mining of favourable allele/haplotypes is in urgent need. In 2015, prototype of Rice Functional and Genomic Breeding (RFGB) was developed for breeding application (Zheng et al., 2015) based on SNP & InDel data from the 3000 rice genome (3K-RG) project (The-3K-rice-genomes-project, 2014). In order to bridge huge gaps between phenotypic and genotypic data sets of sequenced genome, our newly designed web service named RFGB v2.0 is now formally online (http://www.rmbreeding.cn/Index/). RFGB v2.0 contains five major modules, including Phenotype, Haplotype, SNP & InDel, Germplasm and Restore Sequence. The phenotypic data for 3K accession were embedded in the Phenotype module. Currently, data of 12 traits are already publicly accessible. To improve the adaptivity, a function of real-time analysis with user uploaded phenotypic data is provided. In the analysis function embedded in the Haplotype module, non-synonym SNPs were considered. The functions of allelic frequency (MAF) screening and sample definition are also available. In the SNP & InDel module, information of a gene query is accessible by searching with either locus ID, chromosome region or even key words. In the Germplasm module, grouping of the 3K germplasms has been updated according to our recent report (Wang et al., 2018). The germplasm data set was re-organized to improve data efficiency. Additionally, we have corrected calculation errors in the trial version of the Restore Sequence module with full consideration of InDel. More details about the RFGB v2.0 construction and utility methodologies are accessible through our online materials (http://www.rmbreeding.cn/Index/manual). Four typical user cases picked from our web tests were presented here: 1) exploring favourable donors, 2) shortlisting candidate genes, 3) mining favourable haplotypes and 4) seeking variations and restore sequences. A typical pre-breeding/forward genetics work begins with phenotyping. As shown in Figure 1a, we adopted our published data set of zinc concentration in milled grains (Zn) (Zhang et al., 2018) with normal distribution as a sample case. Interestingly, by uploading data to the Phenotype module, user found that Zn, the custom trait (uploaded data), varied between different groups of the 3K-RG with the box-plot viewer. Three groups of the 3K-RG germplasms were found to present top Zn values, which are Geng/japonica (GJ), Aus and Basmati (Bas) groups. For breeding schemes working on Geng/japonica cultivar development, germplasm from GJ group with higher Zn values would be recommended as breeding donors. On the contrary, for a Xian/indica breeding scheme, donors from Aus and/or Bas group would be favourable. Further details for the above donors are accessible using the Germplasm module. As shown in Figure 1b, a route for shortlisting candidate genes with RFGB v2.0 was supported by a user case working on grain length (GL) dissection with four steps: 1) construct near-isogenic lines (NIL) for the target locus; 2) set up multiple omics analysis for the NIL and recurrent parent (RP) to get a list of differentially expressed genes (DEGs); 3) use the Haplotype module for haplotype–phenotype association analysis; and 4) shortlist the DEG list based on comparisons of the target trait differences between haplotypes. In the GL case, transcriptomic and phosphoproteomic analyses were carried out for NILqgl3and RP, which were found to be significantly different in GL. A total of 22 DEGs were found. Then, we carried out haplotype analysis with the GL data set embedded in RFGB v2.0, which has more than 2,000 valid GL data points at present. With the parameter setting of MAF = non-filtered, the candidate gene list was shortened by dropping 31.8% genes off the list which were found to be non-related GL with intuitive supporting evidences from the Haplotype module. As shown in Figure 1c, a route for mining favourable haplotypes with RFGB v2.0 includes four major steps: 1) trait evaluation for the germplasms from the 3K-RG; 2) definition of candidate regions by GWAS/linkage mapping; 3) shortlist candidate genes with multiple evidences; and 4) explore favourable haplotypes of candidate genes for target traits. In this case, by GWAS mapping, we found a loci qSV3e, which was harbouring a known gene Os03 g0856700 coding Gibberellin 20 oxidase 1 affecting both tiller number (TN) and plant height (PH) at the seedling stage under a paddy direct seeding rice (PDSR) system. Since relatively higher TN would be favourable trait for rice breeders, we carried our haplotype analysis for Os03 g0856700 with TN data uploaded using the Haplotype module. We found that Hap 7 of Os03 g0856700 contributed more to TN than the other haplotypes and could be adopted as candidate elite haplotypes for rice molecular breeding under PDSR system. A donor list of 16 3K-RG germplasms carrying Hap 7 were also accessible in the Haplotype module. In addition to the above explorations, a route for variation mining with RFGB v2.0 includes the following three steps (Figure 1d): 1) define a target region for targeting trait with partial accessions from the 3K-RG, 2) access more variations within the target region with the SNP & InDel module and 3) access the restore sequences harbouring the targeting variations using the Restore Sequence module for further wet-lab confirmation. In our user case, a target region, qRl4-2, was defined with GWAS with no more than 1000 accessions for a targeting trait, leaf rolling index (LRI). With the JBrowse engine embedded in the SNP & InDel module, a deeper mining of variations within qRl4-2 in more than 2000 additional germplasm was feasible. Restore sequences of elite germplasms were then downloaded according to the sub-region harbouring the genome variations according to genome browsing with the SNP & InDel module. Further wet-lab work would be carried out based on these results. RFGB v2.0 has offered a unique view on the relationships between two big data sets (phenotypic and genotypic data) of sequenced genome, especially a real-time analysis for the phenotype–haplotype associations. With different combinations of the modules and functions embedded in RFGB v2.0, users may feel free to have a deeper view of targeting complex trait. This may inspire more ideas on deeper mining of complex traits with sequenced genome data. Finally, in order set up an open platform to the public, two functions are now available. One is 'Seed request' (http://www.rmbreeding.cn/public/request_germplasm) which helps users to access the 3K-RG seeds more easily for their own phenotyping works. The other is 'contribute your data to RFGB' (http://www.rmbreeding.cn/Phenotype/contribute_phenotype) which helps users upload their own phenotypic data to RFGB. With respect to intellectual property, at present, only the published data are fully open for download. This work was supported by a subprogram of the Key Special Project on Molecular Design Breeding for Rice (2016YFD0101801, 2016YFD0100904), the National Natural Science Foundation of China (31871715), the Guangxi Key Laboratory of Rice Genetics and Breeding (2018-05-Z06-KF01), the Cooperation and Innovation Mission (CAAS-XTCX2016009, CAAS-ZDXT2018001) and the Agricultural Science and Technology Innovation Program, Shenzhen Peacock Plan(20130415095710361), the 'Green Super Rice' project from Bill & Melinda Gates' Foundation (OPP1130530), the Fundamental Research Funds for the Central Universities (Y201900029) and the Jiangsu Collaborative Innovation Center for Modern Crop Production. The authors declare that they have no competing interests. They greatly appreciate the Editors and two anonymous reviewers for their valuable comments on manuscript improvement. ZKL, JYL, JLX and TQZ conceived the study and draft the manuscript. CCW and HY contributed to coding. JH contributed to experimental data share. WSW contributed to seed and phenotypic data share. MF, ZF, XQZ, BYF, KC, HLZ, KLM, NA and XYG contributed to user cases. SST and CW contributed to writing and revision.
لا يوفر الأرز (Oryza sativa L.) التأمين الذي يغطي الأمن الغذائي العالمي فحسب، بل يعمل أيضًا كنموذج لأبحاث النباتات. في الوقت الحالي، مع بيانات التسلسل المتراكمة بشكل كبير، تم إنشاء قواعد بيانات مختلفة لمختلف المستخدمين المستهدفين، بما في ذلك خريطة تباين الجينوم (Song et al.، 2018)، RiceVarMap (Zhao et al.، 2015)، قاعدة بيانات SNP - Seek (Alexandrov et al.، 2015)، RPAN (Sun et al.، 2017) و MBK V1 (معهد علم الوراثة والبيولوجيا التنموية، C.A.S.، 2018). ومع ذلك، لم يتم تصميم أي منها لتلبية المتطلبات المتزايدة لتعدين الارتباط بين مجموعات ضخمة من بيانات النمط الظاهري والنمط الجيني للجينوم المعاد تسلسله. هناك حاجة ماسة إلى أداة عبر الإنترنت للتعدين الأعمق للأليل/الأنماط الفردية المواتية. في عام 2015، تم تطوير نموذج أولي لتربية الأرز الوظيفية والجينية (RFGB) لتطبيق التكاثر (Zheng et al.، 2015) بناءً على بيانات SNP و InDel من مشروع جينوم الأرز 3000 (3K - RG) (مشروع جينوم الأرز 3K، 2014). من أجل سد الفجوات الهائلة بين مجموعات بيانات النمط الظاهري والنمط الجيني للجينوم المتسلسل، أصبحت خدمة الويب المصممة حديثًا المسماة RFGB v2.0 متاحة الآن رسميًا عبر الإنترنت (http://www.rmbreeding.cn/Index/). يحتوي RFGB v2.0 على خمس وحدات رئيسية، بما في ذلك النمط الظاهري والنمط الفردي و SNP و InDel و Germplasm و Restore Sequence. تم تضمين بيانات النمط الظاهري لانضمام 3K في وحدة النمط الظاهري. في الوقت الحالي، يمكن للجمهور الوصول إلى بيانات 12 سمة. لتحسين القدرة على التكيف، يتم توفير وظيفة التحليل في الوقت الفعلي مع بيانات النمط الظاهري التي تم تحميلها من قبل المستخدم. في وظيفة التحليل المضمنة في وحدة Haplotype، تم النظر في SNPs غير المرادفة. تتوفر أيضًا وظائف فحص تردد الأليل (MAF) وتعريف العينة. في وحدة SNP و InDel، يمكن الوصول إلى معلومات الاستعلام الجيني عن طريق البحث إما باستخدام معرف الموضع أو منطقة الكروموسوم أو حتى الكلمات الرئيسية. في وحدة البلازما الجرثومية، تم تحديث تجميع البلازما الجرثومية 3K وفقًا لتقريرنا الأخير (Wang et al.، 2018). تمت إعادة تنظيم مجموعة بيانات الجبلة الجرثومية لتحسين كفاءة البيانات. بالإضافة إلى ذلك، قمنا بتصحيح أخطاء الحساب في الإصدار التجريبي من وحدة تسلسل الاستعادة مع المراعاة الكاملة لـ InDel. يمكن الوصول إلى مزيد من التفاصيل حول منهجيات البناء والمرافق RFGB v2.0 من خلال موادنا عبر الإنترنت (http://www.rmbreeding.cn/Index/manual). تم تقديم أربع حالات مستخدم نموذجية تم اختيارها من اختبارات الويب الخاصة بنا هنا: 1) استكشاف الجهات المانحة المواتية، 2) وضع قائمة مختصرة للجينات المرشحة، 3) استخراج الأنماط الفردية المواتية و 4) البحث عن الاختلافات واستعادة التسلسلات. يبدأ العمل الوراثي النموذجي قبل التكاثر/إلى الأمام بالتنميط الظاهري. كما هو موضح في الشكل 1 أ، اعتمدنا مجموعة البيانات المنشورة الخاصة بنا لتركيز الزنك في الحبوب المطحونة (Zn) (Zhang et al.، 2018) مع التوزيع الطبيعي كحالة عينة. ومن المثير للاهتمام، أنه من خلال تحميل البيانات إلى وحدة النمط الظاهري، وجد المستخدم أن Zn، السمة المخصصة (البيانات التي تم تحميلها)، تختلف بين مجموعات مختلفة من 3K - RG مع عارض المخطط المربع. تم العثور على ثلاث مجموعات من البلازما الجرثومية 3K - RG لتقديم أعلى قيم Zn، وهي مجموعات Geng/japonica (GJ) و AUS و Basmati (BAS). بالنسبة لمخططات التكاثر التي تعمل على تطوير أصناف جينج/جابونيكا، يوصى باستخدام البلازما الوراثية من مجموعة GJ ذات قيم Zn أعلى كمتبرعين للتكاثر. على العكس من ذلك، بالنسبة لمخطط تكاثر شيان/إنديكا، سيكون المانحون من AUS و/أو مجموعة BAS مواتين. يمكن الوصول إلى مزيد من التفاصيل عن المتبرعين المذكورين أعلاه باستخدام وحدة الجراثيم. كما هو موضح في الشكل 1 ب، تم دعم مسار للقائمة المختصرة للجينات المرشحة مع RFGB v2.0 من خلال حالة مستخدم تعمل على تشريح طول الحبيبات (GL) بأربع خطوات: 1) بناء خطوط شبه متماثلة (NIL) للموضع المستهدف ؛ 2) إعداد تحليل omics متعدد للوالد الصفري والمتكرر (RP) للحصول على قائمة بالجينات المعبر عنها بشكل تفاضلي (DEGs )؛ 3) استخدام وحدة النمط الفرداني لتحليل ارتباط النمط الفرداني الظاهري ؛ و 4) قائمة DEG المختصرة بناءً على مقارنات اختلافات السمات المستهدفة بين الأنماط الفردانية. في حالة GL، تم إجراء تحليلات النسخ والبروتين الفوسفوري لـ NILqgl3 و RP، والتي تبين أنها مختلفة بشكل كبير في GL. تم العثور على ما مجموعه 22 DEGs. بعد ذلك، أجرينا تحليلًا للنمط الفرداني باستخدام مجموعة بيانات دفتر الأستاذ العام المضمنة في RFGB v2.0، والتي تحتوي على أكثر من 2000 نقطة بيانات دفتر الأستاذ العام صالحة في الوقت الحالي. مع إعداد معلمة MAF = غير المرشحة، تم تقصير قائمة الجينات المرشحة عن طريق إسقاط 31.8 ٪ من الجينات من القائمة التي تبين أنها غير مرتبطة بـ GL مع أدلة داعمة بديهية من وحدة النمط الفرداني. كما هو موضح في الشكل 1 ج، يتضمن مسار استخراج الأنماط الفردية المواتية باستخدام RFGB v2.0 أربع خطوات رئيسية: 1) تقييم السمات للبلازما الجرثومية من 3K - RG ؛ 2) تحديد المناطق المرشحة عن طريق GWAS/ربط الخرائط ؛ 3) قائمة مختصرة للجينات المرشحة مع أدلة متعددة ؛ و 4) استكشاف الأنماط الفردية المواتية للجينات المرشحة للسمات المستهدفة. في هذه الحالة، من خلال رسم خرائط GWAS، وجدنا موقع qSV3e، الذي كان يؤوي جينًا معروفًا Os03 g0856700 ترميز Gibberellin 20 oxidase 1 يؤثر على كل من رقم الحارث (TN) وارتفاع النبات (PH) في مرحلة الشتلات تحت نظام الأرز بالبذر المباشر (PDSR). نظرًا لأن TN الأعلى نسبيًا سيكون سمة مواتية لمربي الأرز، فقد أجرينا تحليل النمط الفرداني لـ Os03 g0856700 مع بيانات TN التي تم تحميلها باستخدام وحدة Haplotype. وجدنا أن HAP 7 من Os03 g0856700 ساهم في TN أكثر من الأنماط الفردية الأخرى ويمكن اعتماده كنماذج فردية نخبة مرشحة للتكاثر الجزيئي للأرز في ظل نظام PDSR. كما يمكن الوصول إلى قائمة المتبرعين المكونة من 16 بلازما جرثومية 3K - RG تحمل HAP 7 في وحدة Haplotype. بالإضافة إلى الاستكشافات المذكورة أعلاه، يتضمن مسار التنقيب عن الاختلافات مع RFGB v2.0 الخطوات الثلاث التالية (الشكل 1 د): 1) تحديد منطقة مستهدفة لاستهداف سمة مع ملحقات جزئية من 3K - RG، 2) الوصول إلى المزيد من الاختلافات داخل المنطقة المستهدفة مع وحدة SNP و InDel و 3) الوصول إلى تسلسلات الاستعادة التي تؤوي اختلافات الاستهداف باستخدام وحدة تسلسل الاستعادة لمزيد من التأكيد في المختبر الرطب. في حالة المستخدم لدينا، تم تحديد منطقة مستهدفة، qRl4 -2، باستخدام GWAS مع ما لا يزيد عن 1000 ملحق لسمة الاستهداف، مؤشر درفلة الأوراق (LRI). مع تضمين محرك JBrowse في وحدة SNP و InDel، كان من الممكن إجراء تعدين أعمق للاختلافات داخل qRl4 -2 في أكثر من 2000 بلازما جرثومية إضافية. ثم تم تنزيل سلاسل استعادة البلازما الجرثومية النخبوية وفقًا للمنطقة الفرعية التي تأوي اختلافات الجينوم وفقًا لتصفح الجينوم باستخدام وحدة SNP و InDel. سيتم تنفيذ المزيد من أعمال المختبرات الرطبة بناءً على هذه النتائج. قدم RFGB v2.0 وجهة نظر فريدة حول العلاقات بين مجموعتي بيانات كبيرة (بيانات النمط الظاهري والنمط الجيني) من الجينوم المتسلسل، وخاصة تحليل في الوقت الحقيقي لارتباطات النمط الظاهري والنمط الفردي. مع مجموعات مختلفة من الوحدات والوظائف المضمنة في RFGB v2.0، قد يشعر المستخدمون بالحرية في الحصول على رؤية أعمق لاستهداف السمات المعقدة. قد يلهم هذا المزيد من الأفكار حول التعدين الأعمق للسمات المعقدة مع بيانات الجينوم المتسلسلة. أخيرًا، من أجل إنشاء منصة مفتوحة للجمهور، تتوفر الآن وظيفتان. أحدها هو "طلب البذور" (http://www.rmbreeding.cn/public/request_germplasm) الذي يساعد المستخدمين على الوصول إلى بذور 3K - RG بسهولة أكبر لأعمال التنميط الظاهري الخاصة بهم. والآخر هو "المساهمة ببياناتك في RFGB" (http://www.rmbreeding.cn/Phenotype/contribute_phenotype) الذي يساعد المستخدمين على تحميل بيانات النمط الظاهري الخاصة بهم إلى RFGB. فيما يتعلق بالملكية الفكرية، في الوقت الحاضر، البيانات المنشورة فقط مفتوحة بالكامل للتنزيل. تم دعم هذا العمل من قبل فرع فرعي من المشروع الخاص الرئيسي لتربية التصميم الجزيئي للأرز (2016YFD0101801، 2016YFD0100904)، والمؤسسة الوطنية للعلوم الطبيعية في الصين (31871715)، ومختبر غوانغشي الرئيسي لعلم وراثة الأرز وتربيته (2018-05 - Z06 - KF01)، ومهمة التعاون والابتكار (CAAS - XTCX2016009، CAAS - ZDXT2018001) وبرنامج الابتكار في العلوم والتكنولوجيا الزراعية، وخطة الطاووس شنتشن (20130415095710361)، ومشروع "الأرز الأخضر الفائق" من مؤسسة بيل وميليندا غيتس (OPP1130530)، وصناديق البحوث الأساسية للجامعات المركزية (Y201900029) ومركز جيانغسو للابتكار التعاوني لإنتاج المحاصيل الحديثة. يعلن المؤلفون أنه ليس لديهم مصالح متنافسة. إنهم يقدرون بشدة المحررين واثنين من المراجعين المجهولين لتعليقاتهم القيمة على تحسين المخطوطات. صممت ZKL و JYL و JLX و TQZ الدراسة وصياغة المخطوطة. ساهمت CCW و HY في الترميز. ساهم JH في مشاركة البيانات التجريبية. ساهم أسبوع المرأة العالمي في مشاركة بيانات البذور والنمط الظاهري. ساهمت MF و ZF و XQZ و BYF و KC و HLZ و KLM و NA و XYG في حالات المستخدمين. ساهمت SST و CW في الكتابة والمراجعة. - ISSN: 1467-7652
1467-7644 - Accession Number: 10.1111/pbi.13215
- Accession Number: 10.60692/z2g0h-x3637
- Accession Number: 10.60692/th14n-0we36
- Rights: CC BY
URL: http://creativecommons.org/licenses/by/4.0/This is an open access article under the terms of the http://creativecommons.org/licenses/by/4.0/ (http://creativecommons.org/licenses/by/4.0/) License, which permits use, distribution and reproduction in any medium, provided the original work is properly cited. - Accession Number: edsair.doi.dedup.....f1e2c474dd330997e27c8c54cd498a70
- Publication Information:

Copyright © Department of Culture and Tourism, all rights reserved.
Copyright © 2024 Department of Culture and Tourism, all rights reserved. Powered By EBSCO Stacks 3.3.0 [353] | Staff Login
No Comments.