banner
Centro de Noticias
Elegante y moderno

Interrogando la materia oscura viral del ecosistema ruminal con una base de datos global de viromas

Jun 18, 2023

Nature Communications volumen 14, número de artículo: 5254 (2023) Citar este artículo

331 Accesos

8 altmétrico

Detalles de métricas

Los diversos viromas del rumen pueden modular el microbioma del rumen, pero siguen estando en gran medida inexplorados. Aquí, extraemos 975 metagenomas ruminales publicados en busca de secuencias virales, creamos una base de datos global de viromas ruminales (RVD) y analizamos el viroma ruminal en busca de diversidad, vínculos virus-huésped y posibles roles que afectan las funciones ruminales. RVD, que contiene 397.180 unidades taxonómicas operativas virales (vOTU) a nivel de especie, aumenta sustancialmente la tasa de detección de virus del rumen a partir de metagenomas en comparación con IMG/VR V3. La mayoría de las vOTU clasificadas pertenecen a Caudovirales, a diferencia de las que se encuentran en el intestino humano. Se predice que el viroma del rumen infectará el microbioma central del rumen, incluidos los degradadores de fibra y los metanógenos, porta diversos genes metabólicos auxiliares y, por lo tanto, es probable que afecte el ecosistema del rumen tanto de arriba hacia abajo como de abajo hacia arriba. RVD y los hallazgos proporcionan recursos útiles y un marco de referencia para futuras investigaciones destinadas a investigar cómo los virus pueden afectar el ecosistema del rumen y la fisiología digestiva.

Una avalancha de estudios metagenómicos recientes centrados en virus ha generado catálogos y bases de datos de genomas virales muy grandes para varios ecosistemas, incluidos los virus oceánicos1,2, el intestino humano3,4,5 y el suelo6. Revelaron viromas muy diversos, identificaron numerosos genes metabólicos auxiliares y arrojaron nueva luz sobre el impacto ecológico de los virus. Además, los estudios modelo centrados en sistemas han comenzado a revelar cómo los virus pueden reprogramar el metabolismo de sus huéspedes procarióticos formando virocélulas distintas que alteran la aptitud ecológica y el metabolismo de los huéspedes7. La evidencia emergente respalda los impactos potenciales de los virus en la biogeoquímica de los océanos1,8, la fisiología humana4 y los estados patológicos9. No se encuentran disponibles estudios similares sobre el viroma ruminal o la base de datos de viromas específicos del rumen.

El rumen alberga un ecosistema diverso de múltiples reinos que contiene bacterias, arqueas, hongos, protozoos y virus. En conjunto, el microbioma del rumen digiere y fermenta alimentos que de otro modo no serían digeribles y proporciona la mayor parte de la energía (en forma de ácidos grasos volátiles) y el nitrógeno metabolizable (en forma de proteína microbiana) que necesitan los rumiantes para crecer y producir carne y leche. Se han documentado fuertes asociaciones de bacterias, arqueas y protozoos del rumen con la eficiencia alimenticia, las emisiones de metano (CH4) y la salud animal10, pero los virus del rumen, a pesar de ser abundantes, siguen siendo poco conocidos, a pesar de que los estudios centrados en virus contribuyen a la caracterización del rumen. viroma11,12. Los primeros estudios que utilizaron microscopía electrónica documentaron bacteriófagos morfológicamente diversos y revelaron el predominio de fagos con cola13,14. Los primeros estudios dependientes del cultivo encontraron bacteriófagos que podrían infectar una amplia gama de especies o cepas de bacterias del rumen, incluidas las especies predominantes de Prevotella, Ruminococcus y Streptococcus, y clasificaron la mayoría de estos fagos según su morfología en las familias Myoviridae, Siphoviridae, Podoviridae. , e Inoviridae (revisado por Gilbert y Klieve15). Aunque estos estudios proporcionaron información valiosa sobre los virus del rumen, las morfologías simples de los fagos no permiten una clasificación taxonómica confiable y, por lo tanto, el Comité Internacional sobre Taxonomía de Virus (ICTV: https://ictv.global/taxonomy) ya no reconoce la morfología. Clasificación de virus basada en

La genómica, la metagenómica y la metatranscriptómica se han convertido en las principales tecnologías para estudiar los viromas, incluido el viroma del rumen. La reciente secuenciación del genoma completo dependiente del cultivo identificó 10 fagos que infectan a Prevotella ruminicola, Ruminococcus albus, Streptococcus bovis y Butyrivibrio fibrisolvens16,17, que desempeñan funciones importantes en la digestión y fermentación del alimento. Estos genomas de fagos muestran una organización genómica modular, genes virales conservados y el potencial de ser tanto líticos como lisogénicos17. Los virus del rumen también se han estudiado utilizando metagenomas de partículas similares a virus (VLP) (revisado en 11). Sin embargo, las bases de datos de genoma de referencia que se han utilizado no representan los virus del rumen, lo que limita la identificación y clasificación de los virus del rumen y la predicción de su huésped. Por ejemplo, se han encontrado virus del rumen con diversos genotipos, pero la mayoría de ellos no han sido clasificados por falta de coincidencias con las secuencias virales de referencia18,19,20. Miller et al.18 encontraron elementos de repetición palindrómica corta (CRISPR)/proteína asociada a CRISPR (Cas) agrupados regularmente interespaciados en algunos genomas y metagenomas microbianos del rumen, pero encontraron pocas secuencias espaciadoras que coincidieran con las secuencias virales del rumen para la predicción del huésped. Por lo tanto, ha sido difícil caracterizar el viroma ruminal, especialmente en lo que respecta a virus nuevos.

Las herramientas bioinformáticas recientes específicas para el análisis viral (p. ej., CheckV21, VirSorter222 y VIBRANT23) y los crecientes recursos genómicos (p. ej., efam24) facilitan en gran medida la identificación viral a partir de secuencias metagenómicas, y las estrategias organizativas del espacio de secuencia proporcionan clasificación viral escalable25 y taxonomía26. Estas herramientas permitieron el desarrollo de grandes bases de datos de viromas específicas de nichos1,5 y estudios integrales de viromas globales27. Utilizando la secuenciación metagenómica y las herramientas bioinformáticas mencionadas anteriormente, dos estudios recientes identificaron diversos virus del rumen y exploraron sus implicaciones nutricionales28,29. Estos dos estudios, con tamaños de muestra pequeños (5 novillos de carne29 o un alce28), identificaron aproximadamente 2000 poblaciones virales (contigs únicos) de un viroma ruminal diverso y su importancia potencial para el ecosistema ruminal. No es sorprendente que, dada la naturaleza incipiente del campo, la capacidad de predecir los huéspedes de esas poblaciones virales fuera baja (los huéspedes se predijeron solo para 3 poblaciones virales en el nivel de filo29 y 113 poblaciones virales en el nivel MAG28). Motivados por estudios integrales del viroma3,4,5 y aprovechando los numerosos conjuntos de datos metagenómicos del rumen disponibles públicamente, nuestro objetivo fue analizar el viroma del rumen global mediante el análisis de 20 TB de datos de secuencia de casi 1000 conjuntos de datos metagenómicos de diversos rumiantes, tanto domesticados como salvajes, en 5 continentes. Desarrollamos una base de datos de viroma ruminal (RVD) catalogada sistemáticamente que contiene casi 400 000 unidades taxonómicas operativas virales (vOTU) a nivel de especie, exploramos el viroma ruminal central, predijimos bacterias, arqueas y protozoos que los virus identificados probablemente infectarán e inferimos las posibles funciones ecológicas de los virus del rumen a partir de genes metabólicos auxiliares (AMG) y genes de resistencia a los antimicrobianos (ARG) transportados por los genomas virales del rumen. También probamos RVD para determinar si podría mejorar la identificación de virus a partir de secuencias metagenómicas. Al ampliar la diversidad de virus del rumen registrados en NCBI RefSeq Viral (más de 12 veces) e IMG/VR V3 y mejorar la identificación de secuencias virales basadas en la metagenómica del rumen, RVD será útil como un nuevo recurso comunitario y proporcionará nuevos conocimientos. para futuros estudios sobre el viroma ruminal y su implicación en la digestión del alimento, la síntesis de proteínas microbianas, la eficiencia del alimento y las emisiones de CH4.

Utilizando herramientas bioinformáticas de última generación (Figura 1 complementaria), caracterizamos el viroma ruminal global analizando 20 TB de secuencias derivadas de 975 metagenomas ruminales (Datos complementarios 1) que se tomaron muestras de 13 especies de rumiantes o diferentes regímenes de cría. en 8 países en 5 continentes (Fig. 1a, b). Siguiendo las recomendaciones de un reciente artículo de evaluación comparativa de virómica30 y criterios estrictos, identificamos 705,380 supuestos contigs virales de >5 kb cada uno y los agrupamos en 411,125 vOTU. Después de la validación con VIBRANT23, construimos una base de datos de viroma ruminal (RVD, descarga disponible en https://zenodo.org/record/7412085#.ZDsE2XbMK5c) que representa 397,180 vOTU (Figura 1 complementaria), con 193,327 vOTU de >10 kb. La verificación con CheckV21 reveló 4400 vOTU completas, 4396 vOTU de alta calidad y 32,942 vOTU de calidad media. La integridad y la calidad de las vOTU de RVD probablemente se subestimaron porque CheckV depende de la base de datos y las bases de datos utilizadas se derivan principalmente de otros ecosistemas. Todas las vOTU en RVD cumplen con los estándares del genoma de virus no cultivado (MIUViG)25.

a Un mapa de calor global que muestra la distribución geográfica de los 975 metagenomas del rumen. b Número de metagenomas ruminales de diferentes especies de rumiantes o crías de producción.

Pudimos clasificar 1.857 vOTU (0,47% del total) como pertenecientes a géneros existentes y 32.934 vOTU (8,3%) a familias existentes (Datos complementarios 2). La mayoría de las vOTU asignables por género y familia (98,4%) se asignaron a Siphoviridae, Myoviridae o Podoviridae en el orden Caudovirales (Fig. 2a, b), que también son las familias más abundantes en el viroma intestinal humano5. En comparación con un árbol filogenético (Fig. 2c), los viromas humanos y ruminales compartieron solo el 14% de los taxones a nivel de género de Caudovirales (Fig. 2d), lo que refleja la divergencia entre los dos tipos de viromas. Las vOTU restantes (91,7% del total) no pudieron asignarse a ningún género o familia existente y, por lo tanto, representan nuevos linajes. Además, se identificaron 121 vOTU (0,03%) como virus similares a crAss. RVD también contiene virus protozoarios (o elementos virales endógenos, EVE), algunos de los cuales fueron asignados a Phycodnaviridae, Mimiviridae y Retroviridae. Se predijo que algunos de los virus del rumen infectarían arqueas del rumen (por lo tanto, arqueófagos). Aunque los metagenomas consistían principalmente en dsDNA, también identificamos 109 vOTU como virus ssDNA. Todos fueron asignados a la familia Microviridae. El análisis de rarefacción (Fig. 2e) reveló que aún quedan por identificar más virus del rumen.

a Taxonomía a nivel familiar y proporción de virus del rumen en la base de datos de viromas del rumen RVD). La mayoría de las vOTU (99,7%) clasificadas en géneros o familias existentes estaban bajo el orden de Caudovirales, incluidos 121 fagos similares a crAss identificados. Las asignaciones taxonómicas detalladas de vOTU individuales se presentan en los Datos complementarios 2. b Taxonomía a nivel de género y proporción de las 1.858 vOTU que podrían asignarse a géneros o familias existentes utilizando vConTACT2. c Un árbol filogenético de virus Caudovirales construido con 77 genes marcadores concatenados identificados en 10,203 vOTU con una compleción >50% del estudio actual y las dos bases de datos de viroma intestinal humano más grandes (MGV4 y GPD5). Para una mejor visualización, solo se incluyó una vOTU representativa (la más larga y completa) para cada vOTU a nivel de género (714 en total). Las ramas estaban codificadas por colores: verde, los linajes Caudovirales que se encuentran exclusivamente en el viroma humano; rojo, los linajes encontrados exclusivamente en el viroma ruminal del presente estudio; azul, los linajes que se encuentran tanto en el rumen como en los viromas humanos. Las tasas de lisogenia (proporción) se calcularon con VIBRANT y se muestran como el anillo interior. El número de vOTU que representan cada linaje se mostró como un diagrama de barras (rojo para virus humanos y negro para virus humanos). d Proporción de linajes de virus Caudovirales exclusivos del intestino humano, el rumen y compartidos. e Una curva de rarefacción de las vOTU identificadas en el viroma ruminal. La tendencia ascendente de la curva de rarefacción indica que quedan más virus del rumen por identificar a nivel de especie.

Probamos la utilidad de RVD en el análisis del viroma ruminal con cinco conjuntos de secuencias metagenómicas. Primero, comparamos RVD con las bases de datos IMG/VR V3 y NCBI RefSeq Viral utilizando dos conjuntos independientes recientes de metagenomas ruminales que no estaban incluidos en ninguna de las tres bases de datos. Se identificaron sustancialmente más secuencias virales en RVD que en IMG/VR V3 (Figura complementaria 2a), y ninguna de las secuencias metagenómicas pudo mapearse en NCBI RefSeq Viral. Luego, probamos la estimación de la abundancia viral en RVD. No encontramos diferencias significativas entre las cinco especies de rumiantes (Figura complementaria 2b), pero se encontró una abundancia viral significativamente mayor en los metagenomas del rumen de cabras y vacas lecheras que padecían acidosis ruminal subaguda (SARA, un trastorno metabólico común en rumiantes alimentados con almidón). -dietas ricas) (Figuras complementarias 2c, d). Utilizando RVD, también volvimos a analizar secuencias metagenómicas recientes derivadas de 5 novillos de carne29 y un alce28. A partir de los metagenomas del rumen de novillo, identificamos 706 vOTU, incluidos 4 arqueófagos y logramos una clasificación taxonómica a nivel de género, mientras que los autores29 solo pudieron asignar sus contigs de vial a familias virales y no pudieron identificar ningún arqueófago. Predijimos los huéspedes hasta el nivel de especie para 113 de las vOTU, mientras que los autores solo pudieron predecir los huéspedes a nivel de filo para 3 de sus contigs viales. De manera similar, utilizando RVD, identificamos 789 vOTU del metagenoma de los alces28 y pudimos predecir huéspedes hasta el nivel de especie para 126 de los vOTU, mientras que en el artículo original, los huéspedes se predijeron solo a nivel de filo para 113 de los contigs virales. . Estos resultados indican que RVD puede mejorar significativamente la detección, identificación y asignaciones taxonómicas de virus del rumen a partir de secuencias metagenómicas y puede predecir mejor los vínculos entre virus y huéspedes.

Desarrollamos RVD con secuencias de metagenomas en masa, aunque algunos estudios han utilizado secuencias derivadas de metagenomas enriquecidos con VLP. Por lo tanto, evaluamos RVD para el análisis de viromas ruminales en metagenomas a granel frente a metagenomas enriquecidos con VLP. Utilizando los dos tipos de metagenomas ruminales derivados de los mismos 5 novillos29, encontramos que, como se esperaba, los metagenomas enriquecidos con VLP contenían una mayor proporción de secuencias virales (Figura complementaria 3a), pero los dos tipos de metagenomas ruminales mostraron porcentajes comparables de virus líticos (Figura complementaria 3b). Sin embargo, los metagenomas masivos presentaron un mayor porcentaje de vOTU que estaban representadas en RVD (Figura complementaria 3c). Por lo tanto, se necesitan metagenomas enriquecidos con VLP para expandir RVD con virus que normalmente están subrepresentados en metagenomas masivos.

La predicción del huésped es importante para comprender las funciones potenciales de los virus en un ecosistema. Al predecir los probables huéspedes de los virus del rumen identificados, identificamos 2.403 arqueófagos y 40.881 bacteriófagos. Se predijo que los arqueófagos infectarían 25 géneros de arqueas, y los bacteriófagos podrían infectar 1051 géneros de bacterias, incluidos géneros con especies bien caracterizadas como Methanobrevibacter (p. ej., M. ruminantium, M. millerae), Fibrobacter (p. ej., F. succinogenes ), Prevotella (p. ej., P. bryantii, B. ruminicola, P. multiformis), Ruminococcus (p. ej., R. albus, R. callidus, R. flavefaciens) y Streptococcus (p. ej., S. equinus) (Datos complementarios 3) . Sorprendentemente, se predijo que una alta proporción de bacteriófagos (9214, o 22,5%) y arqueófagos (396, o 16,5%) infectarían múltiples especies huésped. Además, el 3,8% (1544) de estos fagos ruminales de amplio rango de huéspedes pueden infectar especies de múltiples filos bacterianos (Fig. 3a). En comparación, sólo el 0,13 % de los fagos intestinales humanos tienen una amplia gama de huéspedes3. La variedad de fagos del rumen entre hospederos sugiere su potencial para mediar el intercambio genético a través de los límites de los filos, lo que puede facilitar la adaptación y la evolución microbiana3,31. Treinta y ocho de los 52 genomas amplificados unicelulares (SAG) de ciliados del rumen, que representaban 19 especies de ciliados en 13 géneros, habían predicho EVE.

a Un árbol filogenético basado en el genoma de 1051 géneros bacterianos que contenían los huéspedes previstos de 40 881 vOTU. Los huéspedes se infirieron (i) alineando las secuencias de las vOTU representativas (las más largas con la mayor integridad) de cada vOTU con 22 087 genomas ensamblados en metagenomas (MAG) de bacterias del rumen y 242 387 genomas bacterianos de referencia de NCBI RefSeq y (ii) alinear las secuencias espaciadoras CRISPR de las vOTU representativas y las de los genomas procarióticos y MAG. Los genomas procarióticos y MAG se clasificaron utilizando GTDB-Tk. El árbol filogenético se construyó con los genomas o MAG de los huéspedes inferidos (agrupados en géneros) y sus fagos predichos para examinar la tasa de lisogenia (%), el número de fagos por género de huésped y el número de fagos por genoma/MAG del huésped. . En total, es probable que 4394 vOTU tengan un rango de huéspedes en múltiples géneros. Estos géneros están conectados con arcos naranjas. Los anillos corresponden a tasas de lisogenia (anillo 1, calculado en base a resultados VIBRANT), número de fagos por género de huéspedes (anillo 2), número de fagos por genoma/MAG del huésped (anillo 3) y filos bacterianos a los que pertenece el huésped bacteriano. pertenecen los géneros (anillo 4). b, c Red de intercambio de genes de vOTU con el huésped predicho obtenido de vConTACT2 y visualizado usando Cytoscape, con los genomas virales coloreados según la asignación familiar (b) y los huéspedes predichos coloreados según los filos (c). Véanse también las figuras complementarias. 1 y 2 para la asignación de host de arqueas y protozoos y Datos complementarios 3 para las asignaciones de host detalladas de vOTU individuales.

Calculamos la tasa lisogénica (% del total), el número promedio de fagos por género huésped y el número promedio de fagos por genoma huésped individual para bacteriófagos (Fig. 3a) y arqueófagos (Fig. 4 complementaria). El número de fagos por genoma del huésped varió, y la mayoría de los huéspedes que pertenecen a Proteobacteria mostraron <0,1 fagos por genoma del huésped, mientras que la mayoría de los huéspedes de Firmicutes_A tienen> 1 fago por genoma del huésped. El porcentaje de virus lisogénicos varió entre los géneros de huéspedes y fue bajo para la mayoría de los géneros de huéspedes (Fig. 3c). La mayoría de los SAG ciliados presentaron múltiples EVE, entre los cuales los cinco SAG de Isotricha sp. YL-2021b y Dasytricha ruminantium presentaron el mayor número (>50) de EVE por SAG (Figura complementaria 5). Se sabe poco sobre los virus que infectan a los ciliados y no se han informado EVE ni siquiera para especies de ciliados modelo (p. ej., Tetrahymena thermophila). Sin embargo, recientemente se han encontrado EVE en Entamoeba y Giardia en metagenomas de heces humanas32. Por lo tanto, los ciliados del rumen probablemente portan EVE. La gran cantidad de EVE por SAG ciliado puede corresponder a la alta poliploidía y a la enorme cantidad de cromosomas encontrados en muchos ciliados del rumen (p. ej., >10,000 en Entodinium caudatum33).

El análisis de similitud de secuencia reveló que los fagos homólogos generalmente infectan MAG homólogos del intestino humano31. Sin embargo, dicho análisis no puede clasificar virus con modos y ritmos evolutivos variables26. Para predecir mejor los vínculos entre el virus y el huésped y los flujos de genes dentro de estas relaciones, generamos una red de intercambio de genes de todos los fagos con una coincidencia de huésped y visualizamos la red en función de su taxonomía (Fig. 3b) y sus filos de huésped (Fig. 3c). ). Las 43.284 vOTU con una coincidencia de huésped formaron 2.764 grupos a nivel de género, pero solo 218 de los grupos incluían uno o más genomas virales de la base de datos NCBI RefSeq Viral. Por lo tanto, RVD mejoró enormemente el análisis de vinculación virus-huésped a nivel de género en comparación con NCBI RefSeq Viral (más de 12 veces). Según la red de intercambio de genes, la mayoría de las vOTU ruminales se agruparon en cuatro grupos (Fig. 3b). Los grupos I (el más grande) y IV (el más pequeño) contenían más vOTU clasificadas que los grupos II y III. Los grupos I y IV tenían una gama de huéspedes más amplia entre los filos bacterianos, incluidas bacterias grampositivas y gramnegativas con diferentes nichos y capacidades, pero pocos de sus géneros o familias predominaban en el rumen. Los grupos II y III infectaron principalmente Bacteroidota y Methanobacteriota, respectivamente (Fig. 3c), y la mayoría de los virus de estos dos grupos no pudieron clasificarse con ninguna de las bases de datos de viromas actuales; por tanto, representan nuevos linajes virales. La estrecha gama de huéspedes (un único filo) de los grupos II y III respalda la idea de que los fagos con un alto grado de intercambio de genes generalmente infectan a huéspedes filogenéticamente relacionados.

Al buscar solo los contigs virales completos (vMAG, 5912 en total), encontramos 286 vMAG que portan más de un AMG (consulte los Datos complementarios 4 para obtener anotaciones detalladas y resultados de curación). Estos AMG representaban 41 categorías distintas, incluidas 36 identificadas en estudios anteriores y 5 que no habían sido identificadas en otros viromas (Fig. 4a). Las cinco nuevas categorías de AMG estaban integradas cada una por más de dos vMAG. Codifican enzimas implicadas en una amplia gama de procesos metabólicos, incluido el metabolismo de nucleótidos, carbohidratos, vitaminas y nitrógeno.

a Un gráfico de barras que muestra las categorías de AMG y su aparición (log10) identificadas en el viroma del rumen. Solo se mostraron las AMG que también se habían identificado en estudios anteriores y las AMG que se identifican en más de dos vMAG del estudio actual (resaltadas en rojo). Los AMG se predijeron a partir de vMAG (286 en total) que pasaron una serie de procesos de curación. Consulte los Datos complementarios 4 para conocer el proceso detallado de selección de AMG, la anotación completa de los vMAG finales que llevan AMG y la anotación de categoría funcional de AMG. b La organización genómica de dos contigs virales que portan una celulasa (GH5 o GH9) flanqueada por dos genes virales en ambos lados. c Una placa de agar carboximetilcelulosa que muestra colonias de E. coli que portan GH5, GH9 virales clonados o el vector de clonación sin ningún gen exógeno. Los halos amarillos indican digestión de CMC después de teñir con rojo Congo. d Tasa de liberación de azúcar de cultivos en caldo de E. coli que contienen carboximetilcelulosa después de la incubación a 37 °C durante 24 y 48 h (n = 4). Las barras de error indican el error estándar. El centro de la barra de error representa el promedio de las réplicas. e Un modelo conceptual que ilustra cómo los AMG podrían permitir que los virus del rumen modulen cierto metabolismo del huésped.

En particular, el AMG más prevalente codifica DNMT1, una ADN (citosina-5)-metiltransferasa que protege a los virus de los sistemas antivirales de modificación de restricción de sus huéspedes34,35, que se encontró en más de 100 de los vMAG. Esto concuerda con la alta prevalencia de este tipo de AMG encontrada en el viroma oceánico36. Un AMG de este tipo probablemente representa un mecanismo de contradefensa de los virus del rumen. Además de aumentar directamente el metabolismo de los nucleótidos del huésped para beneficiar la replicación viral, algunos virus usan AMG para facilitar la adquisición de nutrientes por parte de su huésped para mejorar indirectamente la supervivencia viral. Curiosamente, los cinco nuevos AMG encontrados en el viroma del rumen estaban relacionados con la adquisición y biosíntesis de nutrientes. En particular, varios AMG encontrados en los vMAG codifican glucósidos hidrolasas (GH), incluidas GH16 y G114, que son enzimas importantes involucradas en la digestión de la fibra alimentaria, y la asparagina sintasa (Fig. 4a), que media la asimilación de amoníaco en asparagina. Además, encontramos AMG relacionados con la vitamina B12 (es decir, el gen CobS de la cobaltoquelatasa) y la síntesis de aminoácidos aromáticos (es decir, el gen de la corismato mutasa). No encontramos AMG que codifiquen celulasas entre los vMAG, pero se encontraron dos AMG que codifican celulasas entre los contigs virales incompletos: un GH5 y un GH9, cada uno de los cuales estaba flanqueado por genes virales en ambos lados (Fig. 4b). Este GH9 compartía un 79,5% de identidad de aminoácidos con un GH9 de un MAG ruminal (GenBank: MBR3901505.1, clasificado como Ruminococcus no cultivado), mientras que el GH5 era un 45,9% idéntico a un GH5 en otro MAG ruminal (GenBank: MBR3315497.1, clasificado como Atopobiaceae no cultivadas). La clonación y expresión de ambas AMG en E. coli mostró que codifican celulasas funcionales que hidrolizan la carboximetilcelulosa (Fig. 4c, d). Al proporcionar AMG diversos y únicos, los virus del rumen pueden aumentar la adquisición de nutrientes por parte de sus huéspedes o reprogramar importantes vías metabólicas del huésped.

Entre los 705,380 contigs virales totales, se encontró que 24 portaban ARG, incluidos varios contigs virales que portaban ARG flanqueados por al menos dos genes estructurales virales (Fig. 5b y Datos complementarios 5). La escasez de ARG virales corrobora la escasez de ARG entre los genomas de fagos37. Sin embargo, encontramos varias clases principales de ARG, incluidas tet (W) y tet (O) (Fig. 5a y Fig. complementaria 6), las cuales son prevalentes y altamente expresadas en los microbiomas del rumen38,39,40. Se demostró que tres contigs virales portadores de ARG recuperados de tres animales del mismo rebaño portaban los mismos ARG (van (G) y van (WG)) y presentaban arquitecturas genómicas casi idénticas (Fig. 5b), lo que apunta al potencial del rumen. Los virus como vía de transmisión de ARG entre animales. Sin embargo, dado el número limitado de fagos que codifican ARG identificados, la falta de datos sobre el uso de antibióticos en las granjas y la posibilidad de que los ARG identificados puedan estar presentes en el ecosistema del rumen incluso si no se usan los antibióticos respectivos, se necesitan estudios ecológicos futuros. Es necesario explorar más a fondo el papel potencial de los virus como reservorio de ARG.

a El número de virus portadores de ARG y sus clases de ARG identificados en los contigs de viales seleccionados (24 de 705 380). b La organización genómica de tres contigs virales portadores de ARG representativos. Estos tres contigs virales compartían los mismos dos genes van con secuencias muy similares y tenían una organización genómica casi idéntica, pero se encontraron en tres muestras metagenómicas diferentes. Las líneas grises que conectan los genes entre contigs indican la identidad de blastn. El contig en la parte inferior representa el contig viral con ARG flanqueado por genes distintivos virales. Los contigs virales representativos que portan otros genes ARG se eligieron según la puntuación de integridad de CheckV y el número de genes celulares, y sus organizaciones genómicas se muestran en la figura complementaria 6. Se pueden encontrar las curaciones manuales de cada contigs que portan ARG y su anotación detallada. en Datos complementarios 5.

Comparamos la prevalencia de las vOTU individuales que se derivaron de los metagenomas del rumen de 283 bovinos alimentados con tres niveles (bajo, medio y alto) de concentrado dietético para determinar si se podía encontrar un viroma ruminal central. Un viroma ruminal central se definió como vOTU encontradas en al menos el 50 % de los animales alimentados con cada nivel de concentrado dietético. Descubrimos que la mayoría de las vOTU se encontraron en un solo animal o en varios animales alimentados con el mismo nivel de concentrado (Fig. 6a), lo que indica viromas ruminales altamente individualizados entre este ganado. La alta variación entre animales fue consistente con resultados anteriores19. Se encontró un viroma ruminal central (aproximadamente el 1% de todas las vOTU) para cada nivel de concentrado. Se encontró que solo 14 vOTU, o el 1,4% de las vOTU principales asociadas con los niveles de concentrado individuales, eran vOTU principales en los tres niveles de concentrado (Fig. 6b). En otro conjunto de datos metagenómicos del rumen de animales de la misma especie alimentados con dietas con diferentes niveles de concentrado y un conjunto de datos metagenómicos del rumen de diferentes razas de animales, también encontramos menos vOTU compartidas entre animales con diferentes niveles de concentrado o entre razas en comparación con aquellos dentro de el mismo nivel de concentrado o dentro de la misma raza, respectivamente (Fig. 6c, d). Se predijo que el viroma central del rumen infectaría principalmente a especies de bacterias del núcleo ruminal, especialmente especies de Prevotella (Datos complementarios 6). Por lo tanto, el viroma central del rumen estaba vinculado al microbioma central del rumen. Identificamos 121 vOTU similares a crAss (Datos complementarios 2), pero a diferencia de lo que se encontró en el viroma intestinal humano, ninguna de ellas estaba incluida en el viroma central del rumen. Los pequeños viromas centrales del rumen reflejaban el viroma del rumen altamente individualizado, lo que era consistente con los primeros estudios del viroma del rumen a pesar de que utilizaron diferentes tipos de análisis (electroforesis en gel de campo pulsado41 o secuenciación de metagenomas enriquecidos con VLP29).

a Número de vOTU identificadas entre 283 bovinos alimentados con uno de tres niveles diferentes de concentrado dietético: bajo (por debajo del 30 %, n = 84), medio (30–50 %, n = 80) y alto (por encima del 50 %, n = 119) (gráfico de barras), y el número de vOTU observados en un solo animal (individualizado), más de un animal en uno, dos o tres niveles de concentrado (gráfico circular). b Un diagrama de Venn que muestra el número de vOTU compartidas por más del 50 % de los animales alimentados con una dieta con concentrado bajo (púrpura), medio (amarillo) o alto (verde). c El número de vOTU compartidas entre animales alimentados con los mismos (n = 445) o diferentes (n = 416) niveles de concentrado (datos de la referencia 80). d El número de vOTU compartidas entre animales de diferentes (n = 768) razas o de la misma (n = 360) raza (datos de la ref. 79). El manejo de la alimentación es el mismo para todas las muestras. Los diagramas de caja indican la mediana (línea media), los percentiles 25 y 75 (caja) y los percentiles 5 y 95 (bigotes), así como observaciones individuales (puntos). La significancia estadística se probó utilizando la prueba de rangos con signos de Wilcoxon no paramétrica bilateral. Los valores de p inferiores a 0,001 se indicaron como "***". En los Datos complementarios 6 se muestra información detallada sobre la vOTU principal (taxonomía a nivel familiar y hosts previstos).

Además, examinamos si la diversidad alfa o beta viral difería entre especies animales, ubicaciones geográficas o estudios (proyectos de investigación), y observamos diferencias significativas entre todas estas categorías (Figura complementaria 7). El análisis de varianza multivariado permutacional (PERMANOVA) mostró que los estudios explicaban una proporción mucho mayor de la varianza que las especies animales o las ubicaciones geográficas. Por lo tanto, las diferencias entre especies animales y ubicaciones geográficas deben interpretarse con cautela porque las diferencias podrían verse confundidas por variaciones en las dietas y regímenes alimentarios entre los estudios. Además, examinamos qué podría haber impulsado el "efecto de estudio" a través de la agrupación jerárquica de los estudios basados ​​en vOTU compartidas. Los estudios se agruparon jerárquicamente en cinco grupos, pero ninguno de los grupos correspondía a una especie animal, geografía, método de recolección de muestras de rumen o régimen de cría (Figura complementaria 8). Por lo tanto, las variaciones observadas en los viromas del rumen probablemente podrían atribuirse a los múltiples factores mencionados anteriormente, especialmente las dietas, que tienen efectos profundos en el microbioma del rumen.

La gran diversidad y el posible impacto ecológico de los virus en el medio ambiente1,42 y el intestino humano3,4 están cada vez mejor documentados y reconocidos. Aunque también se cree que los virus en el microbioma del rumen son diversos y pueden afectar el microbioma del rumen y las principales funciones del rumen (p. ej., digestión del alimento, fermentación, síntesis de proteínas microbianas, emisiones de metano), están mucho menos caracterizados y comprendidos10,11 . Al extraer la mayoría de los metagenomas ruminales publicados (casi 1000), recuperamos casi 400 000 vOTU y creamos una base de datos global de viromas ruminales, RVD. Esta base de datos amplía enormemente los catálogos actuales de virus del rumen y arroja nueva luz sobre su diversidad y sus posibles impactos en las principales especies de rumiantes y regímenes de cría de animales. La mayoría de los virus del rumen detectados representan nuevos linajes virales, ya que ~91% no pudo clasificarse en ninguna especie, género o familia viral existente, lo que coincide con estudios virales previos en novillos de carne29 y alces28.

Como base de datos específica del ecosistema del rumen, RVD facilita y mejora en gran medida la detección, identificación y asignaciones taxonómicas de virus del rumen a partir de secuencias metagenómicas y predice mejor los vínculos entre virus y huéspedes. Será un recurso útil en futuros estudios del viroma ruminal. Sin embargo, RVD está lejos de ser completo, ya que todavía carece de algunos de los virus del rumen o está insuficientemente representado, como lo demuestra el análisis de rarefacción. En particular, faltan varios tipos de virus. En primer lugar, se deben agregar virus con genomas más pequeños (<5 kb), incluidos los virus ssDNA. Dado que los virus de ADNss están enriquecidos en metagenomas de VLP debido a la filtración de tamaño y la amplificación de ADN5, la metagenómica viral combinada con un límite de tamaño de genoma viral más pequeño ayudará a capturar virus del rumen con un tamaño de genoma y un genoma de ADNss pequeños en estudios futuros. En segundo lugar, los virus de ARN tienen genomas de ARN, por lo que, a menos que sean elementos virales endógenos, rara vez se detectan mediante metagenómica o metagenómica viral. Como se demostró en los océanos8,42 y los suelos43, los virus de ARN probablemente también sean diversos e importantes en el ecosistema del rumen. De hecho, el único estudio de virus ARN ruminal que utilizó metatranscriptómica obtuvo 2466 contigs virales de ARN únicos, que fueron asignados a nueve familias virales44. El análisis exhaustivo de los metatranscriptomas del rumen, tanto publicados como futuros, permitirá la identificación de virus de ARN del rumen. En tercer lugar, debido a que solo se encuentran disponibles unos pocos genomas de hongos del rumen, no analizamos los micovirus en el RVD con respecto a la identificación y predicción del huésped. A medida que en el futuro haya más genomas de hongos ruminales disponibles, se podrán identificar los micovirus presentes en el RVD y se podrán predecir sus probables huéspedes. Aunque es necesario mejorar la base de datos, RVD es un recurso útil para analizar viromas ruminales en metagenomas masivos y metagenomas enriquecidos con VLP, incluidos conjuntos de datos nuevos y publicados anteriormente. Además, estos datos son fundamentales para contextualizar nuevas secuencias para la clasificación viral, análisis de diversidad y abundancia alfa y beta, y predicciones de vínculos entre virus y huéspedes.

Además de la detección, identificación y clasificación, es esencial predecir los huéspedes hasta el nivel de especie o género para comprender las funciones ecológicas de los virus en cualquier ecosistema, incluido el ecosistema del rumen. Logramos una predicción de hospedadores para muchos arqueófagos (>2400) y bacteriófagos (>40,000) hasta el nivel de especie, y se sabe que muchas de las especies hospedadoras desempeñan papeles importantes en la digestión del alimento, la fermentación y las emisiones de metano. Los avances en la predicción de los huéspedes y los vínculos entre virus y huéspedes ayudarán a comprender las funciones ecológicas de los virus del rumen. Esta información será especialmente útil cuando se investigue tanto el metagenoma como el viroma del rumen por su asociación con las principales funciones del rumen. Entre las vOTU del rumen con una coincidencia de huésped prevista, se infirió que el 99,5 % infectaba a procariotas que se encuentran principalmente en el rumen, a pesar de que la mayoría de los genomas de procariotas de referencia que se utilizaron procedían de procariotas en otros entornos, lo que demuestra el rigor y la baja tasa de falsos positivos de nuestro canal de predicción de host.

Corroborando estudios previos sobre viromas en el intestino humano3,9,31, encontramos virus del rumen que probablemente infectan a múltiples especies, incluso especies de diferentes filos. De hecho, una combinación de ensamblaje de lectura larga y ligadura de proximidad verificó que un virus del rumen podría infectar 11 géneros bacterianos distintos40. Curiosamente, en comparación con los virus del intestino humano, más virus del rumen podrían tener un rango de huéspedes más amplio, como lo demuestra la alta proporción de vOTU del rumen que se predice que infectarán múltiples especies de huéspedes a través de límites filogenéticos, incluso límites de filo. Esta discrepancia puede deberse a que el microbioma y las condiciones fisiológicas del rumen son más diversos (debido a grandes variaciones en las especies, genética y dietas de los animales) que en el intestino humano. De hecho, los 32 filos de bacterias del rumen representados por los genomas de referencia podrían ser infectados por fagos, mientras que sólo 8 filos probablemente serían huéspedes de fagos intestinales humanos. Los fagos median la transferencia horizontal de genes a través de la transducción, tanto general como especializada, diversificando así los repertorios de genes del huésped, lo que conduce a una heterogeneidad a nivel de cepa45 y a una adaptación y evolución microbiana3. Los numerosos profagos que se predice que infectarán diversos huéspedes a través de fronteras filogenéticas apuntan a su potencial para facilitar la evolución del huésped. Sin embargo, como en otros estudios, los huéspedes de los virus del rumen se predijeron basándose únicamente en la similitud de la secuencia del ADN. Se necesita validación experimental para verificar los verdaderos huéspedes de determinados virus ruminales de interés, y el rango de huéspedes previsto en el estudio actual será útil para dichos estudios.

El ecosistema ruminal tiene un microbioma ruminal central que contiene especies de géneros predominantes de bacterias (p. ej., Prevotella y Ruminococcus), arqueas (p. ej., Methanobrevibacter) y protozoos (p. ej., Entodinium) y desempeña un papel importante en las principales funciones del rumen. Para determinar si también existe un viroma central del rumen, examinamos los perfiles del viroma en todos los microbiomas del rumen. No encontramos un viroma ruminal de “núcleo global” y en su lugar identificamos un viroma ruminal altamente individualizado. Esto probablemente ocurrió porque la gran cantidad de metagenomas del rumen que analizamos se derivaron de animales que diferían en genética y fisiología (diferentes especies y razas), dieta, manejo (salvaje versus domesticado, pastoreo versus no pastoreo) y geografía. Encontramos un pequeño viroma central del rumen entre el ganado alimentado con dietas con niveles bajos, medios o altos de grano. Aunque el “tamaño” del viroma central del rumen varía dependiendo de la homogeneidad de la dieta y probablemente también de factores específicos del animal, como la genética y la edad, el viroma central del rumen infecta el microbioma central del rumen, incluidas especies comunes que desempeñan funciones importantes en el rumen. funciones, como especies de Butyrivibrio, Fibrobacter, Prevotella, Ruminococcus y Methanobrevibacter. De hecho, algunas de las especies de estos géneros están infectadas por bacteriófagos aislados del rumen16,17. Además, los virus pueden destruir biopelículas mediante depredación y despolimerasas46 y pueden promover la formación de biopelículas al inducir espontáneamente profagos y liberar ADN extracelular como matrices extracelulares para la formación de biopelículas47. Al lisar las bacterias que degradan la fibra y afectar las biopelículas de las partículas del alimento, el viroma del rumen probablemente afecte la digestibilidad del alimento de arriba hacia abajo, como se propuso previamente para el viroma del rumen de los alces, en el que no se encontraron AMG que codifican GH28. De manera similar, al lisar sus células huésped y aumentar la cantidad de proteína microbiana disponible para la degradación por bacterias proteolíticas, los fagos del rumen probablemente contribuyan al reciclaje intraruminal de la proteína microbiana15, lo que disminuye la salida de proteína microbiana al intestino delgado y la eficiencia de utilización del nitrógeno en los rumiantes48. Por lo tanto, el viroma ruminal probablemente también afecta el suministro de proteína microbiana a los rumiantes y, por lo tanto, la eficiencia de utilización del nitrógeno de manera descendente.

La infección por fagos de las bacterias puede conducir a distintos estados de virocélulas que alteran el metabolismo, la fisiología y la ecología del huésped. Un mecanismo subyacente es el suministro de AMG a los huéspedes que participan en la adquisición de nutrientes y el metabolismo de los huéspedes. En otros ecosistemas, se ha descubierto que los AMG afectan varios procesos ecológicos importantes, incluido el reciclaje global de carbono2, el metabolismo del nitrógeno en el océano49 y el metabolismo del azufre en el medio ambiente y el intestino humano50. Las 41 categorías de AMG identificadas a partir de 286 vMAG, incluidas 5 categorías nuevas, amplían en gran medida el repertorio conocido de AMG virales del ecosistema ruminal más allá de las pequeñas cantidades de AMG reportadas previamente en novillos29 y alces28. El hecho de que la mayoría de las categorías se hayan encontrado previamente en otros ecosistemas también indica que la tasa de anotaciones AMG falsas fue baja. A diferencia de los dos estudios que informaron AMG en los viromas ruminales de novillos29 y alces28, encontramos AMG que codifican celulasas (GH5 y GH9) y demostramos que codificaban celulasas funcionales. Dada la gran cantidad de contigs virales incompletos que no fueron sometidos a la anotación AMG y el hecho de que aún quedan virus adicionales por identificar, el repertorio real de AMG virales en el rumen es probablemente órdenes de magnitud mayor que el revelado hasta ahora. Sin embargo, la identificación de AMG implicados en la defensa antiviral (p. ej., DNMT1), la digestión de polisacáridos (p. ej., GH), la asimilación de amoníaco (p. ej., asparagina sintasa) y la biosíntesis de aminoácidos y vitaminas (corismato mutasa y cobaltoquelatasa CobS) sugiere que la El viroma ruminal también puede afectar la digestibilidad del alimento y la síntesis de proteínas microbianas de manera ascendente. Se necesitan estudios futuros para determinar cómo y en qué medida el viroma ruminal afecta la digestibilidad del alimento y la eficiencia de utilización del nitrógeno.

A diferencia de la investigación sobre el microbioma y el viroma intestinal humano, que se centra principalmente en su participación en la salud51, la investigación sobre el microbioma y el viroma del rumen se centra en sus asociaciones con la eficiencia alimenticia y las emisiones de CH452. En la mayoría de los estudios metagenómicos, se analizan bacterias, metanógenos, protozoos y hongos del rumen, pero los virus/fagos del rumen a menudo se ignoran debido a la falta de bases de datos de referencia y herramientas bioinformáticas sólidas para identificar y clasificar secuencias virales de los metagenomas del rumen. Como se analizó anteriormente, los virus del rumen pueden afectar el microbioma del rumen, las principales funciones del rumen y el desempeño animal, incluida la eficiencia alimenticia y la productividad (rendimiento de crecimiento y lactancia), de una manera multifacética de arriba hacia abajo y de abajo hacia arriba. Con RVD, futuras investigaciones metagenómicas pueden analizar tanto el microbioma como el viroma del rumen para comprender mejor sus funciones y asociaciones con la eficiencia alimenticia y la productividad animal y para informar nuevos enfoques de mejora. Además, los fagos líticos que se predice que infectarán microbios ruminales indeseables, como especies de Streptococcus, metanógenos ruminales53 y protozoos, y sus enzimas pueden aislarse y explorarse por su potencial para reducir la acidosis ruminal, las emisiones de metano y la excreción de nitrógeno.

Los metagenomas del rumen publicados (n = 975, Datos complementarios 1) se descargaron de NCBI SRA, se sometieron a control de calidad con fastp54 y luego se ensamblaron individualmente usando Megahit (v1.2.1) con los parámetros predeterminados. Los metagenomas obtenidos se publicaron en 80 estudios que abarcan 13 especies o regímenes de cría de rumiantes de 8 países de 5 continentes (Fig. 1). Los países donde se tomaron muestras de los metagenomas junto con la cantidad de metagenomas se visualizaron en un mapa mundial que generamos utilizando el paquete R "rworldmap".

Después del ensamblaje, se identificaron primero los contigs virales tentativos siguiendo el SOP de identificación de secuencia viral (https://doi.org/10.17504/protocols.io.bwm5pc86). Brevemente, se verificaron contigs virales tentativos >5 kb usando VirSorter222 (opción: --min-score 0.5), y los contigs que pasaron el procedimiento de verificación se ingresaron a CheckV21 para recortar las secuencias del huésped que flanquean a los profagos. Solo elegimos contigs virales >5 kb porque las herramientas bioinformáticas disponibles actualmente muestran una tasa de falsos positivos relativamente alta al identificar contigs virales <5 kb30. Sólo los contigs que caen en las categorías Keep1 y Keep2 se conservaron como supuestos contigs virales (708.580 en total) para análisis adicionales.

Luego, los contigs virales se agruparon en vOTU de acuerdo con una identidad de nucleótidos (ANI) promedio del 95 % en el 85 % de los contigs más cortos, como se sugirió25 utilizando un script personalizado del repositorio CheckV21. Las 411,125 vOTU resultantes se verificaron adicionalmente con VIBRANT23 (opción: --virome). Para ser conservadores, solo las vOTU identificadas por VIBRANT y VirSorter2 (397,180) se utilizaron para construir RVD y se conservaron para la clasificación taxonómica y la predicción del huésped. Elegimos utilizar VIBRANT y VirSorter2 para la identificación viral porque se encuentran entre las herramientas más recientes con mejor rendimiento, según una evaluación comparativa reciente30. No había una base de datos viral del rumen disponible para ayudar en la anotación, por lo que anotamos las lecturas limpias utilizando genomas completos de NCBI RefSeq Viral (versión 211; descargado en marzo de 2022) y la fracción asociada al huésped de la base de datos IMG/VR V327. La integridad de las vOTU se estimó utilizando CheckV21. Se generó una curva de rarefacción para evaluar la cobertura de los virus ruminales utilizando el paquete RTK55 en R.

Asignamos vOTU> 10 kb a taxones virales a nivel de género según una red de intercambio de genes que utiliza vConTACT226, que utiliza NCBI RefSeq Viral (versión 88) como genomas de referencia. Las vOTU que podrían agruparse con los genomas de referencia de un género viral se asignaron a ese género según el flujo de trabajo vConTACT2. Asignamos las vOTU que no pudieron ser asignadas a un género viral y aquellas <10 kb a taxones virales a nivel familiar utilizando la regla de la mayoría, como se aplicó anteriormente4. Brevemente, predijimos los ORF de cada vOTU usando Prodigal56 y luego alineamos las secuencias ORF con las de NCBI RefSeq Viral usando BLASTp con una puntuación de bits ≥50. Las vOTU que se alinearon con los genomas virales NCBI RefSeq de una familia viral con> 50 % de sus secuencias de proteínas se asignaron a esa familia. Identificamos fagos similares a crAss utilizando BLASTn contra 2478 genomas de fagos similares a crAss identificados en estudios previos57,58,59, con un umbral de ≥80% de identidad de secuencia a lo largo de ≥50% de la longitud de vOTU similares a crAss previamente identificadas.

La mayoría de las vOTU asignables taxonómicamente del viroma del rumen se asignaron al orden Caudovirales, como en el caso del viroma intestinal humano, y por lo tanto comparamos la distribución filogénica de los virus Caudovirales entre los viromas del rumen y del intestino humano basándose en proteínas concatenadas. filogenia60. Específicamente, descargamos los perfiles HMM de los 77 genes marcadores de los virus Caudovirales de VOGDB (http://vogdb.org) y buscamos en RVD y en las dos bases de datos de viroma intestinal humano más grandes (MGV5 y GPD3, que filogenéticamente se complementan entre sí) para genes marcadores utilizando HMMER v3.1b261. Para garantizar una comparación justa entre las bases de datos, solo se incluyeron en la búsqueda las vOTU con una integridad >50 %. Luego alineamos cada uno de los genes marcadores de las tres bases de datos usando MAFFT62, cortamos las posiciones con> 50% de espacios usando trimAl63, concatenamos cada gen marcador alineado y llenamos el espacio donde faltaba un gen marcador. Solo se retuvieron los genes marcadores concatenados que mostraban cada uno >3 genes marcadores y se encontraron en >5% de todos los concatémeros alineados, lo que dio como resultado 10.203 concatémeros de genes marcadores de Caudovirales, cada uno con 13.573 columnas de alineación. Estos concatémeros de genes marcadores se agruparon en vOTU a nivel de género como se describió anteriormente 5, donde se realizó una evaluación comparativa para lograr una alta homogeneidad taxonómica utilizando genomas virales NCBI RefSeq. Construimos un árbol filogenético de virus Caudovirales usando FastTree v.2.1.9 (opción: -mlacc 2 -slownni -wag)64 y alineamos los genes marcadores concatenados de las secuencias vOTU representativas de todas las vOTU a nivel de género con una integridad del genoma >50 % (basado en el análisis CheckV). El árbol de Caudovirales se visualizó utilizando iTOL65. Las vOTU identificadas como profagas o que codifican una integrasa se consideraron lisogénicas. La tasa lisogénica (%) se calculó en base a los resultados de VIBRANT como el porcentaje de virus lisogénicos de todos los virus para cada género de sus probables huéspedes.

Predijimos los huéspedes probables de los virus del rumen utilizando un método dependiente de la alineación (alineando secuencias de profagos y secuencias espaciadoras CRISPR con bases de datos de genomas de procariotas y protozoos del rumen) con alta precisión de predicción66. Para la alineación de la secuencia del profago, seleccionamos manualmente tres bases de datos de genomas: una base de datos que contiene 22,095 MAG bacterianos y 410 MAG de arqueas ensamblados a partir de los mismos metagenomas utilizados para el análisis viral en el estudio actual, una base de datos de 2,729 MAG procarióticos del rumen de la base de datos del genoma del rumen de vaca V1 .0 (https://www.ebi.ac.uk/metagenomics/genome-catalogues/cow-rumen-v1-0) y una base de datos de 251.167 genomas de referencia de procariotas de NCBI RefSeq (versión 211; descargada en marzo de 2022). ). Los MAG procariotas anteriores y los genomas de referencia se clasificaron de acuerdo con la taxonomía GTDB utilizando GTDB-tk (opción: -classify_wf)67. No predijimos los huéspedes de los micovirus porque la mayoría de los micovirus son virus de ARN y solo están disponibles unos pocos genomas de referencia de hongos del rumen. Alineamos la secuencia viral representativa de cada vOTU con las secuencias del genoma procariótico/MAG anteriores utilizando BLASTn (opción: -tarea metablasto) para identificar regiones de profago integradas. Se llamó a una coincidencia de huésped cuando >2500 pb de un genoma de huésped o MAG coincidían con una secuencia vOTU con >90 % de identidad de secuencia sobre el 75 % de la longitud de la secuencia vOTU4. Predijimos probables huéspedes protozoarios de los virus del rumen buscando EVE en los 52 SAG ciliados de alta calidad68 utilizando BLASTn y los criterios anteriores.

También predijimos los probables huéspedes de los virus identificados alineando las secuencias espaciadoras CRISPR de las vOTU con los genomas de referencia y MAG de procariotas. Brevemente, identificamos las secuencias espaciadoras CRISPR de los genomas de referencia y MAG usando MinCED (opción: -minNR 2)69 y luego alineamos las secuencias espaciadoras CRISPR identificadas con las secuencias de RVD usando BLASTn (opción: -dust no). Se llamó a un huésped probable cuando el espaciador CRISPR de un genoma de referencia o MAG coincidía exactamente con una secuencia de vOTU (100% de identidad y 100% de cobertura). En total, identificamos 43.166 vOTU que tienen una coincidencia espaciadora CRISPR o las secuencias virales están integradas en los genomas del huésped. Con las secuencias de estas vOTU, construimos una red de intercambio de genes utilizando vConTACT2. Después de eliminar bordes duplicados y clústeres con <3 nodos, la red se importó a Cytoscape 3.7.270 y se anotaron según la taxonomía de los virus y sus probables hosts.

Para revelar los patrones de infección de los virus del rumen, construimos árboles filogenéticos a nivel de género para los huéspedes identificados (arqueas, bacterias y ciliados). Para los árboles filogenéticos de huéspedes bacterianos y arqueales, se eligió aleatoriamente un genoma dentro de cada género de huésped identificado. Luego, los 120 genes marcadores de bacterias y 122 genes marcadores de arqueas en los genomas de las bacterias y arqueas seleccionadas se alinearon utilizando GTDB-tk67. A partir de entonces, se construyeron árboles filogenéticos utilizando los genes marcadores alineados y IQ-TREE (opción: -redo -bb 1000 -m MFP -mset WAG,LG,JTT,Dayhoff -mrate E,I,G,I + G -mfreq FU - wbtl)71 y se visualizaron utilizando iTOL65. Las tasas lisogénicas se calcularon basándose en los resultados de VIBRANT como se detalla anteriormente. Se adquirió un árbol ciliado de Li et al. 68 y visualizado usando iTOL65.

Descargamos las secuencias metagenómicas disponibles públicamente de Anderson et al.29 del NCBI SRA e identificamos los virus utilizando el mismo protocolo de identificación viral mencionado anteriormente. Ese estudio utilizó tres metodologías de secuenciación y preparación de bibliotecas (secuenciación de metagenomas ruminales enriquecidos con VLP con Ion Torrent PGM o Illumina MiSeq y secuenciación de metagenomas ruminales en masa con Ion Torrent PGM), y comparamos la tasa de identificación viral (porcentaje de contigs virales identificados durante contigs totales utilizados para la identificación viral) entre las tres metodologías diferentes. Se utilizó una prueba de suma de rangos de Wilcoxon bilateral para comparar los resultados de identificación viral en R. Los contigs virales de metagenomas enriquecidos con VLP y metagenomas en masa se agruparon en vOTU por separado, y los dos conjuntos de vOTU resultantes se agruparon con RVD utilizando el método de agrupamiento descrito anteriormente. El porcentaje de cóntigos virales lisogénicos también se calculó como se detalla anteriormente. Comparamos el porcentaje de contigs virales lisogénicos y la proporción de vOTU agrupadas con RVD entre el metagenoma enriquecido con VLP y los metagenomas en masa con la prueba de Chi-cuadrado en R. Para probar la utilidad de RVD para identificar virus de metagenomas que no se utilizaron en Durante el desarrollo de RVD, también asignamos las lecturas limpias de estudios previos del viroma ruminal28,29 a RVD utilizando CoverM (opción: --min-read-percent-identity 0,95, --min-read-aligned-percent 0,75, --min -covered-fraction 0.7; https://github.com/wwood/CoverM) con el método de media recortada, que calcula la cobertura promedio después de eliminar las regiones con el 5% superior de cobertura más alta y más baja.

También evaluamos RVD y las dos bases de datos de viromas más grandes, NCBI RefSeq Viral e IMG/VR V3 (solo los virus asociados al huésped), por su utilidad para identificar virus del rumen a partir de metagenomas del rumen. Específicamente, mapeamos las lecturas de secuenciación de dos conjuntos recientes de metagenomas ruminales (BioProject PRJNA597489 y PRJNA779163) cuyos virus no están incluidos en ninguna de las tres bases de datos de viromas. Luego, calculamos las tasas de mapeo de las secuencias virales usando CoverM y comparamos las tasas de mapeo entre las tres bases de datos de viroma. También evaluamos RVD en la detección de virus en metagenomas ruminales de diferentes especies de rumiantes según la tasa de mapeo. Como se encontró una alta variabilidad en las tasas de mapeo, solo comparamos los resultados entre rumiantes sanos y aquellos que padecen SARA. Las tasas de mapeo de lecturas virales se analizaron estadísticamente utilizando la prueba no paramétrica bilateral de Kruskal-Wallis en R.

Utilizamos criterios estrictos para extraer secuencias virales, pero durante la curación manual inicial de los contigs virales, encontramos algunos contigs que eran posibles islas genómicas del huésped. Estos cóntigos pueden identificarse erróneamente como genomas virales mediante herramientas de identificación de virus3. Además, sigue siendo un desafío delinear los límites exactos entre los genomas del huésped y los genomas del profago21, y cualquier gen restante del huésped, si no se elimina, puede identificarse erróneamente como AMG. Por lo tanto, realizamos una serie de pasos de curación y filtrado para seleccionar vMAG para la identificación de AMG a fin de minimizar la identificación falsa de AMG. En primer lugar, solo buscamos en los vMAG > 10 kb (5912 en total) la identificación de AMG utilizando los criterios recomendados en un artículo de evaluación comparativa30. Luego, los vMAG seleccionados se sometieron a identificación de AMG y anotación del genoma utilizando DRAMv72 después del procesamiento con VirSorter2 con las opciones "—prep-for-dramv" aplicadas. En segundo lugar, los vMAG portadores de AMG se eliminaron si los AMG estaban en un extremo de los vMAG o si los AMG no estaban flanqueados por un gen viral distintivo y un gen similar al viral o por dos genes virales distintivos (categoría 1 y categoría 2). según lo determinado por DRAMv). En tercer lugar, los vMAG restantes se seleccionaron manualmente según los criterios especificados en el SOP de VirSorter2 (https://doi.org/10.17504/protocols.io.bwm5pc86; consulte también https://github.com/yan1365/RVD/blob /main/vmags_check_helper/readme.txt). Finalmente obtuvimos 1.880 vMAG. Para minimizar aún más la identificación falsa, verificamos manualmente el contexto genómico de estos vMAG y descubrimos que algunos de ellos todavía eran posibles islas genómicas. Por lo tanto, filtramos los 1880 vMAG según los criterios establecidos por Sun y Pratama et al. (datos no publicados). Brevemente, se eliminaron los vMAG que solo tenían integrasas/transposasas, genes de fibras de la cola o cualquier gen no viral. Los vMAG restantes se filtraron nuevamente para eliminar aquellos que no tenían al menos uno de los genes estructurales virales (es decir, proteína de la cápside, proteína portal, proteína de la cubierta del fago, placa base, proteína de la cabeza, proteína de la cola, proteína estructural del virión y terminasa) y aquellos que contienen genes que codifican una endonucleasa, una proteína de estabilidad del plásmido, una enzima de biosíntesis de lipopolisacáridos, familias de glicosiltransferasas (GT) 11 y 25, nucleotidiltransferasa, carbohidrato quinasa o epimerasa de azúcar de nucleótidos. Finalmente obtuvimos 504 vMAG libres de islas genómicas. Para comparar nuestro proceso de curación, se seleccionaron al azar 100 de los vMAG para una curación manual detallada en función de su contexto genómico. Según los resultados de la evaluación comparativa, estábamos seguros de que solo conservaríamos vMAG completos para la predicción de AMG. Los resultados detallados de cada paso de curación y la anotación completa de los vMAG finales y la anotación de los AMG identificados se presentan en los Datos complementarios 4. Comparamos los AMG identificados en el viroma del rumen con los AMG previamente identificados de otros viromas, que están disponibles en un Base de datos AMG seleccionada por expertos (https://github.com/WrightonLabCSU/DRAM/blob/master/data/amg_database.tsv). Para los AMG recientemente identificados, verificamos dos veces las anotaciones y buscamos en la literatura para asegurarnos de que fueran realmente AMG.

Las celulasas son esenciales para la digestión del alimento en el rumen y, por lo tanto, prestamos especial atención a los vMAG que portan AMG que codifican celulasas. No encontramos AMG que codifiquen celulasa en los vMAG y, por lo tanto, buscamos en todos los contigs virales en RVD. Siguiendo los pasos de curación manual descritos anteriormente, identificamos dos contigs virales, uno con un gen GH5 y el otro con un gen GH9. Aunque estos dos genes de GH no se encontraron en vMAG completos, cada uno estaba flanqueado por genes virales en ambos lados, lo que indica que son parte de los genomas virales. Además, cabe señalar que CheckV depende de la base de datos, y tanto la base de datos del genoma como la base de datos HMM utilizada por CheckV contienen cantidades muy pequeñas de virus del rumen. Por lo tanto, es razonable incluir contigs virales "incompletos" en la identificación de AMG, especialmente cuando las AMG identificadas se verifican cuidadosamente mediante curación manual.

Las secuencias de ADN de GH5 (1155 pb) y GH9 (2564 pb) fueron sintetizadas comercialmente por Synbio Technologies (Monmouth Junction, Nueva Jersey, EE. UU.). El gen GH5 se digirió dos veces con BamH1 y Apa1, mientras que el gen GH9 se digirió con BamH1 y XbaI. Después de la purificación en gel, los genes GH5 y GH9 se clonaron en E. coli DH5α (New England Biolabs, MA, EE. UU.) utilizando pCDNA 3.1 (ThermoFisher Scientific, Waltham, MA, EE. UU.). La clonación exitosa del gen GH5 o GH9 se confirmó aislando ADN plasmídico de cultivos de E. coli durante la noche, sometiendo el ADN plasmídico a doble digestión con las endonucleasas de restricción mencionadas anteriormente y electroforesis en gel de agarosa (1,2%).

La actividad celulasa de las proteínas GH5 y GH9 clonadas se verificó utilizando un ensayo en placa de agar73 y el reactivo de ácido 3,5-dinitrosalicílico (DNS)74. Brevemente, se inocularon cultivos de E. coli durante la noche que portaban GH5, GH9 clonados o el vector de clonación vacío en placas de agar LB que contenían ampicilina (100 µg/ml) y CMC (0,5%). Después de la incubación a 37 °C durante 48 h, cada placa se inundó con 5 ml de Congo al 0,2% durante 30 min. Luego se lavó cada placa con agua destilada y se enjuagó tres veces con 5 ml de cloruro de sodio 0,5 M durante 15 a 20 minutos para desarrollar el color/halo. Las colonias que mostraban grandes halos se verificaron adicionalmente utilizando el agente DNS. Brevemente, los cultivos de E. coli que portaban GH5, GH9 clonados y ningún inserto (pCDNA 3.1 vacío) se cultivaron en caldo LB a 37 ° C durante 24 h y 48 h. Después de la centrifugación a 2000 × g durante 15 minutos a 4 ° C, se mezclaron 500 µl de sobrenadante de cada cultivo como fuente de GH clonadas con 500 µl de CMC al 1% (en tampón de acetato de sodio 50 mM, pH 5). La mezcla se incubó a 60 °C durante 30 min y la reacción se detuvo añadiendo 1,0 ml de reactivo DNS y hirviendo durante 5 min. La densidad óptica se leyó a 540 nm, con un cultivo de E. coli que llevaba pCDNA 3.1 vacío como blanco. Se preparó una curva estándar con una serie de concentraciones de glucosa. El ensayo de DNS se realizó por triplicado (tanto para cada cultivo de E. coli como para cada estándar de glucosa).

Se buscaron ARG en los contigs virales utilizando criterios conservadores37. En resumen, descargamos la base de datos CARD (v3.0.7)75 y buscamos ARG transportados por los contigs virales de RVD utilizando BLASTp con un umbral de 80% de identidad de secuencia y 40% de cobertura de alineación. También buscamos ARG en RVD utilizando las herramientas NCBI AMRfinder v.3.8.476, que es una herramienta muy precisa y utiliza una base de datos integrada seleccionada por expertos. Los contigs virales portadores de ARG probables identificados se seleccionaron para retener secuencias virales auténticas utilizando el proceso anterior para identificar vMAG que contienen AMG. Para ser conservadores, los cóntiges virales con ARG al final se eliminaron a menos que estuvieran adyacentes a un gen relacionado con el virus. Se encontraron un total de 22 contigs virales portadores de ARG y se verificaron manualmente de forma individual para determinar su origen viral según la anotación del contexto del genoma. La anotación detallada y la curación manual de contigs virales portadores de ARG individuales se muestran en los Datos complementarios 5. Los contigs virales representativos que portan cada tipo de ARG se seleccionaron en función de la integridad de CheckV y la cantidad de genes celulares. Los contigs virales con mayor integridad y menos genes celulares se eligieron como contigs virales representativos, y sus organizaciones genómicas se representaron individualmente usando easyfig77 y se anotaron manualmente.

Evaluamos RVD para detectar la presencia de un viroma ruminal central según la prevalencia de vOTU. No encontramos un viroma central ruminal "global" en los 975 metagenomas ruminales. Por lo tanto, solo nos centramos en 283 bovinos con información sobre la composición de la dieta. Este ganado se dividió en tres grupos según el nivel de concentrado de sus dietas: bajo (menos de 30% de concentrado), medio (30–50% de concentrado) y alto (>50% de concentrado). Primero, transformamos la tabla de abundancia bruta en una matriz binaria (presencia o ausencia). Luego, se calculó la prevalencia de cada vOTU en cada muestra. Se incluyó una vOTU en el viroma ruminal central si su prevalencia excedía el 50 % de la prevalencia para cada nivel de concentrado o para todo el ganado. Según la prevalencia, las vOTU se clasificaron como individualizadas (observadas en una sola muestra), un nivel de concentrado (observadas en más de una muestra pero exclusivamente de un único nivel de concentrado), dos niveles de concentrado (observadas en animales de dos niveles de concentrado) y tres niveles de concentrado (observados en los tres niveles de concentrado). Los números de vOTU compartidos por los viromas centrales entre los tres niveles de concentrado se visualizaron con un gráfico de Venn en R. Examinamos si los animales de la misma dieta o de la misma raza comparten más vOTU en comparación con los animales alimentados con diferentes dietas o de diferentes razas usando subconjuntos de datos de Stewart et al.78 y Li et al.79 respectivamente. La prueba de Kruskal-Wallis se utilizó para comparar el número de vOTU compartidas en diferentes grupos en R.

La cobertura de cada vOTU en el RVD en los 975 metagenomas del rumen se examinó más a fondo mediante el mapeo de las lecturas de secuencia metagenómica en RVD utilizando CoverM con los parámetros descritos anteriormente. Con base en los resultados del mapeo leído, se calculó la riqueza viral por mil millones de pares de bases en cada metagenoma y se usó como indicador de la riqueza como se describió anteriormente4. Con la tabla de abundancia, la diversidad beta se calculó basándose en la disimilitud de Bray-Curtis usando el paquete vegano80 en R, y se realizó PERMANOVA con 999 permutaciones para probar diferencias entre viromas con la función adonis del paquete vegano en R. La riqueza viral fue comparado entre diferentes especies animales, países y estudios utilizando la prueba de Kruskal-Wallis en R. Los resultados se visualizaron con ggplot2 en R. Como se observó variación estudio por estudio en los resultados de diversidad alfa y beta, probamos cómo Los estudios podrían agruparse con agrupamiento jerárquico basado en la cantidad de vOTU compartidas entre los estudios como se describió anteriormente4. Para estudios que incluyeron múltiples especies de rumiantes o múltiples sistemas de producción (lácteos y bovinos), cada especie o sistema se consideró un “estudio” separado. Solo se retuvieron para el análisis los estudios con >12 metagenomas cada uno. Se comparó el número de vOTU compartidas por dos estudios para cada par de estudios y los resultados se sometieron a agrupación jerárquica. Los resultados de la agrupación jerárquica se visualizaron en R con el paquete ComplexHeatmap81 y se anotaron de acuerdo con los metadatos.

Las pruebas estadísticas se realizaron en R y fueron detalladas en secciones anteriores y en las leyendas de las figuras. Los scripts para el análisis y visualización estadística están disponibles en el repositorio de GitHub (https://github.com/yan1365/RVD). No se utilizó ningún método estadístico para predeterminar el tamaño de la muestra ya que no se realizaron nuevos experimentos en este estudio. Los datos que utilizamos provinieron de estudios publicados y los grupos de tratamiento se determinaron en función de los metadatos informados por los estudios individuales.

Más información sobre el diseño de la investigación está disponible en el Resumen del informe de Nature Portfolio vinculado a este artículo.

Los genomas virales incluidos en RVD y la información asociada se pueden acceder y descargar sin ninguna restricción en https://zenodo.org/record/7412085#.ZDsE2XbMK5c.

Los scripts personalizados de Bash, Python y R utilizados para procesar y analizar los datos y generar las cifras están disponibles en https://github.com/yan1365/RVD.

Gregory, AC y cols. Macrodiversidad y microdiversidad viral del ADN marino de polo a polo. Celda 177, 1109–1123.e1114 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Roux, S. y col. Ecogenómica y posibles impactos biogeoquímicos de los virus oceánicos globalmente abundantes. Naturaleza 537, 689–693 (2016).

Artículo CAS PubMed Google Scholar

Camarillo-Guerrero, LF et al. Ampliación masiva de la diversidad de bacteriófagos intestinales humanos. Celda 184, 1098-1109 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Gregory, AC y cols. La base de datos de viromas intestinales revela patrones de diversidad de viromas dependientes de la edad en el intestino humano. Microbio huésped celular 28, 724–740 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Nayfach, S. et al. Compendio metagenómico de 189.680 virus de ADN del microbioma intestinal humano. Nat. Microbiol. 6, 960–970 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Emerson, JB y cols. Ecología viral del suelo ligada al huésped a lo largo de un gradiente de deshielo del permafrost. Nat. Microbiol. 3, 870–880 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Howard-Varona, C. et al. Reprogramación metabólica de virocélulas específicas de fagos. ISME J. 14, 881–895 (2020).

Artículo PubMed PubMed Central Google Scholar

Domínguez-Huerta, G. et al. Diversidad y huella ecológica de los virus de ARN oceánicos globales. Ciencia 376, 1202-1208 (2022).

Artículo ADS CAS PubMed Google Scholar

Tisza, MJ y Buck, CB Un catálogo de decenas de miles de virus de metagenomas humanos revela asociaciones ocultas con enfermedades crónicas. Proc. Acad. Nacional. Ciencia. Estados Unidos 118, e2023202118 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Huws, SA et al. Abordar los desafíos globales de la agricultura de rumiantes mediante la comprensión del microbioma ruminal: pasado, presente y futuro. Frente. Microbiol. 9, 2161 (2018).

Artículo PubMed PubMed Central Google Scholar

Gilbert, RA y cols. Poblaciones de virus del rumen: avances tecnológicos que mejoran la comprensión actual. Frente. Microbiol. 11, 450 (2020).

Artículo PubMed PubMed Central Google Scholar

Gilbert, R. y Ouwerkerk, D. La genética de las poblaciones de fagos del rumen. Actas 36, 165 (2019).

Google Académico

Klieve, AV & Bauchop, T. Diversidad morfológica de bacteriófagos ruminales de ovejas y bovinos. Aplica. Reinar. Microbiol. 54, 1637-1641 (1988).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Ritchie, A., Robinson, I. y Allison, M. Bacteriófago del rumen: estudio de tipos morfológicos. Microscopía. Electrón. 3, 333–334 (1970).

Google Académico

Gilbert, RA y Klieve, AV en Microbiología del rumen: de la evolución a la revolución 121–141 (Springer, 2015).

Gilbert, RA y cols. Hacia la comprensión de las interacciones entre fagos y huéspedes en el rumen; Secuencias genómicas completas de fagos líticos que infectan bacterias del rumen. Frente. Microbiol. 8, 2340 (2017).

Artículo PubMed PubMed Central Google Scholar

Friedersdorff, JC y cols. El aislamiento y secuenciación del genoma de cinco nuevos bacteriófagos del rumen activos contra Butyrivibrio fibrisolvens. Frente. Microbiol. 11, 1588 (2020).

Artículo PubMed PubMed Central Google Scholar

Berg Miller, ME et al. Relaciones fago-bacteria y elementos CRISPR revelados por un estudio metagenómico del microbioma ruminal. Reinar. Microbiol. 14, 207–227 (2012).

Artículo CAS PubMed Google Scholar

Ross, EM, Petrovski, S., Moate, PJ y Hayes, BJ Metagenómica de bacteriófagos ruminales de trece vacas lecheras lactantes. BMC Microbiol. 13, 242 (2013).

Artículo PubMed PubMed Central Google Scholar

Parmar, NR, Jakhesara, SJ, Mohapatra, A. y Joshi, CG Rumen virome: una evaluación de las comunidades virales y sus funciones en el rumen de un búfalo indio. actual. Ciencia. Rev. 111, 919–925 (2016).

Nayfach, S. et al. CheckV evalúa la calidad y la integridad de los genomas virales ensamblados en metagenomas. Nat. Biotecnología. 39, 578–585 (2021).

Artículo CAS PubMed Google Scholar

Guo, J. y col. VirSorter2: un enfoque guiado por expertos y clasificador múltiple para detectar diversos virus de ADN y ARN. Microbioma 9, 1-13 (2021).

Artículo de Google Scholar

Kieft, K., Zhou, Z. y Anantharaman, K. VIBRANT: recuperación automatizada, anotación y curación de virus microbianos y evaluación de la función de la comunidad viral a partir de secuencias genómicas. Microbioma 8, 1–23 (2020).

Artículo de Google Scholar

Zayed, AA y cols. efam: una base de datos de perfiles HMM ampliada y compatible con metaproteomas de familias de proteínas virales. Bioinformática 37, 4202–4208 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Roux, S. y col. Información mínima sobre el genoma de un virus no cultivado (MIUViG). Nat. Biotecnología. 37, 29–37 (2019).

Artículo CAS PubMed Google Scholar

Jang, HB y cols. La asignación taxonómica de genomas de virus procarióticos no cultivados es posible mediante redes de intercambio de genes. Nat. Biotecnología. 37, 632–639 (2019).

Artículo de Google Scholar

Roux, S. y col. IMG/VR v3: un marco ecológico y evolutivo integrado para interrogar genomas de virus no cultivados. Ácidos nucleicos res. 49, D764–D775 (2021).

Artículo CAS PubMed Google Scholar

Sölden, LM et al. La alimentación cruzada entre especies orquesta la degradación del carbono en el ecosistema del rumen. Nat. Microbiol. 3, 1274–1284 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Anderson, CL, Sullivan, MB y Fernando, SC La energía dietética impulsa la respuesta dinámica de las comunidades virales del rumen bovino. Microbioma 5, 155 (2017).

Artículo PubMed PubMed Central Google Scholar

Pratama, AA et al. Estándares en expansión en virómica: evaluación in silico de la identificación, clasificación y curación de genes metabólicos auxiliares del genoma viral de ADNbc. PeerJ 9, e11447 (2021).

Artículo PubMed PubMed Central Google Scholar

Marbouty, M., Thierry, A. & Koszul, R. Red de interacciones fagos-bacterias del intestino humano sano. Preimpresión en https://doi.org/10.1101/2020.05.13.093716 (2020).

Kinsella, CM y cols. Parásitos Entamoeba y Giardia implicados como huéspedes de los virus CRESS. Nat. Comunitario. 11, 4620 (2020).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Park, T., Wijeratne, S., Meulia, T., Firkins, JL y Yu, Z. El genoma macronuclear del ciliado anaeróbico Entodinium caudatum revela sus características biológicas adaptadas al entorno ruminal distinto. Genómica 113, 1416-1427 (2021).

Artículo CAS PubMed Google Scholar

Hampton, HG, Watson, BN y Fineran, PC La carrera armamentista entre las bacterias y sus enemigos fagos. Naturaleza 577, 327–336 (2020).

Artículo ADS CAS PubMed Google Scholar

Murphy, J., Mahony, J., Ainsworth, S., Nauta, A. y van Sinderen, D. Metiltransferasas de ADN huérfano de bacteriófagos: conocimientos sobre su origen, función y aparición bacteriana. Aplica. Reinar. Microbiol. 79, 7547–7555 (2013).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Heyerhoff, B., Engelen, B. & Bunse, C. Funciones de genes metabólicos auxiliares en virus pelágicos y bentónicos del Mar Báltico. Frente. Microbiol. 13, 863620 (2022).

Artículo PubMed PubMed Central Google Scholar

Enault, F. y col. Los fagos rara vez codifican genes de resistencia a los antibióticos: una advertencia para los análisis de viromas. ISME J. 11, 237–247 (2017).

Artículo CAS PubMed Google Scholar

Ma, T. y col. Las expresiones de resistoma están relacionadas con las funciones clave y la estabilidad del microbioma ruminal activo. Animación. Microbioma 4, 1-17 (2022).

Artículo de Google Scholar

Xue, M.-Y. et al. El resistoma ruminal del ganado lechero está individualizado y los resistotipos están asociados con las características del ordeño. Animación. microbioma 3, 1-17 (2021).

Artículo de Google Scholar

Bickhart, DM y cols. Asignación de genes de resistencia a virus y antimicrobianos a huéspedes microbianos en una comunidad microbiana compleja mediante ensamblaje de lectura larga combinado y ligadura de proximidad. Genoma Biol. 20, 1-18 (2019).

Artículo CAS Google Scholar

Swain, RA, Nolan, JV & Klieve, AV Variabilidad natural y fluctuaciones diurnas dentro de la población de bacteriófagos del rumen. Aplica. Reinar. Microbiol. 62, 994–997 (1996).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Zayed, AA y cols. Virus marinos crípticos y abundantes en los orígenes evolutivos del viroma de ARN de la Tierra. Ciencia 376, 156–162 (2022).

Artículo ADS CAS PubMed Google Scholar

Starr, EP, Nuccio, EE, Pett-Ridge, J., Banfield, JF y Firestone, MK La reconstrucción metatranscriptómica revela virus de ARN con potencial para dar forma al ciclo del carbono en el suelo. Proc. Acad. Nacional. Ciencia. Estados Unidos 116, 25900–25908 (2019).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Hitch, TC, Edwards, JE y Gilbert, RA La metatranscriptómica revela poblaciones de micovirus en el rumen ovino. Microbiol FEMS. Letón. 366, fnz161 (2019).

Artículo CAS PubMed Google Scholar

Touchon, M., De Sousa, JAM & Rocha, EP Abrazando al enemigo: la diversificación de repertorios de genes microbianos mediante transferencia horizontal de genes mediada por fagos. actual. Opinión. Microbiol. 38, 66–73 (2017).

Artículo CAS PubMed Google Scholar

Hughes, K., Sutherland, I., Clark, J. & Jones, M. Bacteriófagos y polisacáridos despolimerasas asociados: herramientas novedosas para el estudio de biopelículas bacterianas. J. Aplica. Microbiol. 85, 583–590 (1998).

Artículo CAS PubMed Google Scholar

Rice, SA y cols. El ciclo de vida de la biopelícula y la virulencia de Pseudomonas aeruginosa dependen de un profago filamentoso. ISME J. 3, 271–282 (2009).

Artículo CAS PubMed Google Scholar

Koenig, KM, Newbold, CJ, McIntosh, FM y Rode, LM Efectos de los protozoos sobre el reciclaje bacteriano de nitrógeno en el rumen. J.Anim. Ciencia. 78, 2431–2445 (2000).

Artículo CAS PubMed Google Scholar

Gazitua, MC et al. Potencial ciclo de nitrógeno mediado por virus en aguas oceánicas sin oxígeno. ISME J. 15, 981–998 (2021).

Artículo CAS PubMed Google Scholar

Kieft, K. y col. Ecología del metabolismo auxiliar del azufre inorgánico en bacteriófagos generalizados. Nat. Comunitario. 12, 3503 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Wang, D. y col. Caracterización de las variaciones estructurales microbianas intestinales como determinantes del metabolismo de los ácidos biliares humanos. Microbio huésped celular 29, 1802–1814.e1805 (2021).

Artículo CAS PubMed Google Scholar

Li, F. y col. La genética del huésped influye en la microbiota ruminal y las características microbianas hereditarias del rumen se asocian con la eficiencia alimenticia en el ganado. Microbioma 7, 1-17 (2019).

Artículo de Google Scholar

Altermann, E., Schofield, LR, Ronimus, RS, Beattie, AK y Reilly, K. Inhibición de los metanógenos del rumen mediante una nueva enzima lítica arqueal mostrada en bionanopartículas adaptadas. Frente. Microbiol. 9, 2378 (2018).

Artículo PubMed PubMed Central Google Scholar

Chen, S., Zhou, Y., Chen, Y. & Gu, J. fastp: un preprocesador FASTQ todo en uno ultrarrápido. Bioinformática 34, i884 – i890 (2018).

Artículo PubMed PubMed Central Google Scholar

Saary, P., Forslund, K., Bork, P. y Hildebrand, F. RTK: análisis de rarefacción eficiente de grandes conjuntos de datos. Bioinformática 33, 2594–2595 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Hyatt, D. y col. Pródigo: reconocimiento de genes procarióticos e identificación del sitio de inicio de la traducción. Bioinformación de BMC. 11, 119 (2010).

Artículo de Google Scholar

Yutin, N. et al. El análisis de genomas virales ensamblados en metagenomas del intestino humano revela diversos fagos putativos similares a CrAss con características genómicas únicas. Nat. Comunitario. 12, 1-11 (2021).

Artículo de Google Scholar

Gulyaeva, A. et al. Descubrimiento, diversidad y asociaciones funcionales de fagos similares a crAss en metagenomas del intestino humano de cuatro cohortes holandesas. Rep. Celular 38, 110204 (2022).

Artículo CAS PubMed Google Scholar

Guérin, E. et al. Biología y taxonomía de bacteriófagos tipo crAss, el virus más abundante en el intestino humano. Microbio huésped celular 24, 653.e6–664.e6 (2018).

Artículo de Google Scholar

Low, SJ, Džunková, M., Chaumeil, P.-A., Parks, DH y Hugenholtz, P. Evaluación de una filogenia de proteínas concatenadas para la clasificación de virus de ADN bicatenario con cola pertenecientes al orden Caudovirales. Nat. Microbiol. 4, 1306-1315 (2019).

Artículo CAS PubMed Google Scholar

Eddy, SR Búsquedas HMM de perfil aceleradas. Computación PLoS. Biol. 7, e1002195 (2011).

Artículo ADS MathSciNet CAS PubMed PubMed Central Google Scholar

Katoh, K. & Standley, DM MAFFT software de alineación de secuencias múltiples versión 7: mejoras en el rendimiento y la usabilidad. Mol. Biol. Evolución. 30, 772–780 (2013).

Artículo CAS PubMed PubMed Central Google Scholar

Capella-Gutiérrez, S., Silla-Martínez, JM & Gabaldón, T. trimAl: una herramienta para el recorte de alineación automatizado en análisis filogenéticos a gran escala. Bioinformática 25, 1972-1973 (2009).

Artículo PubMed PubMed Central Google Scholar

Price, MN, Dehal, PS y Arkin, AP FastTree 2: árboles de probabilidad máxima aproximada para alineaciones grandes. MÁS UNO 5, e9490 (2010).

Artículo ADS PubMed PubMed Central Google Scholar

Letunic, I. & Bork, P. Interactive Tree Of Life (iTOL) v4: actualizaciones recientes y nuevos desarrollos. Ácidos nucleicos res. 47, W256–W259 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Coclet, C. & Roux, S. Descripción general global y principales desafíos de los métodos de predicción del huésped para fagos no cultivados. actual. Opinión. Virol. 49, 117-126 (2021).

Artículo CAS PubMed Google Scholar

Chaumeil, PA, Mussig, AJ, Hugenholtz, P. & Parks, DH GTDB-Tk: un conjunto de herramientas para clasificar genomas con la base de datos de taxonomía del genoma. Bioinformática 36, ​​1925-1927 (2019).

Artículo PubMed PubMed Central Google Scholar

Li, Z. y col. Conocimientos genómicos sobre la filogenia y las enzimas que degradan la biomasa de los ciliados del rumen. ISME J. 16, 2775–2787 (2022).

Artículo CAS PubMed Google Scholar

Bland, C. et al. Herramienta de reconocimiento CRISPR (CRT): una herramienta para la detección automática de repeticiones palindrómicas agrupadas y espaciadas regularmente. Bioinformación de BMC. 8, 1–8 (2007).

Artículo de Google Scholar

Shannon, P. y col. Cytoscape: un entorno de software para modelos integrados de redes de interacción biomoleculares. Genoma Res. 13, 2498–2504 (2003).

Artículo CAS PubMed PubMed Central Google Scholar

Nguyen, L.-T., Schmidt, HA, Von Haeseler, A. & Minh, BQ IQ-TREE: un algoritmo estocástico rápido y eficaz para estimar filogenias de máxima verosimilitud. Mol. Biol. Evolución. 32, 268–274 (2015).

Artículo CAS PubMed Google Scholar

Shaffer, M. y col. DRAM para destilar el metabolismo microbiano para automatizar la curación de la función del microbioma. Ácidos nucleicos res. 48, 8883–8900 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Danso, B., Ali, SS, Xie, R. & Sun, J. Valorización de la producción de paja de trigo y bioetanol mediante una nueva cepa de Streptomyces productora de xilanasa y celulasa aislada de la especie Microcerotermes, termita que se alimenta de madera. Combustible 310, 122333 (2022).

Artículo CAS Google Scholar

Miller, GL Uso del reactivo de ácido dinitrosalicílico para la determinación del azúcar reductor. Anal. Química. 31, 426–428 (1959).

Artículo CAS Google Scholar

Alcock, BP y cols. CARD 2020: vigilancia de la resistencia a los antibióticos con la base de datos integral de resistencia a los antibióticos. Ácidos nucleicos res. 48, D517–D525 (2020).

CAS PubMed Google Académico

Feldgarden, M. y col. Validar la herramienta AMRFinder y la base de datos de genes de resistencia mediante el uso de correlaciones genotipo-fenotipo de resistencia a los antimicrobianos en una colección de aislados. Antimicrobiano. Agentes Chemother. 63, e00483–00419 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Sullivan, MJ, Petty, NK y Beatson, SA Easyfig: un visualizador de comparación del genoma. Bioinformática 27, 1009–1010 (2011).

Artículo CAS PubMed PubMed Central Google Scholar

Stewart, RD y cols. Ensamblaje de 913 genomas microbianos a partir de secuenciación metagenómica del rumen de vaca. Nat. Comunitario. 9, 1-11 (2018).

Artículo CAS Google Scholar

Li, F., Hitch, TC, Chen, Y., Creevey, CJ y Guan, LL Los análisis metagenómicos y metatranscriptómicos comparativos revelan el efecto de la raza en el microbioma del rumen y sus asociaciones con la eficiencia alimenticia en el ganado vacuno. Microbioma 7, 1–21 (2019).

Artículo de Google Scholar

Oksanen, J. y col. El paquete vegano. Ecología comunitaria. Paquete 10, 719 (2007).

Google Académico

Gu, Z., Eils, R. & Schlesner, M. Los mapas de calor complejos revelan patrones y correlaciones en datos genómicos multidimensionales. Bioinformática 32, 2847–2849 (2016).

Artículo CAS PubMed Google Scholar

Descargar referencias

Los autores agradecen la financiación para este proyecto del Instituto Nacional de Alimentación y Agricultura del USDA (Número de premio: 2021-67015-33393).

Departamento de Ciencias Animales, Universidad Estatal de Ohio, Columbus, OH, EE. UU.

Ming Yan, Sripoorna Somasundaram y Zhongtang Yu

Centro de Ciencias del Microbioma, Universidad Estatal de Ohio, Columbus, OH, EE. UU.

Ming Yan, Akbar Adjie Pratama, Sripoorna Somasundaram, Matthew B. Sullivan y Zhongtang Yu

Departamento de Microbiología, Universidad Estatal de Ohio, Columbus, OH, EE. UU.

Akbar Adjie Pratama y Matthew B. Sullivan

Facultad de Ciencia y Tecnología Animal, Universidad Northwest A&F, Yangling, China

Zongjun Li y Yu Jiang

Departamento de Ingeniería Civil, Ambiental y Geodésica, Universidad Estatal de Ohio, Columbus, OH, EE. UU.

Mateo B. Sullivan

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

MY y ZY diseñaron el estudio. MY y AAP realizaron los análisis bioinformáticos. SS realizó la clonación y expresión de GH5 y GH9. ZL e YJ contribuyeron a los análisis bioinformáticos. MY y ZY escribieron el manuscrito. MBS y todos los demás coautores editaron los borradores del manuscrito.

Correspondencia a Zhongtang Yu.

Los autores declaran no tener conflictos de intereses.

Nature Communications agradece a los revisores anónimos por su contribución a la revisión por pares de este trabajo. Un archivo de revisión por pares está disponible.

Nota del editor Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Yan, M., Pratama, AA, Somasundaram, S. et al. Interrogando la materia oscura viral del ecosistema ruminal con una base de datos global de viromas. Nat Comuna 14, 5254 (2023). https://doi.org/10.1038/s41467-023-41075-2

Descargar cita

Recibido: 28 de noviembre de 2022

Aceptado: 21 de agosto de 2023

Publicado: 29 de agosto de 2023

DOI: https://doi.org/10.1038/s41467-023-41075-2

Cualquier persona con la que comparta el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.