banner
Центр новостей
Большой опыт управления цепочками поставок.

Новые углеводсвязывающие домены, идентифицированные с помощью функционального метагеномного скрининга микробиоты кишечника человека на основе фагового дисплея

Nov 04, 2023

Биология связи, том 6, Номер статьи: 371 (2023) Цитировать эту статью

2236 Доступов

1 Цитаты

10 Альтметрика

Подробности о метриках

Некультивируемые микробы представляют собой огромный неиспользованный биологический ресурс новых генов и генных продуктов. Хотя недавние усилия по геномному и метагеномному секвенированию привели к идентификации многочисленных генов, которые гомологичны существующим аннотированным генам, тем не менее, остается огромный пул неаннотированных генов, последовательности которых не обнаруживают значительной гомологии с существующими аннотированными генами. Функциональная метагеномика предлагает способ идентифицировать и аннотировать новые генные продукты. Здесь мы используем функциональную метагеномику для поиска новых углеводсвязывающих доменов, которые могут помочь комменсалам кишечника человека в соблюдении режима, колонизации кишечника и метаболизме сложных углеводов. Мы сообщаем о создании и функциональном скрининге библиотеки метагеномного фагового дисплея из образцов фекалий здорового человека на предмет пищевых, микробных и хозяинских полисахаридов/гликоконъюгатов. Мы идентифицируем несколько белковых последовательностей, которые не обнаруживают совпадения ни с одним известным белковым доменом, но, по прогнозам, содержат складки, подобные модулям, связывающим углеводы. Мы гетерологично экспрессируем, очищаем и биохимически характеризуем некоторые из этих белковых доменов и демонстрируем их функцию связывания углеводов. Наше исследование выявило несколько ранее неаннотированных углеводсвязывающих доменов, включая леван-связывающий домен и четыре сложных N-гликансвязывающих домена, которые могут быть полезны для маркировки, визуализации и выделения этих гликанов.

На Земле обитают микробные сообщества, состоящие из ~4–6 × 1030 клеток1, насчитывающие более одного триллиона видов2, подавляющее большинство из которых не культивировались стандартными лабораторными методами3 и не изучались. Микробные сообщества представляют собой потенциальный резервуар для добычи новых ферментов и биомолекул4. Основанная на секвенировании, а также функциональная метагеномика, применение независимых от культуры методов, послужили мощным средством понимания и использования сложности микробных сообществ для открытия новых биомолекул5. Функциональная метагеномика, которая включает в себя создание библиотек метагеномной ДНК (с использованием подходящих векторов, таких как космиды, фосмиды6 или фаги7) и их скрининг на желаемый фенотип8, позволяет идентифицировать гены, кодирующие генные продукты с желаемыми функциями, без какой-либо предварительной информации об их свойства, основанные на сходстве последовательностей в общедоступных базах данных. Таким образом, эта стратегия наряду с предоставлением новых генов/белков для биотехнологических приложений8 также помогает в функциональном назначении белков, обозначенных в базах данных как гипотетические белки9.

Кишечник человека представляет собой богатый гликанами ландшафт с огромной структурной сложностью гликанов10, возникающей из-за огромного разнообразия моносахаридов и гликозидных связей в эндогенных гликанах муцина11,12 в слизи хозяина13, а также в пищевых растительных полисахаридах, таких как крахмал, гемицеллюлоза и пектин10. В отличие от человеческих геномов, которые кодируют только 97 гликозидгидролаз, из которых только 17 разрушают небольшое подмножество гликозидных связей, присутствующих в углеводных питательных веществах, таких как сахароза, лактоза и крахмал, мини-микробиом, построенный из 177 эталонных геномов микробиоты кишечника человека, был обнаружено 15 882 различных гена углеводно-активных ферментов (CAZyme), ответственных за метаболизм гликанов14. Очевидно, что метаболизм сложных углеводных питательных веществ в кишечнике осуществляется CAZymes примерно триллиона микробов примерно 160 видов, составляющих микробиоту кишечника человека15,16,17. CAZymes часто имеют модульную архитектуру с одним или несколькими каталитическими доменами в тандеме со вспомогательными некаталитическими модулями или углеводсвязывающими модулями (CBM)18, которые приближают каталитический модуль к недоступным субстратам и, таким образом, увеличивают эффективную концентрацию субстрата и эффективность ферментов19. Помимо CBM, другие белки, такие как бактериальные лектины, также связываются с молекулами углеводов в кишечнике20. Таким образом, микробный метагеном кишечника человека представляет собой огромную сокровищницу генов, кодирующих углеводсвязывающие белки, которые можно использовать для различных приложений21, таких как определение группы крови22, биоспецифическая аффинная очистка23 и целевые приложения для противоопухолевой и антивирусной терапии24, и что может также способствовать нашему пониманию взаимодействий хозяин-комменсал.

144 bp, indicating enrichment. A high degree of selection was also evident from the high frequency of occurrence of PCR amplicons of the same size among randomly picked phage clones for a given selection condition and sometimes, even for phage clones from different elution conditions (e.g. Fig. 2a–f). We confirmed this by sequencing a few amplicons of the same size and verifying that they had the same sequence. Sequences of all recombinant phage clones identified are listed in Supplementary Data 1, Table S4./p>90% sequence identity amongst Ap-Ap2, Ap-Ap5 and St-Glc2, and amongst Am-Glc2, St-Glc1, and St-Glc5, with the clone Am-Glc2 (197 amino acids long, amylose binder eluted with glucose) mapping almost completely within St-Glc1 (370 amino acids long, starch binder eluted with glucose) (Supplementary Data 1, Tables S4 and S9)./p>50% of their molecular mass12 and a rich oligosaccharide repertoire of ~100 different O-glycan structures that are differentially present along the length of the gut, thereby creating unique niches and potential binding sites along the gut for the colonization of bacteria11,53, perhaps contributing to the varying microbiota composition in different regions of the gut54,55. The ability to bind to or utilize mucin provides a competitive edge in colonization of the gut56,57,58,59, and gut symbionts like Akkermansia muciniphila60, Bifidobacterium61, Bacteroides species58, and Lactobacillus fermentum62 indulge in mucosal glycan foraging, secreting glycoside hydrolases (GHs) for mucin glycan degradation59,63./p>

Based on our biochemical evidence of glycan binding (and the high sequence similarity between MU1 and MU3), we suggest that MG1, MN3 and MU1/MU3 domains be annotated as new CBMs in the CAZy database. Future studies can focus on how these glycan binding domains compare with existing LacNAc binding galectins21,64 and Siaα2-6 binding proteins such as the human influenza A and B virus lectin haemagglutinin65, Pseudomonas aeruginosa pili66, the surface protein antigen (PAc) of Streptococcus mutans67, mushroom Polyporus squamosus agglutinin (PSA)68, and the plant lectins, Sambucus nigra agglutinin (SNA), Sambucus canadensis agglutinin (SCA), Sambucus sieboldiana agglutinin (SSA), Wheat-germ agglutinin (WGA), Trichosanthes japonica (TJA-I), and ML-I of Viscum album69,70,71,72,6 Gal beta 1->4GlcNAc and HSO3(-)- > 6Gal beta 1->GlcNAc specific lectin in tuberous roots of Trichosanthes japonica. Biochemistry 31, 11647–11650 (1992)." href="/articles/s42003-023-04718-0#ref-CR73" id="ref-link-section-d84397227e2617"73./p>144 bp (which is the size of the amplicon expected for a non-recombinant phage amplified by the T7UP and T7DOWN primers) were considered to be recombinant. Enriched recombinant phages were further subjected to Sanger sequencing in-house (at IMTECH, using 16-capillary 3130xl Genetic Analyzer, Applied Biosystems). DNA sequences obtained were translated using ExPASy80 and visualized using FinchTV version 1.4.0. Sequences with more than 30 continuous amino acids (without any stop codon) were considered for further analysis. These metagenomic sequences were subjected to searches against both the protein sequence database, ‘UniRef100’81, and the profile databases, ‘pfamA-full’ and ‘pfamB’31, and ‘dbCAN2’33 using mmseqs282 at a very high sensitivity (-s 8.5). In addition, an all-against-all sequence search of the initial 33 query proteins was also performed. The general command run for these searches was ‘mmseqs easy-search input_protein_seqs search_database output.result_file tmp_directory -s 8.5 --format-mode 2‘. In the search against UniRef100, for each query protein sequence, the top five returned hits were retained and were then further searched for pfamA-full domains as above using mmseqs2. The fields ‘representativeMember_organismName‘ and ‘cluster_representative_name‘ (in Table S5) were obtained using uniprot API81. In the search result against pfamA-full, the field ‘pfam-family_description‘ (in Table S7) was obtained using https://github.com/AlbertoBoldrini/python-pfam (a python interface for pfamA). Three-dimensional structure predictions were performed for all amino acid sequences using a local server installed AlphaFold2, and structures were visualized using reverse rainbow coloring based on pLDDT scores in PyMOL (Schrodinger) (Supplementary Data 2)./p>6 Gal beta 1->4GlcNAc and HSO3(-)- > 6Gal beta 1->GlcNAc specific lectin in tuberous roots of Trichosanthes japonica. Biochemistry 31, 11647–11650 (1992)./p>