304 უჟანგავი ფოლადის შედუღებული დახვეული მილაკი/მილის ჟემიური ზომპონენტი, გლობალური საზღვაო მიკრობიომის ბიოსინთეზური პოტენციალი

გმადლობთ Nature.com-ის მონახულებისთვის.თქვენ იყენებთ ბრაუზერის ვერსიას შეზღუდული CSS მხარდაჭერით.საუკეთესო გამოცდილებისთვის, გირჩევთ გამოიყენოთ განახლებული ბრაუზერი (ან გამორთოთ თავსებადობის რეჟიმი Internet Explorer-ში).გარდა ამისა, მუდმივი მხარდაჭერის უზრუნველსაყოფად, ჩვენ ვაჩვენებთ საიტს სტილის და JavaScript-ის გარეშე.
სლაიდერები, რომლებიც აჩვენებს სამ სტატიას თითო სლაიდზე.გამოიყენეთ უკანა და შემდეგი ღილაკები სლაიდებში გადასაადგილებლად, ან სლაიდის კონტროლერის ღილაკები ბოლოს თითოეულ სლაიდში გადასაადგილებლად.

პროდუქტის დეტალური აღწერა

304 უჟანგავი ფოლადის შედუღებული დახვეული მილი/მილაკი
1. სპეციფიკაცია: უჟანგავი ფოლადის ხვეული მილი/მილაკი
2. ტიპი: შედუღებული ან უნაკერო
3. სტანდარტი: ASTM A269, ASTM A249
4. უჟანგავი ფოლადის ხვეული მილის OD: 6მმ-დან 25.4მმ-მდე
5. სიგრძე: 600-3500 მმ ან მომხმარებლის მოთხოვნის მიხედვით.
6. კედლის სისქე: 0.2მმ-დან 2.0მმ-მდე.

7. ტოლერანტობა: OD: +/-0.01მმ;სისქე: +/-0,01%.

8. კოჭის შიდა ხვრელის ზომა: 500 მმ-1500 მმ (შეიძლება მორგებული იყოს მომხმარებლის მოთხოვნების შესაბამისად)

9. კოჭის სიმაღლე: 200 მმ-400 მმ (შეიძლება დარეგულირდეს მომხმარებლის მოთხოვნების მიხედვით)

10. ზედაპირი: კაშკაშა ან დამუშავებული
11. მასალა: 304, 304ლ, 316ლ, 321, 301, 201, 202, 409, 430, 410, შენადნობი 625, 825, 2205, 2507 და ა.შ.
12. შეფუთვა: ნაქსოვი ჩანთები ხის ყუთში, ხის პლატაზე, ხის ღერძში ან მომხმარებლის მოთხოვნის მიხედვით
13. ტესტი: ქიმიური კომპონენტი, მოსავლიანობის სიძლიერე, დაჭიმვის სიმტკიცე, სიხისტის გაზომვა
14. გარანტია: მესამე მხარის (მაგალითად :SGS TV ) შემოწმება და ა.შ.
15. აპლიკაცია: დეკორაცია, ავეჯი, ზეთის ტრანსპორტირება, სითბოს გადამცვლელი, მოაჯირის დამზადება, ქაღალდის დამზადება, ავტომობილი, საკვების გადამამუშავებელი, სამედიცინო და ა.შ.

ყველა ქიმიური შემადგენლობა და ფიზიკური თვისებები უჟანგავი ფოლადისთვის, როგორც ქვემოთ:

მასალა ASTM A269 ქიმიური შემადგენლობა % მაქს
C Mn P S Si Cr Ni Mo NB Nb Ti
TP304 0.08 2.00 0.045 0.030 1.00 18.0-20.0 8.0-11.0 ^ ^ ^ . ^
TP304L 0.035 2.00 0.045 0.030 1.00 18.0-20.0 8.0-12.0 ^ ^ ^ ^
TP316 0.08 2.00 0.045 0.030 1.00 16.0-18.0 10.0-14.0 2.00-3.00 ^ ^ ^
TP316L 0.035 დ 2.00 0.045 0.030 1.00 16.0-18.0 10.0-15.0 2.00-3.00 ^ ^ ^
TP321 0.08 2.00 0.045 0.030 1.00 17.0-19.0 9.0-12.0 ^ ^ ^ 5C -0.70
TP347 0.08 2.00 0.045 0.030 1.00 17.0-19.0 9.0-12.0 10C -1.10 ^

 

მასალა სითბოს მკურნალობა ტემპერატურა F (C) მინ. სიხისტე
ბრინელი როკველი
TP304 გამოსავალი 1900 (1040) 192HBW/200HV 90 HRB
TP304L გამოსავალი 1900 (1040) 192HBW/200HV 90 HRB
TP316 გამოსავალი 1900 (1040) 192HBW/200HV 90 HRB
TP316L გამოსავალი 1900 (1040) 192HBW/200HV 90 HRB
TP321 გამოსავალი 1900(1040) ფ 192HBW/200HV 90 HRB
TP347 გამოსავალი 1900 (1040) 192HBW/200HV 90 HRB

 

OD, ინჩი OD ტოლერანტობის ინჩი (მმ) WT ტოლერანტობა % სიგრძის ტოლერანტობა ინჩი (მმ)
+ -
≤ 1/2 ± 0.005 (0.13) ± 15 1/8 (3.2) 0
> 1/2 ~ 1 1/2 ± 0.005 (0.13) ± 10 1/8 (3.2) 0
> 1 1/2 ~< 3 1/2 ± 0.010 (0.25) ± 10 3/16 (4.8) 0
> 3 1/2 ~< 5 1/2 ± 0.015 (0.38) ± 10 3/16 (4.8) 0
> 5 1/2 ~< 8 ± 0.030 (0.76) ± 10 3/16 (4.8) 0
8 ~ < 12 ± 0.040 (1.01) ± 10 3/16 (4.8) 0
12~<14 ± 0.050 (1.26) ± 10 3/16 (4.8) 0

ბუნებრივი მიკრობული თემები ფილოგენეტიკურად და მეტაბოლურად მრავალფეროვანია.გარდა ორგანიზმების არასაკმარისად შესწავლილი ჯგუფებისა1, ამ მრავალფეროვნებას ასევე აქვს მდიდარი პოტენციალი ეკოლოგიურად და ბიოტექნოლოგიურად მნიშვნელოვანი ფერმენტებისა და ბიოქიმიური ნაერთების აღმოჩენისთვის2,3.თუმცა, ამ მრავალფეროვნების შესწავლა გენომიური გზების დასადგენად, რომლებიც სინთეზირებენ ასეთ ნაერთებს და აკავშირებენ მათ შესაბამის მასპინძლებს, გამოწვევად რჩება.ღია ოკეანეში მიკროორგანიზმების ბიოსინთეზური პოტენციალი დიდწილად უცნობი რჩება გლობალური მასშტაბით გენომის სრული გარჩევადობის მონაცემების ანალიზში შეზღუდვების გამო.აქ ჩვენ ვიკვლევთ ოკეანეში ბიოსინთეზური გენების კლასტერების მრავალფეროვნებას და მრავალფეროვნებას კულტივირებული უჯრედებიდან და ცალკეული უჯრედებიდან დაახლოებით 10000 მიკრობული გენომის ინტეგრირებით 25000-ზე მეტი ახლად რეკონსტრუირებული გენომით 1000-ზე მეტი ზღვის წყლის ნიმუშებიდან.ამ მცდელობებმა გამოავლინა დაახლოებით 40,000 სავარაუდო, ძირითადად, ახალი ბიოსინთეზური გენის კლასტერი, რომელთაგან ზოგიერთი ნაპოვნი იქნა ადრე არასაეჭვო ფილოგენეტიკური ჯგუფებში.ამ პოპულაციებში ჩვენ გამოვავლინეთ ბიოსინთეზური გენების კლასტერებით გამდიდრებული ხაზი („Candidatus Eudormicrobiaceae“), რომელიც მიეკუთვნებოდა დაუმუშავებელ ბაქტერიულ ჯგუფს და მოიცავდა ბიოსინთეზურად ყველაზე მრავალფეროვან მიკროორგანიზმს ამ გარემოში.ამათგან ჩვენ დავახასიათეთ ფოსფატაზა-პეპტიდური და პიტონამიდური გზები, რომლებიც გამოვლენილია უჩვეულო ბიოაქტიური ნაერთების სტრუქტურისა და ფერმენტოლოგიის შესაბამისად.დასასრულს, ეს კვლევა აჩვენებს, თუ როგორ შეუძლია მიკრობიომზე დაფუძნებულ სტრატეგიებს საშუალება მისცეს ადრე აღუწერელი ფერმენტების და ბუნებრივი საკვების შესწავლა ცუდად გაგებულ მიკრობიოტასა და გარემოში.
მიკრობები მართავენ გლობალურ ბიოგეოქიმიურ ციკლებს, ინარჩუნებენ კვების ქსელებს და უნარჩუნებენ მცენარეებსა და ცხოველებს ჯანმრთელობას5.მათი უზარმაზარი ფილოგენეტიკური, მეტაბოლური და ფუნქციური მრავალფეროვნება წარმოადგენს მდიდარ პოტენციალს ახალი ტაქსონების1, ფერმენტების და ბიოქიმიური ნაერთების, მათ შორის ბუნებრივი პროდუქტების აღმოჩენისთვის6.ეკოლოგიურ საზოგადოებებში ეს მოლეკულები მიკროორგანიზმებს აწვდიან სხვადასხვა ფიზიოლოგიურ და ეკოლოგიურ ფუნქციებს, კომუნიკაციიდან კონკურენციამდე 2, 7 .გარდა მათი ორიგინალური ფუნქციებისა, ეს ბუნებრივი პროდუქტები და მათი გენეტიკურად კოდირებული წარმოების გზები იძლევა მაგალითებს ბიოტექნოლოგიურ და თერაპიულ გამოყენებაში2,3.ასეთი გზებისა და კავშირების იდენტიფიცირებას დიდად შეუწყო ხელი კულტივირებული მიკრობების შესწავლამ.თუმცა, ბუნებრივი გარემოს ტაქსონომიურმა კვლევებმა აჩვენა, რომ მიკროორგანიზმების დიდი უმრავლესობა არ არის გაშენებული8.ეს კულტურული მიკერძოება ზღუდავს ჩვენს უნარს, გამოვიყენოთ მრავალი მიკრობით კოდირებული ფუნქციური მრავალფეროვნება4,9.
ამ შეზღუდვების დასაძლევად, ბოლო ათწლეულის განმავლობაში ტექნოლოგიურმა მიღწევებმა მკვლევარებს საშუალება მისცა უშუალოდ (ანუ წინასწარი კულტურის გარეშე) მიკრობული დნმ-ის ფრაგმენტების თანმიმდევრობა მთელი თემებიდან (მეტაგენომიკა) ან ცალკეული უჯრედებიდან.ამ ფრაგმენტების უფრო დიდ გენომის ფრაგმენტებში შეკრების და მრავალი მეტაგენომიურად აწყობილი გენომის (MAGs) ან ცალკეული გაძლიერებული გენომის (SAGs) რეკონსტრუქციის შესაძლებლობა, შესაბამისად, ხსნის მიკრობიომის (ანუ მიკრობული თემები და მიკრობიომი) ტაქსოცენტრული კვლევების მნიშვნელოვან შესაძლებლობას.ახალი გზების გაყვანა.საკუთარი გენეტიკური მასალა მოცემულ გარემოში) 10,11,12.მართლაც, ბოლო კვლევებმა მნიშვნელოვნად გააფართოვა მიკრობული მრავალფეროვნების ფილოგენეტიკური წარმოდგენა დედამიწაზე1, 13 და გამოავლინა ფუნქციური მრავალფეროვნების დიდი ნაწილი ცალკეულ მიკრობულ თემებში, რომლებიც ადრე არ იყო დაფარული კულტივირებული მიკროორგანიზმების საცნობარო გენომის თანმიმდევრობით (REFs)14.მასპინძლის გენომის კონტექსტში ამოუცნობი ფუნქციური მრავალფეროვნების განთავსების შესაძლებლობა (ანუ გენომის გარჩევადობა) გადამწყვეტია ჯერ კიდევ დაუხასიათებელი მიკრობული ხაზების პროგნოზირებისთვის, რომლებიც სავარაუდოდ კოდირებენ ახალ ბუნებრივ პროდუქტებს15,16 ან ასეთი ნაერთების თავდაპირველ მწარმოებელმდე მიკვლევისთვის17.მაგალითად, კომბინირებულმა მეტაგენომიურმა და ერთუჯრედოვანმა გენომური ანალიზის მიდგომამ გამოიწვია Candidatus Entotheonella, მეტაბოლურად მდიდარი ღრუბელთან დაკავშირებული ბაქტერიების ჯგუფის იდენტიფიცირება, როგორც სხვადასხვა წამლის პოტენციალის მწარმოებელი18.თუმცა, მიუხედავად სხვადასხვა მიკრობული თემების გენომიური კვლევის ბოლო მცდელობისა,16,19 დედამიწის უდიდესი ეკოსისტემების ოკეანის გლობალური მეტაგენომიური მონაცემების ორ მესამედზე მეტი ჯერ კიდევ არ არის დაკარგული16,20.ამრიგად, ზოგადად, საზღვაო მიკრობიომის ბიოსინთეზური პოტენციალი და მისი პოტენციალი, როგორც ახალი ფერმენტული და ბუნებრივი პროდუქტების საცავი, დიდწილად არ არის შესწავლილი.
ზღვის მიკრობიომების ბიოსინთეზური პოტენციალის გლობალური მასშტაბის შესასწავლად, ჩვენ პირველად გავაერთიანეთ საზღვაო მიკრობული გენომები, რომლებიც მიღებულია კულტურაზე დამოკიდებული და არაკულტურული მეთოდების გამოყენებით, რათა შეგვექმნა ფილოგენეტიკისა და გენის ფუნქციის ვრცელი მონაცემთა ბაზა.ამ მონაცემთა ბაზის შესწავლამ გამოავლინა ბიოსინთეზური გენების კლასტერების (BGC) მრავალფეროვნება, რომელთა უმეტესობა მიეკუთვნება ჯერ კიდევ დაუხასიათებელ გენების კლასტერის (GCF) ოჯახებს.გარდა ამისა, ჩვენ გამოვავლინეთ უცნობი ბაქტერიების ოჯახი, რომელიც დღემდე ავლენს BGC-ების ყველაზე ცნობილ მრავალფეროვნებას ღია ოკეანეში.ჩვენ შევარჩიეთ ორი რიბოსომური სინთეზი და პოსტტრანსლაციურად მოდიფიცირებული პეპტიდური (RiPP) გზა ექსპერიმენტული ვალიდაციისთვის, მათი გენეტიკური განსხვავებების საფუძველზე ამჟამად ცნობილი გზებისგან.ამ გზების ფუნქციურმა დახასიათებამ გამოავლინა ფერმენტოლოგიის მოულოდნელი მაგალითები, ისევე როგორც სტრუქტურულად უჩვეულო ნაერთები პროტეაზას ინჰიბიტორული აქტივობით.
თავდაპირველად, ჩვენ მიზნად ისახავდა გენომის ანალიზისთვის გლობალური მონაცემთა რესურსის შექმნას, ფოკუსირებული მის ბაქტერიულ და არქეულ კომპონენტებზე.ამ მიზნით, ჩვენ გავაერთიანეთ მეტაგენომიური მონაცემები და 1038 ზღვის წყლის ნიმუში 215 გლობალურად გავრცელებული სინჯის აღების ადგილიდან (გრძედი დიაპაზონი = 141,6°) და რამდენიმე ღრმა ფენა (1-დან 5600 მ სიღრმემდე, რომელიც მოიცავს პელაგიურ, მეზოპელაგიურ და უფსკრული ზონებს).Background21,22,23 (ნახ. 1a, გაფართოებული მონაცემები, ნახ. 1a და დამატებითი ცხრილი 1).ფართო გეოგრაფიული დაფარვის გარდა, ამ შერჩევით გაფილტრულმა ნიმუშებმა საშუალება მოგვცა შეგვედარებინა საზღვაო მიკრობიომის სხვადასხვა კომპონენტები, მათ შორის ვირუსებით მდიდარი (<0.2 μm), პროკარიოტებით მდიდარი (0.2-3 μm), ნაწილაკებით მდიდარი (0.8 μm). ).–20 მკმ) და ვირუსით დაცლილი (>0,2 მკმ) კოლონიები.
ა, საზღვაო მიკრობული თემების 1038 საჯაროდ ხელმისაწვდომი გენომი (მეტაგენომიკა) შეგროვებული 215 გლობალურად განაწილებული ადგილიდან (62°S-დან 79°N-მდე და 179°W-დან 179°E .).რუკის ფილები © Esri.წყაროები: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ და Esri.ბ, ეს მეტაგენომები გამოიყენეს MAG-ების (მეთოდები და დამატებითი ინფორმაცია) რეკონსტრუქციისთვის, რომლებიც განსხვავდებიან რაოდენობრივად და ხარისხით (მეთოდები) მონაცემთა ნაკრებებში (მონიშნული ფერით).რეკონსტრუქციულ MAG-ებს დაემატა საჯაროდ ხელმისაწვდომი (გარე) გენომები, მათ შორის ხელნაკეთი MAG26, SAG27 და REF.27 შეადგინეთ OMD.გ, წინა ანგარიშებთან შედარებით მხოლოდ SAG (GORG)20 ან MAG (GEM)16-ზე დაფუძნებული, OMD აუმჯობესებს საზღვაო მიკრობული თემების გენომიურ დახასიათებას (მეტაგენომიური წაკითხვის რუკების სიჩქარე; მეთოდი) ორჯერ სამჯერ უფრო თანმიმდევრული წარმოდგენით სიღრმისეულად და გრძედი..<0.2, n=151, 0.2-0.8, n=67, 0.2-3, n=180, 0.8-20, n=30, >0.2, n=610, <30°, n = 132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, OMD დაჯგუფება სახეობების კლასტერების დონეზე (95% საშუალო ნუკლეოტიდის იდენტურობა) განსაზღვრავს სულ დაახლოებით 8300 სახეობა, რომელთა ნახევარზე მეტი ადრე არ იყო დახასიათებული ტაქსონომიური ანოტაციების მიხედვით GTDB (ვერსია 89) e, სახეობების კლასიფიკაციამ გენომის ტიპის მიხედვით აჩვენა, რომ MAG, SAG და REFs კარგად ავსებენ ერთმანეთს ფილოგენეტიკური მრავალფეროვნების ასახვისას. საზღვაო მიკრობიომი.კერძოდ, სახეობების 55%, 26% და 11% სპეციფიკური იყო MAG, SAG და REF შესაბამისად.ღამურები, ბერმუდის ატლანტიკური დროის სერია;GEM, დედამიწის მიკრობიომის გენომი;GORG, გლობალური ოკეანის საცნობარო გენომი;ცხელი, ჰავაის ოკეანის დროის სერია.
ამ მონაცემთა ნაკრების გამოყენებით, ჩვენ აღვადგინეთ სულ 26,293 MAG, ძირითადად ბაქტერიული და არქეული (ნახ. 1b და გაფართოებული მონაცემები, ნახ. 1b).ჩვენ შევქმენით ეს MAG-ები შეკრებებისგან ცალკე და არა გაერთიანებული მეტაგენომიური ნიმუშებიდან, რათა თავიდან ავიცილოთ ბუნებრივი თანმიმდევრობის ცვალებადობის კოლაფსი სხვადასხვა ადგილიდან ან დროის წერტილებიდან (მეთოდები) ნიმუშებს შორის.გარდა ამისა, ჩვენ დავაჯგუფეთ გენომის ფრაგმენტები მათი გავრცელების კორელაციების მიხედვით ნიმუშების დიდ რაოდენობაში (58-დან 610-მდე ნიმუში, კვლევის მიხედვით; მეთოდი).ჩვენ აღმოვაჩინეთ, რომ ეს არის შრომატევადი, მაგრამ მნიშვნელოვანი ნაბიჯი24, რომელიც გამოტოვებულია რამდენიმე ფართომასშტაბიანი MAG16, 19, 25 სარეკონსტრუქციო სამუშაოების დროს და მნიშვნელოვნად აუმჯობესებს რაოდენობას (საშუალოდ 2,7-ჯერ) და ხარისხს (საშუალოდ +20%). გენომი.რეკონსტრუირებულია აქ შესწავლილი საზღვაო მეტაგენომიდან (გაფართოებული მონაცემები, სურ. 2a და დამატებითი ინფორმაცია).საერთო ჯამში, ამ მცდელობებმა გამოიწვია საზღვაო მიკრობული MAG-ების 4,5-ჯერ ზრდა (6-ჯერ თუ მხოლოდ მაღალი ხარისხის MAG-ები განიხილება) შედარებით ყველაზე ყოვლისმომცველ MAG რესურსთან შედარებით, რომელიც დღეს ხელმისაწვდომია16 (მეთოდები).ეს ახლად შექმნილი MAG კომპლექტი გაერთიანდა 830 ხელით შერჩეულ MAG26-თან, 5969 SAG27-თან და 1707 REF-თან.ზღვის ბაქტერიების და არქეების ოცდაშვიდი სახეობა შეადგენდა 34799 გენომის კომბინატორულ კოლექციას (ნახ. 1b).
შემდეგ ჩვენ შევაფასეთ ახლად შექმნილი რესურსი, რათა გავაუმჯობესოთ მისი უნარი, წარმოაჩინოს საზღვაო მიკრობული თემები და შევაფასოთ სხვადასხვა გენომის ტიპების ინტეგრაციის გავლენა.საშუალოდ, ჩვენ აღმოვაჩინეთ, რომ ის მოიცავს საზღვაო მეტაგენომიური მონაცემების დაახლოებით 40-60%-ს (სურათი 1c), ორჯერ ან სამჯერ აღემატება წინა MAG მოხსენებებს, როგორც სიღრმეში, ასევე გრძედზე More serial 16 ან SAG20.გარდა ამისა, დადგენილ კოლექციებში ტაქსონომიური მრავალფეროვნების სისტემატური გაზომვის მიზნით, ჩვენ დავაფიქსირეთ ყველა გენომი გენომის ტაქსონომიის მონაცემთა ბაზის (GTDB) ინსტრუმენტარიუმის (მეთოდების) გამოყენებით და გამოვიყენეთ საშუალო გენომის ფართო ნუკლეოტიდის იდენტურობა 95%.28 8304 სახეობის მტევნის (სახეობის) იდენტიფიცირებისთვის.ამ სახეობების ორი მესამედი (მათ შორის ახალი კლადები) ადრე არ გამოჩენილა GTDB-ში, რომელთაგან 2790 აღმოაჩინეს ამ კვლევაში რეკონსტრუირებული MAG-ის გამოყენებით (ნახ. 1დ).გარდა ამისა, ჩვენ აღმოვაჩინეთ, რომ სხვადასხვა ტიპის გენომები ძალზე ავსებენ ერთმანეთს: სახეობების 55%, 26% და 11% მთლიანად შედგება MAG, SAG და REF, შესაბამისად (ნახ. 1e).გარდა ამისა, MAG მოიცავდა წყლის სვეტში ნაპოვნი 49-ვე ტიპს, ხოლო SAG და REF მხოლოდ 18 და 11 მათგანს წარმოადგენდნენ, შესაბამისად.თუმცა, SAG უკეთ წარმოაჩენს ყველაზე გავრცელებული კლადების მრავალფეროვნებას (გაფართოებული მონაცემები, სურ. 3a), როგორიცაა Pelagic Bacteriales (SAR11), სადაც SAG მოიცავს თითქმის 1300 სახეობას და MAG მხოლოდ 390 სახეობას.აღსანიშნავია, რომ REFs იშვიათად ემთხვეოდა MAG-ს ან SAG-ს სახეობების დონეზე და წარმოადგენდა დაახლოებით 1000 გენომის >95%-ს, რომელიც არ არის ნაპოვნი ღია ოკეანის მეტაგენომიურ ნაკრებებში, ძირითადად, სხვა ტიპის იზოლირებულ წარმომადგენლობით საზღვაო ნიმუშებთან ურთიერთქმედების გამო (მაგ. ნალექები). .ან მასპინძელ-ასოცირებული).სამეცნიერო საზოგადოებისთვის ფართოდ მისაწვდომად, ეს საზღვაო გენომის რესურსი, რომელიც ასევე მოიცავს არაკლასიფიცირებულ ფრაგმენტებს (მაგ., პროგნოზირებული ფაგებიდან, გენომის კუნძულებიდან და გენომის ფრაგმენტებიდან, რომლებისთვისაც არ არის საკმარისი მონაცემები MAG-ის რეკონსტრუქციისთვის), შეიძლება შევადაროთ ტაქსონომიურ მონაცემებს. .წვდომა ანოტაციებზე გენის ფუნქციასთან და კონტექსტურ პარამეტრებთან ერთად ოკეანის მიკრობიოლოგიის მონაცემთა ბაზაში (OMD; https://microbiomics.io/ocean/).
შემდეგ ჩვენ დავიწყეთ შეგვესწავლა ბიოსინთეზური პოტენციალის სიმდიდრე და სიახლე ღია ოკეანის მიკრობიომებში.ამ მიზნით, ჩვენ პირველად გამოვიყენეთ antiSMASH ყველა MAG-ისთვის, SAG-ისთვის და REF-ისთვის, რომლებიც ნაპოვნი იქნა 1038 საზღვაო მეტაგენომებში (მეთოდებში), რათა ვიწინასწარმეტყველოთ სულ 39,055 BGC.შემდეგ ჩვენ დავაჯგუფეთ ისინი 6907 არაზედმეტად GCF-ად და 151 გენის კლასტერ პოპულაციად (GCC; დამატებითი ცხრილი 2 და მეთოდები) თანდაყოლილი ჭარბი (ანუ იგივე BGC შეიძლება იყოს კოდირებული მრავალ გენომში) და მეტაგენომიური მონაცემები კონცენტრირებული BGC-ების ფრაგმენტაციისთვის.არასრული BGC-ები მნიშვნელოვნად არ გაზრდილა, ასეთის არსებობის შემთხვევაში (დამატებითი ინფორმაცია), GCF-ების და GCC-ების რაოდენობა, შესაბამისად, რომლებიც შეიცავდნენ მინიმუმ ერთ ხელუხლებელ BGC წევრს შემთხვევების 44% და 86%-ში.
GCC-ის დონეზე ჩვენ აღმოვაჩინეთ პროგნოზირებული RiPP-ების და სხვა ბუნებრივი პროდუქტების ფართო არჩევანი (ნახ. 2a).მათ შორის, მაგალითად, არილპოლიენები, კაროტინოიდები, ექტოინები და სიდეროფორები მიეკუთვნება GCC-ებს ფართო ფილოგენეტიკური გავრცელებით და მაღალი სიმრავლით ოკეანის მეტაგენომებში, რაც შეიძლება მიუთითებდეს მიკროორგანიზმების ფართო ადაპტაციაზე საზღვაო გარემოსთან, მათ შორის რეაქტიული ჟანგბადის სახეობებისადმი წინააღმდეგობის ჩათვლით. ოქსიდაციური და ოსმოსური სტრესი..ან რკინის შეწოვა (დამატებითი ინფორმაცია).ეს ფუნქციონალური მრავალფეროვნება ეწინააღმდეგება NCBI RefSeq მონაცემთა ბაზაში შენახულ დაახლოებით 190000 გენომს შორის დაახლოებით 1.2 მილიონი BGC-ის ბოლო ანალიზს (BiG-FAM/RefSeq, შემდგომში RefSeq)29, რომელმაც აჩვენა, რომ არარიბოსომური სინთეტაზას სინთეტაზას პეპტიდები და კეტიდი (PKS) BGCs (დამატებითი ინფორმაცია).ჩვენ ასევე აღმოვაჩინეთ 44 (29%) GCC მხოლოდ დისტანციურად დაკავშირებული ნებისმიერ RefSeq BGC-თან (\(\bar{d}\)RefSeq > 0.4; ნახ. 2a და მეთოდები) და 53 (35%) GCC მხოლოდ MAG-ში, რაც ხაზს უსვამს პოტენციალს OMD-ში ადრე აუწერელი ქიმიკატების გამოსავლენად.იმის გათვალისწინებით, რომ თითოეული ეს GCC, სავარაუდოდ, წარმოადგენს უაღრესად მრავალფეროვან ბიოსინთეზურ ფუნქციებს, ჩვენ შემდგომ გავაანალიზეთ მონაცემები GCF დონეზე, რათა მოგვეწოდებინა BGC-ების უფრო დეტალური დაჯგუფება, რომლებიც ნავარაუდევია მსგავსი ბუნებრივი პროდუქტების კოდირებას29.სულ 3861 (56%) იდენტიფიცირებული GCF არ ემთხვეოდა RefSeq-ს და GCF-ების >97% არ იყო წარმოდგენილი MIBiG-ში, ექსპერიმენტულად დადასტურებული BGC-ების ერთ-ერთ უდიდეს მონაცემთა ბაზაში (სურათი 2b).მიუხედავად იმისა, რომ გასაკვირი არ არის ბევრი პოტენციური ახალი ბილიკის აღმოჩენა იმ პარამეტრებში, რომლებიც კარგად არ არის წარმოდგენილი საცნობარო გენომით, ჩვენი მეთოდი BGC-ების GCF-ებად გადანაწილების ეტალონამდე განსხვავდება წინა მოხსენებებისგან 16 და საშუალებას გვაძლევს მივაწოდოთ სიახლის მიუკერძოებელი შეფასება.ახალი მრავალფეროვნების უმეტესი ნაწილი (3012 GCF ან 78%) შეესაბამება პროგნოზირებულ ტერპენებს, RiPP-ს ან სხვა ბუნებრივ პროდუქტებს და უმეტესობა (1815 GCF ან 47%) დაშიფრულია უცნობ ტიპებში მათი ბიოსინთეზური პოტენციალის გამო.PKS და NRPS კლასტერებისგან განსხვავებით, ეს კომპაქტური BGCs ნაკლებად სავარაუდოა, რომ ფრაგმენტული იყოს მეტაგენომიური ასამბლეის დროს 31 და იძლევა უფრო მეტი დროისა და რესურსების ინტენსიური ფუნქციონალური დახასიათების საშუალებას მათი პროდუქტების.
სულ 39055 BGC იყო დაჯგუფებული 6907 GCF და 151 GCC.ა, მონაცემთა წარმოდგენა (შიდა გარე).BGC მანძილების იერარქიული დაჯგუფება GCC-ზე დაფუძნებული, რომელთაგან 53 ფიქსირდება მხოლოდ MAG-ით.GCC შეიცავს BGC-ებს სხვადასხვა ტაქსონებიდან (ln-ტრანსფორმირებული კარიბჭის სიხშირე) და სხვადასხვა BGC კლასებიდან (წრის ზომა შეესაბამება მის სიხშირეს).თითოეული GCC-სთვის, გარე შრე წარმოადგენს BGC-ების რაოდენობას, გავრცელებას (ნიმუშების პროცენტი) და მანძილს (მინიმალური BGC კოსინუსური მანძილი (min(dMIBiG))) BiG-FAM-დან BGC-მდე.GCC-ები BGC-ებით, რომლებიც მჭიდროდ არის დაკავშირებული ექსპერიმენტულად დამოწმებულ BGC-ებთან (MIBiG) მონიშნულია ისრებით.b GCF პროგნოზირებულ (BiG-FAM) და ექსპერიმენტულად დადასტურებულ (MIBiG) BGC-ებთან შედარებით, ნაპოვნია 3861 ახალი (d–>0.2) GCF.ამ კოდის უმეტესობა (78%) RiPP-ისთვის, ტერპენებისთვის და სხვა სავარაუდო ნატურალური პროდუქტებისთვის.c, ყველა გენომი OMD-ში, რომელიც ნაპოვნია 1038 საზღვაო მეტაგენომებში, განთავსებული იყო GTDB საბაზისო ხეში, რათა ეჩვენებინა OMD-ის ფილოგენეტიკური დაფარვა.კლადები ყოველგვარი გენომის გარეშე OMD-ში ნაჩვენებია ნაცრისფერში.BGC-ების რაოდენობა შეესაბამება პროგნოზირებულ BGC-ების უდიდეს რაოდენობას გენომზე მოცემულ კლადში.სიცხადისთვის, კვანძების ბოლო 15% იშლება.ისრები მიუთითებს BGC-ით მდიდარ კლადებზე (>15 BGC), გარდა Mycobacterium, Gordonia (მეორე Rhodococcus-ის შემდეგ) და Crocosphaera (მეორე მხოლოდ Synechococcus-ის შემდეგ).დ, უცნობი გ.Eremiobacerota-მ აჩვენა ყველაზე მაღალი ბიოსინთეზური მრავალფეროვნება (შანონის ინდექსი ბუნებრივი პროდუქტის ტიპზე დაყრდნობით).თითოეული ზოლი წარმოადგენს გენომს, რომელსაც აქვს ყველაზე მეტი BGC სახეობაში.T1PKS, PKS ტიპის I, T2/3PKS, PKS ტიპის II და ტიპი III.
სიმდიდრისა და სიახლის გარდა, ჩვენ ვიკვლევთ საზღვაო მიკრობიომის ბიოსინთეზური პოტენციალის ბიოგეოგრაფიულ სტრუქტურას.ნიმუშების დაჯგუფებამ საშუალო მეტაგენომიური GCF ასლის ნომრის განაწილების მიხედვით (მეთოდები) აჩვენა, რომ დაბალი განედებით, ზედაპირული, პროკარიოტიკით მდიდარი და ვირუსით ღარიბი თემები, ძირითადად ზედაპირული ან უფრო ღრმა მზით განათებული წყლებით, მდიდარი იყო RiPP და BGC ტერპენებით.ამის საპირისპიროდ, პოლარული, ღრმა ზღვის, ვირუსებით და ნაწილაკებით მდიდარი თემები ასოცირდებოდა NRPS-ისა და PKS BGC-ის უფრო მეტ სიმრავლესთან (გაფართოებული მონაცემები, სურ. 4 და დამატებითი ინფორმაცია).საბოლოოდ, ჩვენ აღმოვაჩინეთ, რომ კარგად შესწავლილი ტროპიკული და პელაგიური თემები ახალი ტერპენების ყველაზე პერსპექტიული წყაროა (Augmented Data Figure).ყველაზე მაღალი პოტენციალი PKS, RiPP და სხვა ბუნებრივი პროდუქტებისთვის (სურათი 5a გაფართოებული მონაცემებით).
საზღვაო მიკრობიომების ბიოსინთეზური პოტენციალის შესწავლის დასასრულებლად, ჩვენ მიზნად დავისახეთ მათი ფილოგენეტიკური განაწილების რუკა და ახალი BGC-ით გამდიდრებული კლადების გამოვლენა.ამ მიზნით, ჩვენ განვათავსეთ საზღვაო მიკრობების გენომი ნორმალიზებულ GTDB13 ბაქტერიულ და არქეულ ფილოგენეტიკურ ხეში და გადავაფარეთ სავარაუდო ბიოსინთეზური გზები, რომლებსაც ისინი კოდირებენ (ნახ. 2c).ჩვენ ადვილად აღმოვაჩინეთ BGC-ით გამდიდრებული კლადები (წარმოდგენილი 15-ზე მეტი BGC-ით) ზღვის წყლის ნიმუშებში (მეთოდები), რომლებიც ცნობილია მათი ბიოსინთეზური პოტენციალით, როგორიცაა ციანობაქტერიები (Synechococcus) და პროტეუსის ბაქტერიები, როგორიცაა Tistrella32,33, ან ცოტა ხნის წინ მიიპყრო ყურადღება მათი გამო. ნატურალური პროდუქტები.როგორიცაა Myxococcota (Sandaracinaceae), Rhodococcus და Planctomycetota34,35,36.საინტერესოა, რომ ჩვენ აღმოვაჩინეთ რამდენიმე ადრე შეუსწავლელი ხაზი ამ კლადებში.მაგალითად, ის სახეობები, რომლებსაც აქვთ უმდიდრესი ბიოსინთეზური პოტენციალი phyla Planctomycetota-სა და Myxococcota-ში, მიეკუთვნებოდნენ, შესაბამისად, დაუხასიათებელ კანდიდატურ რიგებს და გვარებს (დამატებითი ცხრილი 3).ერთად აღებული, ეს ვარაუდობს, რომ OMD უზრუნველყოფს წვდომას მანამდე უცნობ ფილოგენეტიკურ ინფორმაციაზე, მიკროორგანიზმების ჩათვლით, რომლებიც შეიძლება წარმოადგენდეს ფერმენტების და ბუნებრივი პროდუქტების აღმოჩენის ახალ სამიზნეებს.
შემდეგი, ჩვენ დავახასიათეთ BGC-ით გამდიდრებული კლადი არა მხოლოდ მისი წევრების მიერ დაშიფრული BGC-ების მაქსიმალური რაოდენობის დათვლით, არამედ ამ BGC-ების მრავალფეროვნების შეფასებით, რაც ხსნის სხვადასხვა ტიპის ბუნებრივი კანდიდატი პროდუქტების სიხშირეს (ნახ. 2c და მეთოდები. )..ჩვენ აღმოვაჩინეთ, რომ ამ კვლევაში ბიოსინთეზურად ყველაზე მრავალფეროვანი სახეობები წარმოდგენილი იყო სპეციალურად ინჟინერირებული ბაქტერიული MAG-ებით.ეს ბაქტერიები მიეკუთვნება დაუმუშავებელ Candidatus Eremiobacerota-ს, რომელიც რჩება დიდწილად შეუსწავლელი რამდენიმე გენომიური კვლევის გარდა37,38.აღსანიშნავია, რომ „დაახლ.Eremiobacerota გვარი გაანალიზებულია მხოლოდ ხმელეთის გარემოში39 და ცნობილია, რომ არ შეიცავს BGC-ში გამდიდრებულ წევრებს.აქ ჩვენ აღვადგინეთ ერთი და იგივე სახეობის რვა MAG (ნუკლეოტიდის იდენტურობა > 99%) 23. ამიტომ, ჩვენ ვთავაზობთ სახეობის სახელს „Candidatus Eudoremicrobium malaspinii“, ნერეიდის (ზღვის ნიმფის) სახელს, რომელიც მშვენიერი საჩუქარია ბერძნულ მითოლოგიასა და ექსპედიციებში.'კა.ფილოგენეტიკური ანოტაციის მიხედვით 13, E. malaspinii-ს არ ჰყავს ადრე ცნობილი ნათესავები მიმდევრობის დონის ქვემოთ და, შესაბამისად, მიეკუთვნება ახალ ბაქტერიულ ოჯახს, რომელსაც ჩვენ გთავაზობთ „Ca.E. malaspinii“, როგორც სახეობის სახეობა და „Ca.Eudormicrobiaceae“, როგორც ოფიციალური სახელი (დამატებითი ინფორმაცია).მოკლე მეტაგენომიური რეკონსტრუქცია 'Ca.E. malaspinii გენომის პროექტი დადასტურდა ძალიან დაბალი შეყვანის, ხანგრძლივი წაკითხული მეტაგენომიური თანმიმდევრობით და ერთი ნიმუშის მიზანმიმართული შეკრებით (მეთოდები), როგორც ერთი 9.63 Mb ხაზოვანი ქრომოსომა 75 kb დუბლირებით.როგორც ერთადერთი დარჩენილი გაურკვევლობა.
ამ სახეობის ფილოგენეტიკური კონტექსტის დასადგენად, ჩვენ მოვძებნეთ 40 მჭიდროდ დაკავშირებული სახეობა ტარას ოკეანის ექსპედიციიდან ევკარიოტიკით გამდიდრებულ მეტაგენომიურ ნიმუშებში მიზნობრივი გენომის რეკონსტრუქციის გზით.მოკლედ, ჩვენ დავუკავშირეთ მეტაგენომიური წაკითხვები გენომიურ ფრაგმენტებს, რომლებიც დაკავშირებულია „Ca.E. malaspinii“ და წამოაყენა ჰიპოთეზა, რომ გაზრდილი რეკრუტირების მაჩვენებელი ამ ნიმუშში მიუთითებს სხვა ნათესავების (მეთოდების) არსებობაზე.შედეგად, ჩვენ ვიპოვეთ 10 MAG, 19 MAG-ის კომბინაცია, რომელიც წარმოადგენს ხუთ სახეობას სამ გვარში ახლად განსაზღვრულ ოჯახში (ანუ „Ca. Eudormicrobiaceae“).ხელით შემოწმებისა და ხარისხის კონტროლის შემდეგ (გაფართოებული მონაცემები, სურ. 6 და დამატებითი ინფორმაცია), აღმოვაჩინეთ, რომ „Ca.Eudormicrobiaceae სახეობებს აქვთ უფრო დიდი გენომი (8 Mb) და უფრო მდიდარი ბიოსინთეზური პოტენციალი (14-დან 22 BGC თითო სახეობაზე), ვიდრე სხვა "Ca" წევრები.Clade Eremiobacerota (7 BGC-მდე) (ნახ. 3a–c).
a, ფილოგენეტიკური პოზიციები ხუთი 'Ca.Eudormicrobiaceae-ს სახეობებმა აჩვენეს BGC სიმდიდრე, სპეციფიკური ამ კვლევაში გამოვლენილი საზღვაო ხაზებისთვის.ფილოგენეტიკური ხე მოიცავს ყველა "Ca.MAG Eremiobacerota და სხვა ფილას წევრები (გენომის რიცხვები ფრჩხილებში) მოწოდებული GTDB-ში (ვერსია 89) გამოიყენებოდა ევოლუციური ფონისთვის (მეთოდები).ყველაზე გარე შრეები წარმოადგენს კლასიფიკაციას ოჯახის დონეზე („Ca. Eudormicrobiaceae“ და „Ca. Xenobiaceae“) და კლასის დონეზე („Ca. Eremiobacteria“).ამ კვლევაში აღწერილი ხუთი სახეობა წარმოდგენილია ალფანუმერული კოდებით და შემოთავაზებული ბინომიული სახელებით (დამატებითი ინფორმაცია).ბ, კარგი.Eudormicrobiaceae სახეობებს აქვთ შვიდი საერთო BGC ბირთვი.BGC-ის არარსებობა A2 კლადში განპირობებული იყო წარმომადგენლობითი MAG-ის არასრულყოფილებით (დამატებითი ცხრილი 3).BGC-ები სპეციფიკურია „Ca.ამფიტომიკრობიუმი“ და „Ca.ამფიტომიკრობიუმი“ (კლადები A და B) არ არის ნაჩვენები.c, ყველა BGC კოდირებულია როგორც „Ca.აღმოჩნდა, რომ Eudoremicrobium taraoceanii გამოხატული იყო 623 მეტატრანსკრიპტომში, რომლებიც აღებულია ტარას ოკეანეებიდან.მყარი წრეები მიუთითებს აქტიურ ტრანსკრიფციაზე.ნარინჯისფერი წრეები აღნიშნავენ log2-ტრანსფორმირებულ ნაოჭების ცვლილებებს დიასახლისი გენის გამოხატვის სიჩქარის ქვემოთ და ზემოთ (მეთოდები).d, ფარდობითი სიმრავლის მრუდები (მეთოდები), რომლებიც აჩვენებს 'Ca.Eudormicrobiaceae-ის სახეობები გავრცელებულია უმეტეს ოკეანის აუზებში და წყლის მთელ სვეტში (ზედაპირიდან მინიმუმ 4000 მ სიღრმემდე).ამ შეფასებებზე დაყრდნობით, ჩვენ აღმოვაჩინეთ, რომ „Ca.E. malaspinii' შეადგენს პროკარიოტული უჯრედების 6%-მდე ღრმა ზღვის პელაგიურ მარცვლებთან ასოცირებულ თემებში.ჩვენ მივიჩნიეთ, რომ სახეობა იმყოფება ადგილზე, თუ იგი აღმოჩენილია მოცემული სიღრმის ფენის ზომის რომელიმე ფრაქციაში.IO – ინდოეთის ოკეანე, NAO – ჩრდილო ატლანტიკური, NPO – ჩრდილოეთ წყნარი ოკეანე, RS – წითელი ზღვა, SAO – სამხრეთ ატლანტიკური, SO – სამხრეთ ოკეანე, SPO – სამხრეთ წყნარი ოკეანე.
Ca-ის სიმრავლისა და განაწილების შესწავლა.Eudormicrobiaceae, რომელიც, როგორც აღმოვაჩინეთ, ჭარბობს ოკეანის აუზების უმეტესობაში, ისევე როგორც მთელ წყლის სვეტში (ნახ. 3d).ადგილობრივად, ისინი შეადგენენ საზღვაო მიკრობული საზოგადოების 6%-ს, რაც მათ გლობალური საზღვაო მიკრობიომის მნიშვნელოვან ნაწილად აქცევს.გარდა ამისა, აღმოვაჩინეთ Ca-ს შედარებითი შინაარსი.Eudormicrobiaceae სახეობები და მათი BGC გამოხატვის დონეები ყველაზე მაღალი იყო ევკარიოტით გამდიდრებულ ფრაქციაში (ნახ. 3c და გაფართოებული მონაცემები, სურ. 7), რაც მიუთითებს შესაძლო ურთიერთქმედებას ნაწილაკებთან, მათ შორის პლანქტონთან.ეს დაკვირვება გარკვეულწილად ჰგავს 'Ca.Eudoremicrobium BGCs, რომლებიც აწარმოებენ ციტოტოქსიურ ბუნებრივ პროდუქტებს ცნობილი გზებით, შეიძლება გამოავლინონ მტაცებლური ქცევა (დამატებითი ინფორმაცია და გაფართოებული მონაცემები, სურათი 8), ისევე როგორც სხვა მტაცებლები, რომლებიც სპეციალურად აწარმოებენ მეტაბოლიტებს, როგორიცაა Myxococcus41.Ca-ს აღმოჩენა.Eudormicrobiaceae ნაკლებად ხელმისაწვდომი (ღრმა ოკეანე) ან ევკარიოტული და არა პროკარიოტული ნიმუშები შეიძლება ახსნას, თუ რატომ რჩება ეს ბაქტერიები და მათი მოულოდნელი BGC მრავალფეროვნება ბუნებრივი საკვების კვლევის კონტექსტში.
საბოლოო ჯამში, ჩვენ ვცდილობდით ექსპერიმენტულად დაგვედასტურებინა ჩვენი მიკრობიომზე დაფუძნებული სამუშაოს დაპირება ახალი გზების, ფერმენტების და ბუნებრივი პროდუქტების აღმოჩენაში.BGC-ების სხვადასხვა კლასებს შორის, RiPP გზა ცნობილია, რომ კოდირებს მდიდარ ქიმიურ და ფუნქციურ მრავალფეროვნებას სექსუალურ ფერმენტების მიერ ძირითადი პეპტიდის სხვადასხვა პოსტტრანსლაციური მოდიფიკაციების გამო42.ასე რომ, ჩვენ ავირჩიეთ ორი Ca.Eudoremicrobium' RiPP BGCs (სურათები 3b და 4a-e) ეფუძნება იგივე, რაც ნებისმიერ ცნობილ BGC-ს (\(\bar{d}\)MIBiG და \(\bar{d}\)RefSeq 0.2 ზემოთ) .
a–c, ინ ვიტრო ჰეტეროლოგიური ექსპრესია და ინ ვიტრო ფერმენტული ანალიზი ახალი (\(\bar{d}\)RefSeq = 0.29) კასეტური RiPP ბიოსინთეზის სპეციფიკური ღრმა ზღვის Ca სახეობებისთვის.E. malaspinii-მ გამოიწვია დიფოსფორილირებული პროდუქტების წარმოება.c, მოდიფიკაციები გამოვლენილი მაღალი გარჩევადობის (HR) MS/MS (ფრაგმენტაცია მითითებული b და y იონებით ქიმიურ სტრუქტურაში) და NMR (გაფართოებული მონაცემები, ნახ. 9) გამოყენებით.დ, ეს ფოსფორილირებული პეპტიდი ავლენს ძუძუმწოვრების ნეიტროფილ ელასტაზას დაბალ მიკრომოლარულ ინჰიბიციას, რომელიც არ არის ნაპოვნი საკონტროლო პეპტიდში და დეჰიდრატაციულ პეპტიდში (ქიმიური მოცილება გამოწვეული დეჰიდრატაცია).ექსპერიმენტი სამჯერ განმეორდა მსგავსი შედეგებით.მაგალითად, ცილის ბიოსინთეზის მეორე რომანის \(\bar{d}\)RefSeq = 0.33) კლასტერის ჰეტეროლოგიური გამოხატულება ნათელყოფს ოთხი მომწიფებული ფერმენტის ფუნქციას, რომლებიც ცვლის 46 ამინომჟავის ბირთვის პეპტიდს.ნარჩენები შეღებილია მოდიფიკაციის ადგილის მიხედვით, რომელიც პროგნოზირებულია HR-MS/MS, იზოტოპური მარკირებით და NMR ანალიზით (დამატებითი ინფორმაცია).წყვეტილი შეფერილობა მიუთითებს იმაზე, რომ მოდიფიკაცია ხდება ორივე ნარჩენზე.ფიგურა არის მრავალი ჰეტეროლოგიური კონსტრუქციის ნაკრები, რომელიც აჩვენებს ყველა მომწიფებული ფერმენტის აქტივობას ერთსა და იმავე ბირთვზე.თ, NMR მონაცემების ილუსტრაცია ხერხემლის ამიდის N-მეთილაციისთვის.სრული შედეგები ნაჩვენებია ნახ.10 გაფართოებული მონაცემებით.i, მომწიფებული FkbM ცილის კლასტერული ფერმენტის ფილოგენეტიკური პოზიცია MIBiG 2.0 მონაცემთა ბაზაში ნაპოვნი FkbM დომენებს შორის ავლენს ამ ოჯახის ფერმენტს N-მეთილტრანსფერაზას აქტივობით (დამატებითი ინფორმაცია).ნაჩვენებია BGCs (a, e), წინამორბედი პეპტიდური სტრუქტურების (b, f) და ნატურალური პროდუქტების სავარაუდო ქიმიური სტრუქტურების (c, g) სქემატური დიაგრამები.
პირველი RiPP ბილიკი (\(\bar{d}\)MIBiG = 0.41, \(\bar{d}\)RefSeq = 0.29) ნაპოვნია მხოლოდ ღრმა ზღვის სახეობებში „Ca.E. malaspinii“ და პეპტიდის წინამორბედის კოდები (ნახ. 4a, b).ამ სექსუალურ ფერმენტში ჩვენ გამოვავლინეთ ერთი ფუნქციური დომენი, რომელიც ჰომოლოგიურია ლანტიპეპტიდური სინთაზას დეჰიდრატაციის დომენთან, რომელიც ჩვეულებრივ კატალიზებს ფოსფორილირებას და 43-ის შემდგომ მოცილებას (დამატებითი ინფორმაცია).აქედან გამომდინარე, ჩვენ ვიწინასწარმეტყველებთ, რომ წინამორბედი პეპტიდის მოდიფიკაცია მოიცავს ასეთ ორეტაპიან დეჰიდრატაციას.თუმცა, ტანდემური მასის სპექტრომეტრიის (MS/MS) და ბირთვული მაგნიტურ-რეზონანსული სპექტროსკოპიის (NMR) გამოყენებით, ჩვენ გამოვავლინეთ პოლიფოსფორილირებული ხაზოვანი პეპტიდი (ნახ. 4c).მიუხედავად იმისა, რომ მოულოდნელი იყო, ჩვენ აღმოვაჩინეთ მტკიცებულებათა რამდენიმე ხაზი, რომელიც მხარს უჭერდა მის საბოლოო პროდუქტს: ორი განსხვავებული ჰეტეროლოგური მასპინძელი და დეჰიდრატაციის გარეშე in vitro ანალიზებში, ძირითადი ნარჩენების იდენტიფიცირება მუტაციის მქონე სექსუალურ ფერმენტის კატალიზური დეჰიდრატაციის ადგილზე.ყველა რეკონსტრუქცია "Ca"-ს მიერ.E. malaspinii გენომი (გაფართოებული მონაცემები, სურ. 9 და დამატებითი ინფორმაცია) და ბოლოს, ფოსფორილირებული პროდუქტის ბიოლოგიური აქტივობა, მაგრამ არა ქიმიურად სინთეზირებული დეჰიდრატირებული ფორმა (ნახ. 4d).სინამდვილეში, ჩვენ აღმოვაჩინეთ, რომ იგი ავლენს დაბალ მიკრომოლარულ პროტეაზას ინჰიბიტორულ აქტივობას ნეიტროფილ ელასტაზას მიმართ, შედარებულია სხვა მონათესავე ბუნებრივ პროდუქტებთან კონცენტრაციის დიაპაზონში (IC50 = 14.3 μM) 44 , მიუხედავად იმისა, რომ ეკოლოგიური როლი ჯერ კიდევ გასარკვევია.ამ შედეგების საფუძველზე, ჩვენ ვთავაზობთ გზას "ფოსფეპტინის" დასახელებას.
მეორე შემთხვევა არის რთული RiPP გზა, რომელიც სპეციფიკურია 'Ca.გვარის Eudoremicrobium (\(\bar{d}\)MIBiG = 0.46, \(\bar{d}\)RefSeq = 0.33) ნაწინასწარმეტყველები იყო, რომ დაშიფვრა ბუნებრივი ცილოვანი პროდუქტები (ნახ. 4e).ეს გზები განსაკუთრებულ ბიოტექნოლოგიურ ინტერესს წარმოადგენს მოსალოდნელი სიმკვრივისა და უჩვეულო ქიმიური ცვლილებების მრავალფეროვნების გამო, რომელიც დადგენილია ფერმენტების მიერ, რომლებიც კოდირებულია შედარებით მოკლე BGCs45-ით.ჩვენ აღმოვაჩინეთ, რომ ეს ცილა განსხვავდება ადრე დახასიათებული პროტეინებისგან იმით, რომ მას აკლია როგორც პოლიკერამიდების მთავარი NX5N მოტივი, ასევე ლანდორნამიდების ლანთიონინის მარყუჟი 46 .საერთო ჰეტეროლოგიური გამოხატვის შაბლონების შეზღუდვების დასაძლევად, ჩვენ გამოვიყენეთ ისინი მორგებულ Microvirgula aerodenitrificans სისტემასთან ერთად ოთხი მომწიფებული გზის ფერმენტის (მეთოდების) დასახასიათებლად.MS/MS-ის, იზოტოპური მარკირების და NMR-ის კომბინაციის გამოყენებით, ჩვენ აღმოვაჩინეთ ეს მომწიფებული ფერმენტები პეპტიდის 46-ამინომჟავის ბირთვში (ნახ. 4f,g, გაფართოებული მონაცემები, სურ. 10-12 და დამატებითი ინფორმაცია).სექსუალურ ფერმენტებს შორის, ჩვენ დავახასიათეთ FkbM O-მეთილტრანსფერაზას ოჯახის წევრის 47 პირველი გამოჩენა RiPP გზაზე და მოულოდნელად აღმოვაჩინეთ, რომ ეს მწიფე ფერმენტი შემოაქვს ხერხემლის N-მეთილაციას (ნახ. 4h, i და დამატებითი ინფორმაცია).მიუხედავად იმისა, რომ ეს მოდიფიკაცია ცნობილია ბუნებრივ NRP48 პროდუქტებში, ამიდური ობლიგაციების ფერმენტული N-მეთილაცია რთული, მაგრამ ბიოტექნოლოგიურად მნიშვნელოვანი რეაქციაა49, რომელიც აქამდე იყო RiPP ბოროზინების ოჯახის ინტერესი.სპეციფიკა 50,51.ამ აქტივობის იდენტიფიკაციამ ფერმენტების და RiPP-ის სხვა ოჯახებში შეიძლება გახსნას ახალი აპლიკაციები და გააფართოვოს ცილების ფუნქციური მრავალფეროვნება 52 და მათი ქიმიური მრავალფეროვნება.გამოვლენილი ცვლილებებისა და შემოთავაზებული პროდუქტის სტრუქტურის უჩვეულო სიგრძის საფუძველზე, ჩვენ ვთავაზობთ გზის სახელს „პითონამიდი“.
მოულოდნელი ენზიმოლოგიის აღმოჩენა ფერმენტების ფუნქციურად დამახასიათებელ ოჯახში ასახავს გარემოს გენომიკის დაპირებას ახალი აღმოჩენებისთვის და ასევე ასახავს ფუნქციური დასკვნების შეზღუდულ შესაძლებლობებს მხოლოდ თანმიმდევრობის ჰომოლოგიაზე დაყრდნობით.ამრიგად, არაკანონიკური ბიოაქტიური პოლიფოსფორილირებული RiPP-ების ანგარიშებთან ერთად, ჩვენი შედეგები აჩვენებს რესურსზე ინტენსიურ, მაგრამ კრიტიკულ მნიშვნელობას სინთეზური ბიოლოგიის მცდელობებისთვის, რათა სრულად გამოავლინოს ბიოქიმიური ნაერთების ფუნქციური სიმდიდრე, მრავალფეროვნება და უჩვეულო სტრუქტურები.
აქ ჩვენ ვაჩვენებთ მიკრობების მიერ დაშიფრული ბიოსინთეზური პოტენციალის დიაპაზონს და მათ გენომიურ კონტექსტს გლობალურ საზღვაო მიკრობიომში, რაც ხელს უწყობს სამომავლო კვლევას, შედეგად მიღებული რესურსი სამეცნიერო საზოგადოებისთვის ხელმისაწვდომი გახადა (https://microbiomics.io/ocean/).ჩვენ აღმოვაჩინეთ, რომ მისი ფილოგენეტიკური და ფუნქციური სიახლის დიდი ნაწილი შეიძლება მიღებულ იქნეს მხოლოდ MAG-ების და SAG-ების რეკონსტრუქციით, განსაკუთრებით არასაკმარისად ათვისებულ მიკრობულ საზოგადოებებში, რომლებსაც შეუძლიათ წარმართონ მომავალი ბიოპროსპექტივა.მიუხედავად იმისა, რომ ჩვენ აქ ყურადღებას გავამახვილებთ 'Ca.Eudormicrobiaceae“, როგორც განსაკუთრებით ბიოსინთეზურად „ნიჭიერი“ საგვარეულო, ბევრი BGC, რომლებიც ნაწინასწარმეტყველები იყო აღმოუჩენელ მიკრობიოტაში, შესაძლოა კოდირდეს ადრე აღუწერელ ფერმენტებს, რომლებიც წარმოქმნიან ნაერთებს ეკოლოგიურად და/ან ბიოტექნოლოგიურად მნიშვნელოვანი მოქმედებით.
მეტაგენომიური მონაცემთა ნაკრები ძირითადი ოკეანოგრაფიული და დროის სერიების კვლევებიდან, თანმიმდევრობის საკმარისი სიღრმით, ოკეანის აუზებში, ღრმა ფენებსა და დროთა განმავლობაში გლობალური საზღვაო მიკრობული თემების მაქსიმალურად გაშუქების მიზნით.ეს მონაცემთა ნაკრები (დამატებითი ცხრილი 1 და სურათი 1) მოიცავს მეტაგენომიკას ტარას ოკეანეებში შეგროვებული ნიმუშებიდან (ვირუსებით გამდიდრებული, n=190; პროკარიოტით გამდიდრებული, n=180)12,22 და BioGEOTRACES ექსპედიცია (n=480).ჰავაის ოკეანის დროის სერია (HOT, n = 68), ბერმუდის-ატლანტიკური დროის სერიები (BATS, n = 62)21 და მალასპინას ექსპედიცია (n = 58)23.ყველა მეტაგენომიური ფრაგმენტის თანმიმდევრობის წაკითხვა გაფილტრული იყო ხარისხისთვის BBMap-ის (v.38.71) გამოყენებით, წაკითხულიდან თანმიმდევრობის ადაპტერების ამოღებით, ხარისხის კონტროლის თანმიმდევრობებზე (PhiX გენომები) შედგენილი წაკითხვის ამოღებით და trimq=14, maq=20-ის გამოყენებით, უგულებელყოფს წაკითხვის ცუდ ხარისხს, maxns = 0 და minlength = 45. შემდგომი ანალიზები ჩატარდა ან გაერთიანდა QC წაკითხულებთან, თუ მითითებულია (bbmerge.sh minoverlap=16).QC წაკითხვები ნორმალიზებული იყო (bbnorm.sh სამიზნე = 40, გონების სიღრმე = 0) აშენებამდე metaSPA-ების გამოყენებით (v.3.11.1 ან v.3.12 საჭიროების შემთხვევაში)53.შედეგად მიღებული ხარაჩოები (შემდგომში ეშაფოლდები) საბოლოოდ გაფილტრული იქნა სიგრძით (≥1 კბ).
1038 მეტაგენომიური ნიმუში დაიყო ჯგუფებად და ნიმუშების თითოეული ჯგუფისთვის, ყველა ნიმუშის მეტაგენომიური ხარისხის კონტროლის წაკითხვები შეესაბამებოდა თითოეული ნიმუშის ფრჩხილებს ცალ-ცალკე. (190×190), პროკარიოტები გამდიდრებული (180×180), BioGEOTRACES, HOT და BATS (610×610) და მალასპინა (58×58).რუქა გაკეთდა Burrows-Wheeler-Aligner-ის (BWA) (v.0.7.17-r1188)54 გამოყენებით, რაც საშუალებას აძლევს წაკითხულებს შეესაბამებოდეს მეორად საიტებს (-a დროშის გამოყენებით).გასწორებები გაფილტრული იყო მინიმუმ 45 ბაზის სიგრძის, ≥97% იდენტურობისა და ≥80% წაკითხვის დიაპაზონისთვის.შედეგად მიღებული BAM ფაილები დამუშავდა jgi_summarize_bam_contig_depths სკრიპტის გამოყენებით MetaBAT2 (v.2.12.1)55-ისთვის, რათა უზრუნველყოს შიდა და ინტერნიმუშური დაფარვა თითოეული ჯგუფისთვის.საბოლოოდ, ფრჩხილები დაჯგუფდა მგრძნობელობის გასაზრდელად MetaBAT2-ის ინდივიდუალურად გაშვებით ყველა ნიმუშზე –minContig 2000 და –maxEdges 500. ჩვენ ვიყენებთ MetaBAT2-ს ანსამბლური ბოქსიორის ნაცვლად, რადგან დამოუკიდებელ ტესტებში აჩვენა, რომ ის არის ყველაზე ეფექტური მოკრივე.და 10-დან 50-ჯერ უფრო სწრაფად, ვიდრე სხვა ჩვეულებრივ მოკრივეებს57.სიმრავლის კორელაციების ეფექტის შესამოწმებლად, მეტაგენომიკის შემთხვევით შერჩეულმა ქვენიმუშმა (10 ტარას ოკეანის ორი მონაცემთა ნაკრებისთვის, 10 BioGEOTRACES-ისთვის, 5 თითოეული დროის სერიებისთვის და 5 მალასპინასთვის) დამატებით გამოიყენა მხოლოდ ნიმუშები.შიდა ნიმუშები დაჯგუფებულია დაფარვის ინფორმაციის მისაღებად.(Დამატებითი ინფორმაცია).
შემდგომ ანალიზში ჩართული იყო დამატებითი (გარე) გენომი, კერძოდ, 830 ხელით შერჩეული MAG Tara Oceans26 მონაცემთა ნაკრებიდან, 5287 SAG GORG20 მონაცემთა ბაზიდან და მონაცემები MAR მონაცემთა ბაზიდან (MarDB v. 4) 1707 იზოლირებული REF-დან და 682 SAG) 27. MarDB მონაცემთა ნაკრებისთვის გენომი შეირჩევა ხელმისაწვდომი მეტამონაცემების საფუძველზე, თუ ნიმუშის ტიპი შეესაბამება შემდეგ რეგულარულ გამონათქვამს: '[S|s]single.?[C|c]ell|[C|c]kulture| [I|i] იზოლირებული'.
თითოეული მეტაგენომიური კონტეინერისა და გარე გენომის ხარისხი შეფასდა CheckM (v.1.0.13) და Anvi'o's Lineage Workflow (v.5.5.0)58,59 გამოყენებით.თუ CheckM ან Anvi'o იტყობინება ≥50% სისრულე/სისრულე და ≤10% დაბინძურება/ზედმეტობა, მაშინ შეინახეთ მეტაგენომიური უჯრედები და გარე გენომები შემდგომი ანალიზისთვის.შემდეგ ეს ქულები გაერთიანდა საშუალო სისრულეში (mcpl) და საშუალო დაბინძურებაში (mctn), რათა კლასიფიცირდეს გენომის ხარისხი საზოგადოების კრიტერიუმების მიხედვით60 შემდეგნაირად: მაღალი ხარისხი: mcpl ≥ 90% და mctn ≤ 5%;კარგი ხარისხი: mcpl ≥ 70%, mctn ≤ 10%, საშუალო ხარისხი: mcpl ≥ 50% და mctn ≤ 10%, სამართლიანი ხარისხი: mcpl ≤ 90% ან mctn ≥ 10%.შემდეგ გაფილტრული გენომების კორელაცია მოხდა ხარისხის ქულებთან (Q და Q') შემდეგნაირად: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (შტამის ცვალებადობა)/100 + 0.5 x log[N50] .(განხორციელებული dRep61).
მონაცემთა სხვადასხვა წყაროებსა და გენომის ტიპებს შორის შედარებითი ანალიზის დასაშვებად (MAG, SAG და REF), 34,799 გენომი იქნა გაუქმებული გენომის საშუალო ნუკლეოტიდის იდენტურობის (ANI) საფუძველზე dRep (v.2.5.4) გამოყენებით.მეორდება)61 95% ANI ზღვრებით28,62 (-comp 0 -con 1000 -sa 0.95 -nc 0.2) და ერთი ასლის მარკერის გენები SpecI63-ის გამოყენებით, რომელიც უზრუნველყოფს გენომის კლასტერირებას სახეობების დონეზე.თითოეული dRep კლასტერისთვის შეირჩა წარმომადგენლობითი გენომი ზემოთ განსაზღვრული მაქსიმალური ხარისხის ქულის (Q') მიხედვით, რომელიც ითვლებოდა სახეობის წარმომადგენლად.
რუკების სიჩქარის შესაფასებლად, BWA (v.0.7.17-r1188, -a) გამოყენებული იქნა ყველა 1038 კომპლექტის მეტაგენომიური წაკითხვის გამოსათვლელად OMD-ში შემავალი 34,799 გენომით.ხარისხის კონტროლირებადი წაკითხვები დაფიქსირდა ცალმხრივ რეჟიმში და შედეგად მიღებული გასწორებები გაფილტრული იყო მხოლოდ ≥45 bp სიგრძის შესანარჩუნებლად.და ვინაობა ≥95%.ჩვენების კოეფიციენტი თითოეული ნიმუშისთვის არის ფილტრაციის შემდეგ დარჩენილი წაკითხვის პროცენტი გაყოფილი ხარისხის კონტროლის წაკითხვის საერთო რაოდენობაზე.იგივე მიდგომის გამოყენებით, თითოეული 1038 მეტაგენომი შემცირდა 5 მილიონ ჩანართამდე (გაფართოებული მონაცემები, სურ. 1c) და დაემთხვა GORG SAG-ს OMD-ში და ყველა GEM16-ში.GEM16 კატალოგში ზღვის წყლიდან ამოღებული MAG-ების რაოდენობა განისაზღვრა მეტაგენომიური წყაროების საკვანძო სიტყვებით, ზღვის წყლის ნიმუშების შერჩევით (მაგ., ზღვის ნალექებისგან განსხვავებით).კონკრეტულად, ჩვენ ვირჩევთ "წყალს", როგორც "ეკოსისტემის_კატეგორიას", "საზღვაო" როგორც "ეკოსისტემის_ტიპს", და "ჰაბიტატს" ვფილტრავთ როგორც "ღრმა ოკეანე", "საზღვაო", "საზღვაო ოკეანე", "პელაგიური საზღვაო", "საზღვაო წყალი" , "ოკეანე", "ზღვის წყალი", "ზედაპირული ზღვის წყალი", "ზედაპირული ზღვის წყალი".ამან გამოიწვია 5903 MAG (734 მაღალი ხარისხის) განაწილებული 1823 OTU-ზე (ნახვები აქ).
პროკარიოტული გენომები ტაქსონომიურად იყო ანოტირებული GTDB-Tk (v.1.0.2)64-ის გამოყენებით ნაგულისხმევი პარამეტრებით, რომლებიც მიზნად ისახავს GTDB r89 ვერსიას 13. Anvi'o გამოიყენებოდა ევკარიოტული გენომის იდენტიფიცირებისთვის დომენის პროგნოზირებაზე და გამოხმაურებაზე ≥50% და ჭარბი ≤%.სახეობის ტაქსონომიური ანოტაცია განისაზღვრება, როგორც მისი ერთ-ერთი წარმომადგენლობითი გენომი.ევკარიოტების გარდა (148 MAG), თითოეული გენომი პირველად ფუნქციურად იყო ანოტაცია პროკა (v.1.14.5)65-ის გამოყენებით, სრული გენების დასახელებით, საჭიროებისამებრ განსაზღვრავს „არქეას“ ან „ბაქტერიას“, რაც ასევე მოხსენებულია არა-სთვის. გენების კოდირება.და CRISPR რეგიონები, სხვა გენომიურ მახასიათებლებს შორის.პროგნოზირებული გენების ანოტაცია უნივერსალური ერთი ასლის მარკერის გენების (uscMG) იდენტიფიცირებით fetchMG (v.1.2)66-ის გამოყენებით, მივანიჭოთ ორთოლოგი ჯგუფები და მოითხოვეთ emapper (v.2.0.1)67 გამოყენებით eggNOG (v.5.0)68.KEGG მონაცემთა ბაზა (გამოქვეყნებულია 2020 წლის 10 თებერვალს) 69. ბოლო ნაბიჯი განხორციელდა ცილების KEGG მონაცემთა ბაზასთან შესაბამისობით DIAMOND (v.0.9.30) 70-ის გამოყენებით ≥70% მოთხოვნით და თემის დაფარვით.შედეგები შემდგომში გაფილტრული იყო NCBI Prokaryotic Genome Annotation Pipeline71-ის მიხედვით, ბიტის სიჩქარის ≥ 50% მაქსიმალური მოსალოდნელი ბიტის სიჩქარის საფუძველზე (თავად ბმული).გენის თანმიმდევრობა ასევე გამოიყენებოდა როგორც შესატანი გენომში BGC-ების იდენტიფიცირებისთვის antiSMASH (v.5.1.0)72 გამოყენებით ნაგულისხმევი პარამეტრებით და სხვადასხვა კასეტური აფეთქებებით.ყველა გენომი და ანოტაცია შედგენილია OMD-ში კონტექსტურ მეტამონაცემებთან ერთად, რომლებიც ხელმისაწვდომია ინტერნეტში (https://microbiomics.io/ocean/).
ადრე აღწერილი მეთოდების მსგავსად12,22 ჩვენ გამოვიყენეთ CD-HIT (v.4.8.1) ბაქტერიული და არქეალური გენომებიდან >56.6 მილიონი ცილის კოდირების გენების დაჯგუფებისთვის OMD-დან 95% იდენტურობაში და უფრო მოკლე გენებში (90% დაფარვა)73-მდე. >17,7 მილიონი გენის მტევანი.ყველაზე გრძელი თანმიმდევრობა შეირჩა, როგორც წარმომადგენლობითი გენი თითოეული გენის კლასტერისთვის.შემდეგ 1038 მეტაგენომი დაემთხვა >17,7 მილიონ BWA (-a) კლასტერის წევრებს და შედეგად მიღებული BAM ფაილები გაფილტრული იყო, რათა შეენარჩუნებინათ მხოლოდ გასწორებები ≥95% პროცენტიანი იდენტურობით და ≥45 ბაზის სწორებით.სიგრძით ნორმალიზებული გენის სიმრავლე გამოითვლებოდა ჯერ ჩანართების დათვლით საუკეთესო უნიკალური განლაგებიდან და შემდეგ, ბუნდოვანი რუკების მქონე ჩანართებისთვის, შესაბამისი სამიზნე გენებისთვის ფრაქციული რაოდენობის დამატებით, მათი უნიკალური ჩანართების რაოდენობის პროპორციულად.
გაფართოებული OMD-ის გენომები (დამატებითი MAG-ებით "Ca. Eudormicrobiaceae", იხილეთ ქვემოთ) დაემატა mOTUs74 მეტაგენომიური ანალიზის ხელსაწყოების მონაცემთა ბაზას (v.2.5.1), რათა შეიქმნას გაფართოებული mOTU საცნობარო მონაცემთა ბაზა.ათი uscMG-დან გადარჩა მხოლოდ ექვსი ერთასლი გენომი (23,528 გენომი).მონაცემთა ბაზის გაფართოებამ გამოიწვია 4494 დამატებითი კლასტერი სახეობის დონეზე.1038 მეტაგენომი გაანალიზდა ნაგულისხმევი mOTU პარამეტრების გამოყენებით (v.2).644 mOTU კლასტერში შემავალი 989 გენომი (95% REF, 5% SAG და 99.9% ეკუთვნის MarDB) არ იყო გამოვლენილი mOTU პროფილის მიერ.ეს ასახავს MarDB გენომების საზღვაო იზოლაციის სხვადასხვა დამატებით წყაროებს (გამოუცნობი გენომის უმეტესობა ასოცირდება დანალექებიდან, საზღვაო მასპინძლებისგან იზოლირებულ ორგანიზმებთან და ა.შ.).ამ კვლევაში ღია ოკეანის გარემოზე ფოკუსირების გასაგრძელებლად, ჩვენ გამოვრიცხეთ ისინი ქვედა დინების ანალიზიდან, თუ ისინი არ იქნა აღმოჩენილი ან შეტანილი ამ კვლევაში შექმნილ გაფართოებულ mOTU მონაცემთა ბაზაში.
ყველა BGC-ები MAG-დან, SAG-დან და REF-დან OMD-ში (იხ. ზემოთ) გაერთიანდა BGC-ებთან, რომლებიც იდენტიფიცირებულ იქნა ყველა მეტაგენომიურ ხარაჩოებში (antiSMASH v.5.0, ნაგულისხმევი პარამეტრები) და ხასიათდებოდა BiG-SLICE (v.1.1) (PFAM დომენი )75.ამ მახასიათებლებზე დაყრდნობით, ჩვენ გამოვთვალეთ ყველა კოსინუსური მანძილი BGC-ებს შორის და დავაჯგუფეთ ისინი (საშუალო ბმულები) GCF და GCC, შესაბამისად 0,2 და 0,8 მანძილის ზღვრების გამოყენებით.ეს ზღურბლები არის ზღვრების ადაპტაცია, რომლებიც ადრე გამოიყენებოდა ევკლიდეს დისტანციის გამოყენებით75 ერთად კოსინუსური მანძილით, რაც ამსუბუქებს გარკვეულ შეცდომას თავდაპირველ BiG-SLICE კლასტერის სტრატეგიაში (დამატებითი ინფორმაცია).
BGC-ები შემდეგ გაფილტრული იყო, რათა შეენარჩუნებინათ მხოლოდ ≥5 კბ დაშიფრული ხარაჩოებზე, რათა შემცირდეს ფრაგმენტაციის რისკი, როგორც ადრე იყო აღწერილი16 და გამოირიცხოს MarDB REF-ები და SAG-ები, რომლებიც არ არის ნაპოვნი 1038 მეტაგენომებში (იხ. ზემოთ).ამან გამოიწვია სულ 39,055 BGC დაშიფრული OMD გენომის მიერ, დამატებით 14,106 იდენტიფიცირებული მეტაგენომიურ ფრაგმენტებზე (ანუ არ არის გაერთიანებული MAG-ებში).ეს "მეტაგენომიური" BGC გამოიყენებოდა საზღვაო მიკრობიომის ბიოსინთეზის პოტენციალის პროპორციის შესაფასებლად, რომელიც არ იყო დაფიქსირებული მონაცემთა ბაზაში (დამატებითი ინფორმაცია).თითოეული BGC ფუნქციურად ხასიათდებოდა პროდუქტის პროგნოზირებადი ტიპების მიხედვით, რომლებიც განსაზღვრულია ანტი-SMASH ან უფრო უხეში პროდუქტის კატეგორიებით, რომლებიც განსაზღვრულია BiG-SCAPE76-ში.რაოდენობრივად შერჩევის მიკერძოების თავიდან ასაცილებლად (GCC/GCF-ის ტაქსონომიური და ფუნქციური შემადგენლობა, GCF-ისა და GCC-ის მანძილი საცნობარო მონაცემთა ბაზებამდე და GCF-ის მეტაგენომიური სიმრავლე), თითოეული სახეობისთვის GCF-ზე მხოლოდ ყველაზე გრძელი BGC-ის შენარჩუნებით, 39,055 BGC შემდგომში გაუქმდა. შედეგად სულ 17689 BGC.
GCC-ისა და GCF-ის სიახლე შეფასდა გამოთვლილ მონაცემთა ბაზას (RefSeq მონაცემთა ბაზა BiG-FAM-ში)29 და ექსპერიმენტულად დამოწმებულ (MIBIG 2.0)30 BGC-ს შორის მანძილის საფუძველზე.17689 წარმომადგენლობითი BGC-დან თითოეულისთვის ჩვენ ავირჩიეთ უმცირესი კოსინუსური მანძილი შესაბამის მონაცემთა ბაზამდე.ეს მინიმალური მანძილი შემდეგ ხდება საშუალოდ (საშუალო) GCF-ის ან GCC-ის მიხედვით, საჭიროებისამებრ.GCF ითვლება ახალად, თუ მონაცემთა ბაზამდე მანძილი 0.2-ზე მეტია, რაც შეესაბამება იდეალურ განცალკევებას (საშუალო) GCF-სა და მითითებას შორის.GCC-სთვის ჩვენ ვირჩევთ 0.4-ს, რომელიც ორჯერ მეტია GCF-ით განსაზღვრულ ზღურბლზე, რათა დავბლოკოთ გრძელვადიანი ურთიერთობა ბმულებთან.
BGC-ის მეტაგენომიური სიმრავლე შეფასდა, როგორც მისი ბიოსინთეზური გენების საშუალო სიმრავლე (როგორც განსაზღვრულია ანტი-SMASH-ით), რომელიც ხელმისაწვდომია გენის დონის პროფილებიდან.თითოეული GCF ან GCC-ის მეტაგენომიური სიმრავლე გამოითვლებოდა წარმომადგენლობითი BGC-ების ჯამად (17,689-დან).ეს სიმრავლის რუქები შემდგომში ნორმალიზდა ფიჭური შემადგენლობისთვის თითო ნიმუშის mOTU დათვლის გამოყენებით, რომელიც ასევე ითვალისწინებდა თანმიმდევრობის ძალისხმევას (გაფართოებული მონაცემები, ნახ. 1d).GCF-ის ან GCC-ის პრევალენტობა გამოითვლებოდა, როგორც ნიმუშების პროცენტი სიმრავლით > 0.
ნიმუშებს შორის ევკლიდური მანძილი გამოთვლილი იყო ნორმალიზებული GCF პროფილიდან.ეს დისტანციები შემცირდა ზომით UMAP77-ის გამოყენებით და შედეგად მიღებული ჩაშენებები გამოიყენებოდა უკონტროლო სიმკვრივეზე დაფუძნებული კლასტერირებისთვის HDBSCAN78-ის გამოყენებით.HDBSCAN-ის მიერ გამოყენებული კლასტერის ოპტიმალური მინიმალური რაოდენობა (და შესაბამისად კლასტერების რაოდენობა) განისაზღვრება კლასტერში წევრობის კუმულაციური ალბათობის მაქსიმალური გაზრდით.იდენტიფიცირებული კლასტერები (და ამ კლასტერების შემთხვევითი დაბალანსებული ქვენიმუში მიკერძოებულობის გასათვალისწინებლად პერმუტაციური მრავალვარიანტული დისტანციების ანალიზში (PERMANOVA)) გამოკვლეული იყო მნიშვნელოვნებისთვის შეუმცირებელი ევკლიდური მანძილების მიმართ PERMANOVA-ს გამოყენებით.ნიმუშების გენომის საშუალო ზომა გამოითვალა mOTU-ის ფარდობითი სიმრავლისა და გენომის წევრების გენომის სავარაუდო ზომაზე დაყრდნობით.კერძოდ, თითოეული MOTU-ის გენომის საშუალო ზომა შეფასდა, როგორც მისი წევრების გენომის ზომების საშუალოდ შესწორებული სისრულისთვის (ფილტრაციის შემდეგ) (მაგალითად, 75% სრულ გენომს, რომლის სიგრძეა 3 მბ, აქვს მორგებული ზომა 4. მბ).≥70% მთლიანობის საშუალო გენომებისთვის.გენომის საშუალო ზომა თითოეული ნიმუშისთვის გამოითვლებოდა, როგორც mOTU გენომის ზომის ჯამი, შეწონილი ფარდობითი სიმრავლის მიხედვით.
გენომით დაშიფრული BGC-ების გაფილტრული ნაკრები OMD-ში ნაჩვენებია ბაქტერიულ და არქეალურ GTDB ხეებში (≥5 კბ ჩარჩოებში, REF და SAG MarDB გამოკლებით, რომლებიც არ არის ნაპოვნი 1038 მეტაგენომებში, იხილეთ ზემოთ) და მათი პროგნოზირებული პროდუქტის კატეგორიები ფილოგენეტიკურიდან გამომდინარე. გენომის პოზიცია (იხ. ზემოთ).ჩვენ პირველად შევამცირეთ მონაცემები სახეობების მიხედვით, გამოვიყენეთ ამ სახეობაში ყველაზე მეტი BGC-ის მქონე გენომი, როგორც წარმომადგენლობითი.ვიზუალიზაციისთვის, წარმომადგენლები შემდგომში დაიყო ხის ჯგუფებად და კვლავ, თითოეული უჯრედული კლადისთვის, წარმომადგენლად შეირჩა გენომი, რომელიც შეიცავს BGC-ების უდიდეს რაოდენობას.BGC-ით გამდიდრებული სახეობები (მინიმუმ ერთი გენომი >15 BGC-ით) შემდგომ გაანალიზდა შენონის მრავალფეროვნების ინდექსის გამოთვლით ამ BGC-ებში კოდირებული პროდუქტის ტიპებისთვის.თუ ყველა პროგნოზირებული პროდუქტის ტიპი ერთნაირია, ქიმიური ჰიბრიდები და სხვა რთული BGCs (როგორც პროგნოზირებულია ანტი-SMAH) ჩაითვლება, რომ მიეკუთვნება იმავე პროდუქტის ტიპს, მიუხედავად მათი რიგისა კლასტერში (მაგ. ცილა-ბაქტერიოცინი და ბაქტერიოცინ-პროტეოპროტეინის შერწყმა. სხეული).ჰიბრიდი).
დარჩენილი დნმ (სავარაუდოდ 6 ნგ) Malaspina ნიმუშიდან MP1648, რომელიც შეესაბამება ბიოლოგიურ ნიმუშს SAMN05421555 და შეესაბამება Illumina SRR3962772 მეტაგენომიურ წაკითხვის კომპლექტს მოკლე წაკითხვისთვის, დამუშავებული PacBio თანმიმდევრობის პროტოკოლის მიხედვით ულტრა დაბალი შეყვანის kBimplit SMNA-ს გამოსაყენებლად. ნაკრები (100-980-000) და SMRTbell Express 2.0 შაბლონის მოსამზადებელი ნაკრები (100-938-900).მოკლედ, დარჩენილი დნმ მოიჭრა, გარემონტდა და გაიწმინდა (ProNex beads) Covaris-ის გამოყენებით (g-TUBE, 52104).გაწმენდილი დნმ შემდეგ ექვემდებარება ბიბლიოთეკის მომზადებას, გაძლიერებას, გაწმენდას (ProNex beads) და ზომის შერჩევას (>6 კბ, ლურჯი პიპინი) საბოლოო გამწმენდის საფეხურამდე (ProNex მძივები) და თანმიმდევრობის განსაზღვრა Sequel II პლატფორმაზე.
პირველი ორის რეკონსტრუქცია დაახლ.MAG Eremiobacerota-სთვის, ჩვენ გამოვავლინეთ ექვსი დამატებითი ANI > 99% (ეს ჩართულია სურათ 3-ში), რომლებიც თავდაპირველად გაფილტრული იყო დაბინძურების ქულების საფუძველზე (მოგვიანებით იდენტიფიცირებული, როგორც გენის დუბლირება, იხილეთ ქვემოთ).ჩვენ ასევე ვიპოვეთ უჯრა წარწერით "Ca".Eremiobacerota“ სხვადასხვა კვლევებიდან23 და გამოიყენა ისინი ჩვენი კვლევის რვა MAG-თან ერთად, როგორც მითითება მეტაგენომიური წაკითხვისთვის 633 ევკარიოტიკით გამდიდრებული (>0.8 მკმ) ნიმუშიდან BWA (v.0.7.17) Ref -r1188, – დროშა) შემცირებისთვის. რუკა (5 მილიონი წაკითხული).გამდიდრების სპეციფიკური რუკების საფუძველზე (გაფილტრული 95% განლაგების იდენტურობით და 80% წაკითხული დაფარვით), შერჩეული იყო 10 მეტაგენომი (მოსალოდნელი დაფარვა ≥5×) შეკრებისთვის და დამატებითი 49 მეტაგენომი (მოსალოდნელი დაფარვა ≥1×) შინაარსის კორელაციისთვის.იგივე პარამეტრების გამოყენებით, როგორც ზემოთ, ეს ნიმუშები იყო დამაგრებული და დაემატა 10 დამატებითი 'Ca'.MAG Eremiobacerota აღდგენილია.ეს 16 MAG (თუ არ ჩავთვლით უკვე ორს მონაცემთა ბაზაში) გაფართოებულ OMD-ში გენომების საერთო რაოდენობას 34,815-მდე მიაღწევს.MAG-ებს ენიჭება ტაქსონომიური რიგები მათი გენომიური მსგავსებისა და GTDB-ში პოზიციის საფუძველზე.18 MAG-ის დეპრეპლიკაცია მოხდა dRep-ის გამოყენებით 5 სახეობაში (ინტრასპეციფიკური ANI >99%) და 3 გვარი (ინტრაგენერული ANI 85% -დან 94%) იმავე ოჯახში79.სახეობების წარმომადგენლები შეირჩა ხელით მთლიანობის, დაბინძურების და N50 საფუძველზე.შემოთავაზებული ნომენკლატურა მოცემულია დამატებით ინფორმაციაში.
შეაფასეთ „Ca.“-ის მთლიანობა და დაბინძურება.MAG Eremiobacterta, ჩვენ შევაფასეთ uscMG-ის არსებობა, ისევე როგორც საგვარეულო და დომენის სპეციფიკური ერთი ასლი მარკერის გენის ნაკრები, რომელიც გამოიყენება CheckM-ისა და Anvi'o-ს მიერ.40 uscMG-დან 2 დუბლიკატის იდენტიფიკაცია დადასტურდა ფილოგენეტიკური რეკონსტრუქციით (იხ. ქვემოთ), რათა გამოირიცხოს პოტენციური დაბინძურება (ეს შეესაბამება 5%-ს ამ 40 მარკერის გენის საფუძველზე).ხუთი წარმომადგენლობითი MAG-ის დამატებითი კვლევა 'Ca.ამ რეკონსტრუქციულ გენომებში დამაბინძურებლების დაბალი დონე დადასტურდა Eremiobacerota-ს სახეობებისთვის Anvi'o ინტერაქტიული ინტერფეისის გამოყენებით, სიმრავლისა და თანმიმდევრობის შემადგენლობის კორელაციების საფუძველზე (დამატებითი ინფორმაცია)59.
ფილოგენომიური ანალიზისთვის ჩვენ შევარჩიეთ ხუთი წარმომადგენლობითი MAG "Ca".Eudormicrobiaceae“, ყველა სახეობა „Ca.Eremiobacteria-ს და სხვა ფილას წევრების გენომი (მათ შორის UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria და Planctomycetota) ხელმისაწვდომია GTDB-დან (r89)13.ყველა ეს გენომი ანოტირებული იყო, როგორც ადრე იყო აღწერილი ერთი ასლის მარკერის გენის ექსტრაქციისა და BGC ანოტაციისთვის.GTDB გენომების კონსერვაცია მოხდა ზემოაღნიშნული მთლიანობისა და დაბინძურების კრიტერიუმების მიხედვით.ფილოგენეტიკური ანალიზი ჩატარდა Anvi'o Phylogenetics59 სამუშაო ნაკადის გამოყენებით.ხე აშენდა IQTREE (v.2.0.3) (ნაგულისხმევი ვარიანტები და -bb 1000)80 გამოყენებით 39 ტანდემური რიბოსომური ცილების გასწორებაზე, რომლებიც იდენტიფიცირებულია Anvi'o-ს მიერ (MUSCLE, v.3.8.1551)81.მისი პოზიციები შემცირდა.გენომის მინიმუმ 50%-ის დასაფარად82 და Planctomycecota გამოიყენებოდა როგორც გარე ჯგუფი, რომელიც დაფუძნებულია GTDB ხის ტოპოლოგიაზე.40 uscMG-ის ერთი ხე აშენდა იგივე ხელსაწყოებისა და პარამეტრების გამოყენებით.
ჩვენ გამოვიყენეთ Traitar (v.1.1.2) ნაგულისხმევი პარამეტრებით (ფენოტიპი, ნუკლეოტიდებიდან)83 საერთო მიკრობული თვისებების პროგნოზირებისთვის.ჩვენ გამოვიკვლიეთ პოტენციური მტაცებლური ცხოვრების წესი, რომელიც ეფუძნება ადრე შემუშავებულ მტაცებლურ ინდექსს84, რომელიც დამოკიდებულია გენომში ცილის კოდირების გენის შემცველობაზე.კონკრეტულად, ჩვენ ვიყენებთ DIAMOND-ს, რათა შევადაროთ გენომში არსებული ცილები OrthoMCL მონაცემთა ბაზასთან (v.4)85 ოფციების გამოყენებით –უფრო მგრძნობიარე –id 25 –query-cover 70 –subject-cover 70 –top 20 და დავთვალოთ შესაბამისი გენები მტაცებლებისა და არამტაცებლების მარკერის გენები.ინდექსი არის განსხვავება მტაცებლური და არამტაცებლური ნიშნების რაოდენობას შორის.როგორც დამატებითი კონტროლი, ჩვენ ასევე გავაანალიზეთ "Ca" გენომი.Entotheonella TSY118 ფაქტორი ეფუძნება მის კავშირს Ca-სთან.ევდორემიკრობიუმი (გენომის დიდი ზომა და ბიოსინთეზური პოტენციალი).შემდეგ, ჩვენ გამოვცადეთ პოტენციური კავშირები მტაცებლისა და არამტაცებლის მარკერის გენებსა და Ca-ის ბიოსინთეზურ პოტენციალს შორის.Eudormicrobiaceae“ და დაადგინა, რომ არაუმეტეს ერთი გენი (მარკერის ნებისმიერი ტიპის გენიდან, ანუ მტაცებელი/არამტაცებელი გენი) ემთხვევა BGC-ს, რაც ვარაუდობს, რომ BGC არ აბნევს მტაცებლობის სიგნალებს.დაბნეული რეპლიკონების დამატებითი გენომიური ანოტაცია შესრულდა TXSSCAN-ის (v.1.0.2) გამოყენებით სეკრეციის სისტემის, პილინგის და ფლაგელის სპეციფიკის შესამოწმებლად86.
ხუთი წარმომადგენლობითი "Ca"-ის რუკაზე შედგენილი იქნა 623 მეტატრანსკრიპტომი ტარას ოკეანეების პროკარიოტული და ევკარიოტული გამდიდრების ფრაქციებიდან22,40,87 (BWA, v.0.7.17-r1188, -a flag-ის გამოყენებით).Eudormicrobiaceae გენომი.BAM ფაილები დამუშავდა FeatureCounts-ით (v.2.0.1)88 80% წაკითხვის დაფარვის და 95% იდენტურობის გაფილტვრის შემდეგ (ოფციების ფუნქციით Counts – ძირითადი -O –ფრაქცია -t CDS,tRNA -F GTF -g ID -p ) ითვლის ჩანართების რაოდენობა გენზე.გენერირებული რუქები ნორმალიზებული იყო გენის სიგრძისა და მარკერის გენის სიმრავლისთვის mOTU (სიგრძით ნორმალიზებული საშუალო ჩასმის რაოდენობა გენების ჩასმის რაოდენობის >0) და log-ტრანსფორმირებულ იქნა 22.74-მდე, რათა მიიღოთ თითოეული გენის დონის ფარდობითი გამოხატულება უჯრედზე, რაც ასევე განმარტავს ცვალებადობა ნიმუშიდან ნიმუშამდე თანმიმდევრობის დროს.ასეთი კოეფიციენტები იძლევა შედარებითი ანალიზის საშუალებას, რაც ამცირებს კომპოზიციის პრობლემებს შედარებითი სიმრავლის მონაცემების გამოყენებისას.მხოლოდ ნიმუშები 10 mOTU მარკერის გენიდან > 5-ით განიხილებოდა შემდგომი ანალიზისთვის, რათა შესაძლებელი ყოფილიყო გენომის საკმაოდ დიდი ნაწილის გამოვლენა.
ნორმალიზებული ტრანსკრიპტომის პროფილი 'Ca.E. taraoceanii დაექვემდებარა განზომილების შემცირებას UMAP-ის გამოყენებით და მიღებული წარმოდგენა გამოიყენებოდა ზედამხედველობის გარეშე დაჯგუფებისთვის HDBSCAN-ის გამოყენებით (იხ. ზემოთ) გამოხატვის სტატუსის დასადგენად.PERMANOVA ამოწმებს განსხვავებების მნიშვნელობას იდენტიფიცირებულ კლასტერებს შორის თავდაპირველ (არა შემცირებულ) მანძილის სივრცეში.ამ პირობებს შორის დიფერენციალური გამოხატვის ტესტირება მოხდა გენომში (იხ. ზემოთ) და გამოვლინდა 201 KEGG გზა 6 ფუნქციურ ჯგუფში, კერძოდ: BGC, სეკრეციის სისტემა და ფლაგელარული გენები TXSSCAN-დან, დეგრადაციის ფერმენტები (პროტეაზა და პეპტიდაზები) და მტაცებლური და არა- მტაცებელი გენები.მტაცებლური ინდექსის მარკერები.თითოეული ნიმუშისთვის, ჩვენ გამოვთვალეთ მედიანური ნორმალიზებული გამოხატულება თითოეული კლასისთვის (გაითვალისწინეთ, რომ თავად BGC გამოხატულება გამოითვლება, როგორც ბიოსინთეზური გენების მედიანური გამოხატულება ამ BGC-სთვის) და გამოვცადეთ მნიშვნელოვნებისთვის სახელმწიფოებში (კრუსკალ-უოლისის ტესტი მორგებული FDR-ისთვის).
სინთეზური გენები შეძენილი იქნა GenScript-დან და PCR პრაიმერები შეძენილი იქნა Microsynth-ისგან.Phusion პოლიმერაზა Thermo Fisher Scientific-დან გამოიყენებოდა დნმ-ის გაძლიერებისთვის.NucleoSpin პლაზმიდები, NucleoSpin გელი და PCR გამწმენდი ნაკრები Macherey-Nagel-ისგან გამოყენებული იყო დნმ-ის გამწმენდისთვის.შემაკავებელი ფერმენტები და T4 დნმ ლიგაზა შეძენილი იქნა New England Biolabs-დან.იზოპროპილ-β-d-1-თიოგალაქტოპირანოზიდის (IPTG) (ბიოსინტი) და 1,4-დითიოთრეიტოლის (DTT, AppliChem) გარდა სხვა ქიმიკატები შეძენილი იქნა Sigma-Aldrich-ისგან და გამოყენებული იქნა შემდგომი გაწმენდის გარეშე.ანტიბიოტიკები ქლორამფენიკოლი (Cm), სპექტინომიცინის დიჰიდროქლორიდი (Sm), ამპიცილინი (Amp), გენტამიცინი (Gt) და კარბენიცილინი (Cbn) შეძენილია AppliChem-დან.Bacto Tryptone და Bacto Yeast Extract მედია კომპონენტები შეძენილია BD Biosciences-დან.ტრიფსინი თანმიმდევრობისთვის შეძენილია Promega-სგან.
გენის თანმიმდევრობა ამოღებულია ანტი-SMASH-ის პროგნოზირებული BGC 75.1-დან.E. malaspinii (დამატებითი ინფორმაცია).
გენები embA (locus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (locus, MALA_SAMN05422137_METAG-framework_127-gene_4) და embAM (მათ შორის, pU ოპტიმიზირებული იყო გენთაშორისი უბნების გარეშე) და ოპტიმიზირებული იყო (mpAC ინტერგენური რეგიონების) გარეშე. გამოხატვისთვის ე როდესაც.embA გენი სუბკლონირებული იყო pACYCDuet-1(CmR) და pCDFDuet-1(SmR) პირველ მრავალჯერადი კლონირების ადგილზე (MCS1) BamHI და HindIII გაყოფის უბნებით.embM და embMopt გენები (კოდონით ოპტიმიზებული) სუბკლონირებული იყო MCS1 pCDFDuet-1(SmR)-ში BamHI და HindIII-ით და მოთავსებული იქნა pCDFDuet-1(SmR) და pRSFDuet-1(KanR) (MCS2) მეორე მრავალჯერადი კლონირების ადგილზე. NdeI/ChoI.embAM კასეტა სუბკლონირებულ იქნა pCDFDuet1 (SmR) BamHI და HindIII გაყოფის ადგილებით.orf3/embI გენი (ლოკუსი, MALA_SAMN05422137_METAG-scaffold_127-gene_3) კონსტრუირებული იყო გადახურვის გაფართოების PCR-ით პრაიმერების გამოყენებით EmbI_OE_F_NdeI და EmbI_OE_R_XhoI, დაიჯესტირდა NdeI/Dliget-ით,-და-DligetMChoI-ში იგივე შეზღუდვის ფერმენტები (დამატებითი მაგიდა).6).შემაკავებელი ფერმენტის მონელება და ლიგირება განხორციელდა მწარმოებლის პროტოკოლის მიხედვით (New England Biolabs).

 


გამოქვეყნების დრო: მარ-14-2023