Kartierung der Diversität in afrikanischen Trypanosomen mithilfe hochauflösender räumlicher Proteomik
HeimHeim > Nachricht > Kartierung der Diversität in afrikanischen Trypanosomen mithilfe hochauflösender räumlicher Proteomik

Kartierung der Diversität in afrikanischen Trypanosomen mithilfe hochauflösender räumlicher Proteomik

Jul 01, 2023

Nature Communications Band 14, Artikelnummer: 4401 (2023) Diesen Artikel zitieren

2065 Zugriffe

26 Altmetrisch

Details zu den Metriken

Afrikanische Trypanosomen sind dixenöse eukaryotische Parasiten, die in Afrika südlich der Sahara eine erhebliche Krankheitslast für Mensch und Tier darstellen. Die Vielfalt zwischen Arten und Lebenszyklusstadien geht mit unterschiedlichen Wirts- und Gewebetropismen innerhalb dieser Gruppe einher. Hier werden die räumlichen Proteome zweier afrikanischer Trypanosomenarten, Trypanosoma brucei und Trypanosoma congolense, über zwei Lebensstadien hinweg kartiert. Die vier resultierenden Datensätze liefern Hinweise auf die Expression von etwa 5500 Proteinen pro Zelltyp. Über 2500 Proteine ​​pro Zelltyp werden in bestimmte subzelluläre Kompartimente eingeteilt, wodurch vier umfassende räumliche Proteome bereitgestellt werden. Eine vergleichende Analyse deckt die wichtigsten Wege der parasitären Anpassung an verschiedene biologische Nischen auf und liefert Einblicke in die molekularen Grundlagen der Diversität innerhalb und zwischen diesen Krankheitserregerarten.

Kinetoplastiden sind einzellige, begeißelte Eukaryoten, die wichtige Parasiten von Menschen, Nutztieren und Nutzpflanzenarten umfassen und typischerweise von Wirbellosen übertragen werden. Zu dieser Klasse gehören die afrikanischen Trypanosomen, die gemeinsam eine Reihe von Säugetieren infizieren und bei Menschen und Tieren afrikanische Trypanosomiasis verursachen. Der Großteil der Forschung zur Charakterisierung afrikanischer Trypanosomen wurde mit Trypanosoma brucei durchgeführt; Zum einen, weil zwei Unterarten für den Menschen infektiös sind, zum anderen, weil die In-vitro-Kultivierung und genetische Manipulation dieser Art relativ einfach ist. T. brucei wurde als Parasit, aber auch als divergenter Modellorganismus untersucht, wobei sowohl gut konservierte als auch nicht-kanonische eukaryotische biologische Merkmale von Interesse sind. Die verwandten Arten Trypanosoma congolense und Trypanosoma vivax sind die Hauptverursacher der Trypanosomiasis bei Rindern. Trotz ihrer veterinärmedizinischen Bedeutung wurden diese Arten bisher erheblich weniger erforscht1. Verschiedene afrikanische Trypanosomenarten weisen unterschiedliche Zell- und Infektionsmerkmale auf, die molekulare Grundlage vieler davon ist jedoch unbekannt2,3,4,5.

Afrikanische Trypanosomen sind während ihres Lebenszyklus einer Reihe unterschiedlicher äußerer Umgebungen ausgesetzt, und die Parasiten unterscheiden zwischen einer Reihe von Lebensstadien, die jeweils für das Wachstum und Überleben in ihrer aktuellen Umgebung angepasst oder für die nächste bereits angepasst sind6. Jede Lebensphase basiert auf einer gemeinsamen, hochorganisierten, polaren Kernzellarchitektur mit einem einzigen Flagellum und einer Ansammlung von Einzel- und Mehrfachorganellen. Die relativen Größen, Positionen und Proteingehalte von Organellen variieren zwischen den Lebensstadien. Wie in allen eukaryotischen Zellen definiert die subzelluläre Lokalisierung eines Proteins in Trypanosomen nicht nur die biochemische Umgebung dieses Proteins, sondern auch das Potenzial für molekulare Wechselwirkungen. Daher ist die Proteinfunktion eng mit der Proteinlokalisierung verknüpft.

Es gibt zwei Hauptansätze zur Bestimmung der Proteinlokalisierung in einer Zelle: Mikroskopie und Proteomik. Die Mikroskopie ermöglicht eine präzise Auflösung spezifischer Lokalisationen; kann Variationen zwischen Zellen innerhalb einer Probe erkennen; und kann problemlos Proteine ​​identifizieren, die an mehreren Stellen lokalisiert sind, kann jedoch unter Markierungsartefakten oder unangemessener Expression leiden. Aufgrund der Notwendigkeit, einen proteinspezifischen Antikörper zu erhalten oder das Protein von Interesse genetisch zu manipulieren, ist die Mikroskopie im Allgemeinen auf eine kleine Anzahl von Proteinen pro Untersuchung beschränkt. Proteomweite Mikroskopanalysen sind wertvolle, umfangreiche Datensätze, aber keine trivialen und zeitaufwändigen Unternehmungen, die bisher auf wenige Arten beschränkt sind: Saccharomyces cerevisiae7, Menschen8 und T. brucei9.

Die räumliche Proteomik basiert auf der Isolierung oder Anreicherung von Organellen und anschließender Massenspektrometrie (MS) und ermöglicht die Identifizierung von Proteinen, die an bestimmten subzellulären Stellen angereichert sind – normalerweise ohne die Notwendigkeit einer genetischen Veränderung. Diese Methoden erwiesen sich als äußerst effektiv bei der Aufdeckung von Proteinbewohnern in Organellen oder Strukturen innerhalb von Trypanosomatiden, wie z. B. dem Mitochondrium, den Glykosomen, dem Flagellum und dem Zellkern10,11,12,13,14. Hochdurchsatz-MS-basierte Methoden können jetzt verwendet werden, um Tausende von Proteinen in einem einzigen Experiment für mehrere Bedingungen, Zustände oder Zelltypen systematisch zu lokalisieren15,16,17,18,19,20,21,22. Zu diesen Methoden gehört hyperLOPIT (Hyperplexed Localization of Organelle Proteins by Isotope Tagging)16,23. Hierbei handelt es sich um einen quantitativen Proteomik-Ansatz, bei dem eine räumliche Karte des Proteoms ohne die Notwendigkeit der Isolierung einzelner Organellen durch die Anwendung von Algorithmen für maschinelles Lernen erstellt werden kann24,25,26,27. HyperLOPIT und verwandte LOPIT-Methoden wurden verwendet, um räumliche Karten von Säugetier-, Insekten-, Hefe-, Pflanzen- und Protozoenzelltypen zu erstellen16,21,28,29,30,31,32.

Hier wurde hyperLOPIT in Kombination mit Computermodellierung eingesetzt, um die Proteome von T. brucei und T. congolense räumlich abzubilden, jeweils in zwei verschiedenen Lebensstadien: der Säugetier-Blutstromform (BSF) und der prozyklischen Form des Insekten-Mitteldarms (PCF). 23,33. Dies hat zu vier umfassenden und komplementären Datensätzen geführt, die (i) einzeln Hinweise auf die Proteinexpression und die Zuordnung der subzellulären Position von Tausenden von Proteinen pro Zelltyp liefern und (ii) gemeinsam eine vergleichende Analyse zwischen Lebensstadien und Arten erleichtern. Dies hat wichtige subzelluläre Orte bei der Anpassung von Parasiten an biologische Nischen und die molekulare Grundlage für die innerhalb und zwischen diesen verschiedenen Krankheitserregerarten beobachtete Diversität hervorgehoben.

Der experimentelle Arbeitsablauf für hyperLOPIT in afrikanischen Trypanosomen (Abb. 1A) wurde auf der Grundlage früherer Arbeiten23,28 entwickelt. Die Zellen wurden durch Stickstoffkavitation10,34 lysiert. Rohe Membranen und lösliche Proteine ​​wurden dann auf einem Iodixanol-Kissen getrennt, wobei die Membranen anschließend gesammelt und durch Ultrazentrifugation pelletiert wurden. Die Membranen wurden durch Dichtegradientenzentrifugation auf einem Iodixanol-Gradienten aufgelöst. Ungefähr 22 Fraktionen wurden aus dem Gradienten gesammelt und zunächst per Western Blot bewertet, um die Kompartimentauflösung zu bestätigen (ergänzende Abbildung 1). Die Fraktionen wurden auf 10 pro Experiment gepoolt, was zusätzlich zur zytosolisch angereicherten löslichen Fraktion die Grundlage für die 11-Plex-TMT-Markierung (Tandem Mass Tag) bildete. TMT-markierte Fraktionen wurden kombiniert, durch UPLC bei hohem pH-Wert fraktioniert und einer quantitativen Multiplex-MS mit LC-SPS-MS3 unterzogen.

Ein Überblick über den experimentellen Arbeitsablauf zur Implementierung von hyperLOPIT auf afrikanischen Trypanosomen: Die ersten Zellen wurden geerntet und durch Stickstoffkavitation lysiert, wodurch subzelluläre Kompartimente freigesetzt wurden. Lösliche Proteine ​​und Rohmembranen wurden auf einem Iodixanol-Kissen getrennt, gefolgt von der Pelletierung der Membranfraktion, die dann durch Dichtegradientenzentrifugation aufgelöst wurde. Nach der Sammlung wurden die Fraktionen durch Western Blot analysiert, strategisch gepoolt und für die multiplexierte quantitative Proteomik mit LC-SPS-MS3-Analyse vorbereitet. Die Peptididentifizierung und -quantifizierung wurde in ProteomeDiscoverer durchgeführt, wobei die weitere Verarbeitung einschließlich Aggregation und Normalisierung in R durchgeführt wurde. Datensätze wurden visuell (t-SNE) und mit unbeaufsichtigtem Clustering (HDBSCAN) überprüft. Unbeaufsichtigtes Clustering leitete die Kuratierung von Markerproteinen, die mit Novelty-TAGM verknüpft sind, für die weitere Entdeckung in T. congolense. Die resultierenden Markerproteine ​​wurden bei der Klassifizierung nicht charakterisierter Proteine ​​mithilfe von TAGM-MAP verwendet. Weitere Analysen wurden mit TAGM-MCMC durchgeführt, um Einblicke in Proteine ​​zu erhalten, die mit TAGM-MAP nicht klassifiziert wurden und sich möglicherweise an mehreren Orten befinden. Bild erstellt mit BioRender.com. B Drei experimentelle hyperLOPIT-Iterationen (Nr. 1–3) wurden durchgeführt und die Daten aller Iterationen wurden pro Zelltyp verkettet. Venn-Diagramme zeigen, dass die endgültigen Datensätze etwa 5500 Proteine ​​pro Zelltyp enthalten, für die quantitative 33-Plex-Daten vorliegen. Die Reduzierung der C-Dimensionalität mittels t-SNE-Projektion erleichtert die Visualisierung jedes 33-dimensionalen Datensatzes in zwei Dimensionen, wodurch die Struktur innerhalb der Daten sichtbar wird. Jeder Punkt repräsentiert ein Protein.

In der räumlichen Proteomik erreicht oft kein einzelnes Experiment eine optimale Auflösung des subzellulären Kompartiments, jedoch können mehrere Experimente in Kombination insgesamt die Kompartimentauflösung und die Proteinlokalisierung verbessern35. Daher wurden für jeden der vier Zelltypen drei experimentelle Iterationen durchgeführt. In jedem Fall wurden die Zelllyse- und Fraktionspooling-Methoden zwischen jedem der drei unabhängigen Experimente (Ergänzungsdaten 1) variiert, um die Gesamtauflösung nach der Kombination der Daten zu verbessern. In den drei experimentellen Iterationen wurden 6561–6692 Proteine ​​identifiziert und die Quantifizierungen aus jedem der 11-Plex-Experimente wurden verkettet (wodurch ein 33-Plex-Datensatz erstellt wurde; siehe Ergänzende Anmerkung). Die Hauptkomponentenanalyse wurde verwendet, um zu zeigen, dass die 11-Plex-Fraktionen trotz absichtlicher Variation der experimentellen Methode zwischen den Experimenten dazu neigen, sich über die Experimente hinweg zusammenzuballen, was auf eine gute Reproduzierbarkeit der Fraktionierungsmethode hinweist (ergänzende Abbildung 2)36,37. Proteine, die in jeder Iteration pro Zelltyp fehlten, wurden entfernt. Dies führte zu 5439–5731 Proteinen für die räumliche Proteomcharakterisierung (Abb. 1B und ergänzende Daten 2). Nach der Normalisierung wurde jeder 33-dimensionale Datensatz durch t-SNE (t-verteilte stochastische Nachbareinbettung) zur Visualisierung in zwei Dimensionen projiziert (Abb. 1C)38. Dies offenbarte die Struktur in jedem Datensatz mit Auflösung diskreter Proteinsammlungen entsprechend der Ähnlichkeit der Häufigkeitsprofile auf dem Dichtegradienten, von denen wiederum zu erwarten wäre, dass sie ähnliche subzelluläre Lokalisierungen aufweisen39.

Als nächstes wurde die Datenstruktur untersucht, um festzustellen, ob sie der Auflösung subzellulärer Nischen entsprach. Zunächst wurden die Häufigkeitsverteilungsprofile ausgewählter funktionell verwandter Gruppen von Proteinen oder Proteinkomplexen in T. brucei BSF und PCF visualisiert (Ergänzende Abbildung 3 und Ergänzende Daten 3). Proteinfunktionelle Kohorten zeigten klare Hinweise auf gemeinsame unterschiedliche Verteilungen über den Gradienten. Diese Verteilungen weisen auf eine unterschiedliche Auflösung funktionell verwandter Proteine ​​innerhalb der T. brucei-Datensätze hin, die mit ihrer räumlichen Organisation übereinstimmt.

Um die räumliche Auflösung globaler und datengesteuert zu bewerten, wurden die Datensätze einem unbeaufsichtigten Clustering mit HDBSCAN (Hierarchical Density-Based Spatial Clustering of Applications with Noise)28,40 unterzogen. In diesem Algorithmus wurde die Ähnlichkeit der Proteinhäufigkeitsprofile über die 33 TMT-Kanäle (entsprechend drei Experimenten) bewertet. Jeder resultierende Cluster stellt einen Satz von Proteinen dar, die entlang des Dichtegradienten kollektiv gut aufgelöst sind und die wiederum wahrscheinlich diskrete subzelluläre Nischen darstellen. Die HDBSCAN-Analyse ergab 20–30 Cluster, die zusammen aus 1144–1302 Proteinen pro Zelltyp mit 9–417 Proteinen pro Cluster bestanden, wie in t-SNE-Projektionen hervorgehoben (Abb. 2). Die Anreicherungsanalyse von GO CC (Gene Ontology Cellular Component) bestätigte, dass die Cluster einen vielfältigen Satz relevanter biologischer Nischen innerhalb der Zelle darstellen (Abb. 2). In einigen Fällen wurde auch eine Auflösung von Unterkompartimenten beobachtet, beispielsweise gab es in jedem Zelltyp eine Auflösung von membranösen und löslichen mitochondrialen Proteinen (Abb. 2). Der Inhalt jedes HDBSCAN-Clusters wurde auch auf Proteinmerkmale analysiert, einschließlich pI (isoelektrischer Punkt), TM-Domänen (Transmembran), Signalpeptide und GPI-Anker (Glycosylphosphatidylinositol) (Ergänzende Abbildung 4 und ergänzende Daten 4) 41, 42, 43. 44. Die biophysikalischen Eigenschaften der Cluster zeigten eine klare und rationale unterschiedliche Auflösung. Beispielsweise zeigten mit mitochondrialen Proteinen angereicherte Cluster einen alkalisch verschobenen pI, wohingegen mit Zytosolproteinen angereicherte Cluster einen sauer verschobenen pI zeigten (ergänzende Abbildung 4A)45. Proteine ​​mit vorhergesagten TM-Domänen befanden sich in Clustern, die mit verwandten GO-CC-Begriffen assoziiert waren, wie z. B. den Mitochondrienmembranen, dem ER (endoplasmatisches Retikulum) und der Häutchenmembran (Abb. 2). Proteine, von denen vorhergesagt wurde, dass sie Signalpeptide oder GPI-Anker enthalten, befanden sich hauptsächlich in Clustern, die mit GO-CC-Begriffen wie „Endomembransystem“ assoziiert sind (ergänzende Abbildung 4B). Zusammengenommen zeigen diese Analysen die Auflösung verschiedener subzellulärer Kompartimente mit relevanten zusammengesetzten biochemischen Proteinmerkmalen entsprechend den Erwartungen in jedem Datensatz.

HDBSCAN-Cluster wurden auf t-SNE-Projektionen für (i) T. brucei BSF, (ii) T. brucei PCF, (iii) T. congolense BSF und (iv) T. congolense PCF hervorgehoben. Signifikant vertretene GO CC-Begriffe in jedem Cluster werden in der Legende angezeigt, die jeder t-SNE-Projektion zugeordnet ist (NS = nicht signifikant, ohne signifikant vertretene Begriffe). Die proportionale Darstellung der vorhergesagten einzelnen oder mehreren TM-Domänen unter den Proteinen in jedem Cluster wird unter jedem Clusternamen in der zugehörigen Legende angezeigt.

Als nächstes wurden die räumlichen Proteome mithilfe halbüberwachter maschineller Lernansätze charakterisiert. Zur Verwendung mit LOPIT-Daten wurden verschiedene Methoden entwickelt, um nicht markierte Proteine ​​einer Reihe von Kompartimenten zuzuordnen und so das räumliche Proteom zu definieren25,26,27. Hier wurde dies unter Verwendung des TAGM-Modells (t-augmented Gaußsche Mischung) mit der TAGM-MAP-Methode (maximum a posteriori) durchgeführt. Dadurch wird die Wahrscheinlichkeit berechnet, dass ein Protein zu einem der vordefinierten subzellulären Kompartimente und einer Ausreißerkomponente gehört, was als Grundlage für die Proteinklassifizierung verwendet werden kann. Um diese Analyse durchzuführen, wurden zunächst Markerproteine ​​benötigt, die gemeinsam die Kompartimente der Zelle repräsentieren.

T. brucei-Marker wurden auf der Grundlage einer Literaturrecherche und einer GO-CC-Anmerkung ausgewählt und durch die HDBSCAN-Clusterbildung geleitet, wobei Ausreißerproteine ​​oder Proteine, die unterschiedlich zwischen BSF und PCF lokalisiert waren, ausgeschlossen wurden (Ergänzende Abbildung 5A und Ergänzende Daten 5). T. congolense ist weniger gut untersucht, daher war dieser Ansatz nicht durchführbar. Stattdessen wurde ein erster Markersatz basierend auf Orthologen von T. brucei-Markern oder TAGM-MAP-Zuordnungen entwickelt und durch HDBSCAN-Clustering geleitet. Da Unterschiede zwischen T. brucei und T. congolense zu nicht repräsentierten, aber aufgelösten biologischen Nischen führen könnten, wurde auch die halbüberwachte Bayes'sche Methode, Neuheit TAGM, unter Verwendung dieses anfänglichen Markersatzes durchgeführt (Supplementary Data 5-6)46. Dieser Algorithmus ermöglicht neben der Zuordnung von Proteinen zu definierten Kompartimenten auch die Entdeckung unbeschrifteter Kompartimente. Die resultierenden Zuordnungen wurden verwendet, um separat aufgelöste Kompartimente in T. congolense zu definieren und die Expansion von Markern in vorhandenen Kompartimenten zu steuern (ergänzende Abbildung 6A). Insgesamt wurden 891 T. brucei-Markerproteine ​​ausgewählt, wobei 852 und 849 Proteine ​​20 verschiedene subzelluläre Nischen im BSF bzw. PCF repräsentierten (ergänzende Abbildungen 5B, C, Tabelle 1 und ergänzende Daten 5 und 7). Für T. congolense wurden insgesamt 734 Markerproteine ​​ausgewählt, wobei 719 und 713 Proteine ​​23 bzw. 19 verschiedene subzelluläre Nischen in BSFs bzw. PCFs repräsentierten (Ergänzende Abbildungen 6B, C, Tabelle 1 und Ergänzende Daten 5 und 7).

Als nächstes wurde die Klassifizierung unmarkierter Proteine ​​​​unter Verwendung von TAGM-MAP durchgeführt, um Proteine ​​​​subzellulären Kompartimenten zuzuordnen (Abb. 1A und ergänzende Daten 8 und 9). Jedem Protein wurde probabilistisch eine Kompartimentzuordnung zugewiesen. Zuordnungen stellen die wahrscheinlichste Kompartimentlokalisierung jedes Proteins im Datensatz dar. Proteinklassifizierungen werden durch Anwenden eines Schwellenwerts auf diese Zuordnungen erstellt, wobei Proteine, die die Kriterien nicht erfüllen, als „unbekannt“ gekennzeichnet werden. Um die Reproduzierbarkeit der Ergebnisklassifizierungen zwischen einzelnen experimentellen Iterationen innerhalb von Zelltypen zu beurteilen, wurden Klassifizierungen für jeden einzelnen 11-Plex-Datensatz durchgeführt (vor der Verkettung in die jeweiligen 33-Plex-Datensätze). Einzelne Datensätze wurden paarweise unter Verwendung des angepassten Rand-Index verglichen und zeigten eine gute Konsistenz (> 0,85 für alle paarweisen Vergleiche), was die Reproduzierbarkeit zwischen experimentellen Iterationen demonstrierte (ergänzende Abbildung 7 und ergänzende Daten 8)47. Um die räumlichen Proteome für jeden Zelltyp zu definieren, wurden anschließend endgültige Klassifizierungen erstellt, indem für jeden kombinierten 33-Plex-Datensatz eine TAGM-MAP-Analyse durchgeführt wurde (Abb. 1A und ergänzende Daten 9). Mit diesem Ansatz wurden 2679- und 2795-Proteine ​​in T. brucei BSF bzw. PCF klassifiziert (Abb. 3A, B und ergänzende Daten 9). In T. congolense wurden 2507- und 2504-Proteine ​​in BSF bzw. PCF klassifiziert (Abb. 3A, B und ergänzende Daten 9). Diese vier räumlichen Proteome liefern einen umfassenden Lokalisierungsdatensatz für zwei eng verwandte Arten über jeweils zwei Lebensstadien, was in dieser Größenordnung bisher bei keinem parasitären Organismus erreicht wurde.

A Markerproteine ​​und TAGM-MAP-Klassifizierungen werden auf t-SNE-Projektionen für (i) T. brucei BSF, (ii) T. brucei PCF, (iii) T. congolense BSF und (iv) T. congolense PCF hervorgehoben (Kompartimentfarben sind wie in Tafel B angegeben). B-Markerproteine ​​(transparenter Bereich) und TAGM-MAP-Klassifizierungen unmarkierter Proteine ​​(undurchsichtiger Bereich), proportional dargestellt auf Balkendiagrammen, gruppiert nach Kompartiment für den angegebenen Zelltyp. Die Gesamtzahl der Proteine ​​ist rechts angegeben. C Violindiagramme, die die Verteilung der Lokalisierungswahrscheinlichkeiten über jedes subzelluläre Kompartiment gemäß der TAGM-MCMC-Analyse in T. brucei PCF für (i) MICU1 und (ii) SDH1 zeigen.

Um die Genauigkeit der TAGM-MAP-Klassifizierungen abzufragen und zu validieren, wurden die vier Datensätze mithilfe alternativer Lokalisierungsanmerkungen untersucht. Für jeden subzellulären Ort wurden klassifizierte Proteine ​​einer GO-CC-Terminreicherungsanalyse unterzogen (Abb. 4A und ergänzende Abb. 8). Die GO CC-Begriffsanmerkung umfasst kuratierte Lokalisierungen, die auf experimentellen Studien basieren43. Dies ergab klare und sinnvolle Muster für alle Kompartimente aller Zelltypen. Beispielsweise wurde Flagellum 1 mit Begriffen wie „Axonem“ und „paraflagellarer Stab“ angereichert, während Sekretions-/Endozytose 1–3 mit Begriffen wie „Pellicularmembran“, „Golgi-Apparat“ und „Ziliartasche“ angereichert wurden. Die subzelluläre Lokalisierung von Proteinen wurde auch mit sequenzbasierten Lokalisierungsvorhersagen unter Verwendung von DeepLoc verglichen (Abb. 4B und ergänzende Daten 4)48. Vorhersagen für Proteine, die in den vier Datensätzen jedem subzellulären Kompartiment zugeordnet wurden, zeigten eine klare Übereinstimmung bei der Proteinlokalisierung. Als Beispiele: 66–73 % der Zytosolklassifikationen zeigten eine DeepLoc-Vorhersage des Zytoplasmas und 74–81 % der kollektiven Mitochondrienklassifikationen (Mitochondrium – OM (äußere Membran), IM (innere Membran) und Matrix 1, 2 und 3) zeigte eine DeepLoc-Vorhersage des Mitochondriums. Zusammengenommen weisen die GO CC-Begriffe und DeepLoc-Vorhersagen in jedem Satz von hyperLOPIT-Kompartimentklassifizierungen auf ein hohes Maß an Übereinstimmung der TAGM-MAP-Klassifizierungen mit alternativen Lokalisierungsansätzen hin.

Eine Heatmap der GO CC-Begriffsdarstellung in TAGM-MAP-Klassifikationen für T. brucei BSF. hyperLOPIT-Kompartimente sind auf der Y-Achse, GO CC-Terme sind auf der X-Achse, Farben sind mit −log10 (p-Wert) skaliert für die Überrepräsentation von GO CC-Termen im angegebenen Kompartiment gegenüber dem Hintergrundproteom. B DeepLoc-Vorhersagen für subzelluläre Kompartimente, visualisiert mit Balkendiagrammen proportional, gruppiert nach Kompartiment für (i) T. brucei BSF, (ii) T. brucei PCF, (iii) T. congolense BSF und (iv) T. congolense PCF. Die Gesamtzahl der klassifizierten Proteine ​​für jedes Kompartiment ist rechts angegeben.

Die TAGM-MAP-Analyse lieferte umfassende Einblicke in die räumliche Organisation der Trypanosomenzelle mit der Klassifizierung Tausender Proteine ​​in subzelluläre Kompartimente. In einigen Fällen wurden Proteine ​​aufgrund der Unsicherheit aufgrund der dynamischen Proteinlokalisierung – Lokalisierung in mehr als einem subzellulären Kompartiment – ​​nicht mit ausreichender Sicherheit einem einzelnen Kompartiment zugeordnet. Um Einblicke in solche Fälle zu erhalten, wurde TAGM-MCMC (Markov-Kette Monte-Carlo) eingesetzt (Supplementary Data 10). 84–86 % der TAGM-MAP-Klassifizierungen stimmen mit denen der TAGM-MCMC-Zuordnungen überein. Der Hauptnutzen von TAGM-MCMC für diese Datensätze ist der Einblick in die Lokalisierung von Proteinen, die in TAGM-MAP aufgrund einer möglichen dynamischen Lokalisierung unbekannt waren. In mehreren Fällen werden Proteine ​​hervorgehoben, die möglicherweise in mehr als einem Kompartiment lokalisiert sind. Beispielsweise zeigt MICU1 (mitochondriale Calciumaufnahme 1) bei T. brucei PCF, wo die mitochondrialen Membranen besonders gut aufgelöst waren, ein Maß an Unsicherheit im Zusammenhang mit dem mitochondrialen IM und OM. Dieses Protein ist am Kalziumimport im Mitochondrium beteiligt und bildet möglicherweise eine Kontaktstelle zwischen IM und OM (Abb. 3C)10,49,50. In ähnlicher Weise zeigt die Succinatdehydrogenase SDH1 Unsicherheit mit der mitochondrialen Matrix 2 und IM. Dies wird durch ihre Lokalisierung in der mitochondrialen Matrix und eine weitere funktionelle Assoziation mit SDH an der inneren Mitochondrienmembran unterstützt (Abb. 3C)51.

Die vier räumlichen Proteome wurden durch die Implementierung von unbeaufsichtigtem und halbüberwachtem maschinellem Lernen über die Algorithmen HDBSCAN, Novelty TAGM, TAGM-MAP und TAGM-MCMC entwickelt und charakterisiert. Die TAGM-MAP-Klassifikationen sind die primären Klassifikationen und bilden die Grundlage für die in dieser Arbeit beschriebenen räumlichen Proteome. Die vier Datensätze liefern Hinweise auf die Expression von ~5500 Proteinen mit 2504–2795 Klassifizierungen in 19–23 Kompartimenten pro Zelltyp. Abfrage der räumlichen Proteome, wie in Abb. dargestellt. 2–4 und ergänzende Abbildungen. 2–6 zeigen, dass bekannte Kompartimente der Zelle durch die hier verwendete Methodik definitiv aufgelöst wurden. Alle wichtigen subzellulären Nischen der Zelle wurden in dieser Analyse dargestellt, einschließlich löslicher zytosolischer Proteine, großer Molekülkomplexe und solcher in Membrankompartimenten oder Zytoskelettstrukturen. Jeder dieser Datensätze stellt eine räumliche Karte bereit, die einzeln oder in verschiedenen Kombinationen verwendet werden kann, um Informationen über einzelne Proteinlokalisationen oder Proteinkomponenten zellulärer Strukturen oder Organellen zu erhalten. Zusätzlich zu den hier enthaltenen Datensätzen sind die Daten auch in einem interaktiven Format über eine R Shiny-Anwendung verfügbar.

Das Zytosol war eines der größten Kompartimente. Einige zytosolische Proteinkomplexe wurden separat aufgelöst, einschließlich des Proteasoms und des Proteasom-Regulationspartikels, zusätzlich zu den Ribonukleoproteinen 1 und 2, die überwiegend aus ribosomalen Proteinen oder Translationsinitiationsfaktoren bestanden. Auch kleine membranöse Organellen im Zytoplasma waren vertreten, darunter die Acidocalcisomen und Glykosomen.

Der Kern wurde in zwei Kompartimente aufgeteilt: Das erste enthielt Chromatinkomponenten, während das zweite nukleoläre und Nicht-Chromatinkomponenten enthielt. Letzteres war mit nukleolären Proteinen angereichert, enthielt aber auch Proteine, die an anderen kernlokalen Prozessen wie dem Spleißen beteiligt sind. Es gibt Beispiele für Proteine, von denen erwartet wird, dass sie im Zellkern dem Zytosol zugeordnet werden. In manchen Fällen handelt es sich hierbei um einen illegalen Handel, beispielsweise wurden mehrere Importine dem Zytosol zugeordnet. Es gibt auch Fälle, in denen dies auf einen Bruch oder ein Austreten des Zellkerns während der Lyse- oder Trennmethode zurückzuführen sein kann. Der Zellkern reagiert besonders empfindlich auf Bruch und die hier gewählte Lysemethode, die darauf abzielt, ein mit allen subzellulären Kompartimenten angereichertes Lysat zu erzeugen, ist nicht diejenige, die für eine kernspezifische Untersuchung verwendet werden würde.

Das Mitochondrium wurde in dieser Analyse besonders gut aufgelöst, einschließlich der mitochondrialen Matrix- und Membranproteine ​​in allen Zelltypen. Darüber hinaus wurden in den PCFs die mitochondrialen IM und OM aufgelöst. Trotz des Fehlens unbeaufsichtigter Cluster, die für das OM in BSFs repräsentativ sind, zeigte die visuelle Untersuchung eine Auflösung verwandter Proteine, und das OM wurde als Kompartiment für Klassifizierungen in allen Zelltypen ausgewiesen. Es wurde eine funktionelle Auflösung der mitochondrialen Matrix in bis zu drei unterschiedlichen Nischen beobachtet. Die Untergruppierung war nicht bei allen Zelltypen konsistent, mit einigen Unterschieden zwischen Matrix 1 und 3 bei Markern und Klassifizierungen. Mitochondriale Matrix 1 enthält große und/oder kleine mitochondriale ribosomale Proteine, wobei große ribosomale Proteine ​​in mitochondrialer Matrix 2 in T. congolense PCF und Matrix 3 in BSF enthalten sind. Die mitochondriale Matrix 2 umfasst Proteine, die an verschiedenen mitochondrialen lokalisierten biochemischen Prozessen beteiligt sind, einschließlich der RNA-Bearbeitung; Eisen-Schwefel-Cluster-Anordnung; und Proteinfaltung52. Die mitochondriale Matrix 3 wurde nur in T. congolense BSF abgetrennt und mit einer Untergruppe großer ribosomaler Proteine ​​angereichert. Dieses Maß an Suborganellenauflösung ist für LOPIT-Studien beispiellos. Darüber hinaus befanden sich bei gemeinsamer Betrachtung als einzelnes Kompartiment (Matrix- und Membranproteine) 751–1091 Proteine ​​im mitochondrialen Satz, was es zum größten Kompartiment in dieser Analyse macht (Tabelle 1 und ergänzende Daten 7).

Zytoskelettkompartimente wurden durch die Flagellum 1 und 2 sowie die Mikrotubulistrukturen 1 und 2 dargestellt. Flagellum 1 umfasst die zentralen Zytoskelettkomponenten des Flagellums, einschließlich des Axonems und des Paraflagellarstabs. Nur in T. congolense BSF wurde eine Untergruppe von Flagellenproteinen in einem zweiten Kompartiment mit der Bezeichnung Flagellum 2 aufgelöst, das überwiegend paraflagellare Stäbchenproteine ​​enthielt. Diese Auflösung kann auf die Flagellum-vermittelte Anhaftung von T. congolense BSF an Kulturflaschen zurückzuführen sein, die die Kompartimentintegrität während der Ernte beeinträchtigt53,54. Mikrotubuli-Strukturen 1 umfassen Zytoskelettproteine, die mit Flagellen- und Mikrotubuli-proximalen Strukturen assoziiert sind, einschließlich Proteinen, die im Bilappen, im Mikrotubuli-Quartett oder im Basalkörper lokalisiert sind. Mikrotubuli-Strukturen 2 umfassen Proteine, die mit dem Zytoskelett interagieren, einschließlich derjenigen, die an der Organisation des Zytoskeletts, der Bewegung auf Mikrotubuli-Basis und der Zellteilung beteiligt sind. Unter den verschiedenen Zelltypen umfasst dieser Satz Proteine, die mit den subpellikulären Mikrotubuli, dem FAZ-Filament (Flagellum-Anheftungszone) und der FAZ-Spitze assoziiert sind55. Von vielen Proteinen in diesem Satz wurde berichtet, dass sie sich in der Spaltfurche lokalisieren, an der Zytokinese beteiligt sind oder mit Zytokineseregulatoren interagieren56,57,58.

Komponenten des Sekretionswegs, einschließlich des ER, waren ebenfalls vertreten. Das ER enthält einen hohen Anteil (51–72 %) an Proteinen, von denen vorhergesagt wird, dass sie TM-Domänen enthalten, was mit dem Vorhandensein von ER-Membranproteinen und Proteinen übereinstimmt, die für die Oberfläche oder andere Kompartimente bestimmt sind. Der kollektive Post-ER-Sekretionsweg, der Oberflächen-, der endozytische Weg und der endosomale Weg wurden in bis zu drei Kompartimente mit der Bezeichnung sekretorisch/endozytisch 1–3 aufgelöst. Sekretorisches/endozytäres 1 umfasst Golgi-, Flagellentaschen-, Transport- und lysosomale Proteine. Sekretorisch/endozytisch 2 umfasst mutmaßliche Oberflächentransporter, einschließlich Mitgliedern gut konservierter Genfamilien: Aminosäure- (hOG00078), Nukleosid- (hOG00116) und Hexosetransporter (hOG00081)59. Sekretorisches/endozytäres 3 umfasst mutmaßliche Oberflächen- und endosomale Proteine ​​sowie viele Proteine, die stadienspezifisch sind oder bei den anderen Arten keine Orthologen aufweisen. Die neue TAGM-Analyse und die Überprüfung verwandter Proteine ​​in T. congolense PCF ergaben keinen Hinweis darauf, dass hier ein sekretorisches/endozytäres 3-Gegenstück gelöst wurde, daher wurde es für diesen Zelltyp weggelassen.

Während die räumlichen proteomischen Ergebnisse für die vier Zelltypen unabhängig voneinander genutzt werden können, können die Datensätze auch verglichen werden, um Aufschluss über neue oder abweichende Merkmale zwischen Lebensstadien oder Arten zu geben (Tabelle 1 und ergänzende Daten 7).

Um Lebensstadien zu vergleichen, wurden gemeinsame Proteine ​​zwischen Kompartimenten von BSF und PCF innerhalb einer Art in einer Heatmap visualisiert (Abb. 5A). 4844- und 5051-Proteine ​​waren BSF und PCF in T. brucei bzw. T. congolense gemeinsam. Wie erwartet gab es in den meisten Kompartimenten eine gute Übereinstimmung innerhalb jeder Art. Die Zellkern- und Mikrotubuli-Strukturen zeigten die geringste Übereinstimmung. Insgesamt weisen die Mikrotubuli-Strukturen 2 die geringste Übereinstimmung zwischen den Lebensstadien auf, wobei viele der unterschiedlichen Lokalisierungen auf die Klassifizierung in andere Kompartimente des Zytoskeletts (Flagellum und Mikrotubuli-Strukturen 1) im anderen Lebensstadium zurückzuführen sind. Da in diesem Satz an der Zellteilung beteiligte Proteine ​​mit dynamischer Lokalisierung gefunden werden und diese Zellen asynchron waren, entstehen solche Unterschiede aufgrund räumlich-zeitlicher Divergenzen im Zellzyklus zwischen den BSFs und PCFs60,61. Zu den Proteinen mit unterschiedlicher Lokalisierung im Zellkern gehörten 81 T. brucei-Proteine, die bei PCF dem Zellkern zugeordnet wurden, bei BSF jedoch Ribonukleoproteine. Dazu gehörten Marker für Stressgranula wie DHH1, MKT1, PABP2, PBP1 und SCD662. T. brucei BSF war einer längeren Ernte als PCF sowie unterschiedlichen Waschbedingungen ausgesetzt, was möglicherweise zur Bildung von Stresskörnern geführt hat. Die Einstufung dieser Proteine ​​in den Zellkern bei T. brucei PCF ist wahrscheinlich mit Körnchen in der Kernperipherie verbunden, von denen berichtet wird, dass sie viele der gleichen Proteine ​​wie Stresskörnchen enthalten und in der Kernperipherie lokalisiert sind63. Es gab auch Fälle einer Klassifizierung in den Zellkern bei T. brucei BSF und in das Zytosol bei PCF. Wie bereits beschrieben, ist neben Proteinen, die zwischen dem Zellkern und dem Zytosol transportiert werden, für einige dieser Probleme auch das Austreten des Zellkerns während der experimentellen Methode verantwortlich.

Eine Heatmap der Übereinstimmung zwischen den Kompartimenten gemeinsamer Proteine ​​in (i) T. brucei BSF und PCF und (ii) T. congolense BSF und PCF. Die Fliesenfarbe wird durch die Übereinstimmung zwischen den Lebensstadien skaliert. B Häufigkeitsverteilungsprofil für RISP in (i) T. brucei BSF, (ii) T. brucei PCF, (iii) T. congolense BSF und (iv) T. congolense PCF in Bezug auf die Zuordnung zu einer der Mitochondrien-Matrix in BSFs oder IM in PCFs. C Proportionale Darstellung von Kompartimenten in stadienspezifischen Proteinen, visualisiert in Balkendiagrammen für den angegebenen Zelltyp. D Lollipop-Diagramm, das die Faltenanreicherung für überrepräsentierte Kompartimente in stadienspezifischen Proteinen für den angegebenen Zelltyp zeigt. Die Kreisgröße wird anhand der Anzahl der Proteine ​​im angegebenen Kompartiment und die Farbe anhand des p-Werts für die Überrepräsentation des Kompartiments gegenüber dem Hintergrundproteom skaliert. Die Anreicherungsanalyse wurde mit der Enricher-Funktion von ClusterProfiler (v4.0.5) mit Standardeinstellungen (hypergeometrischer Test p < 0,05 mit Benjamini- und Hochberg-Anpassung) durchgeführt.

Es wurde auch eine stadienspezifische unterschiedliche Lokalisierung von Proteinen zwischen anderen Kompartimenten beobachtet, die teilweise auf mechanische Unterschiede zurückzuführen sein könnte, die zu einer unterschiedlichen Dissoziation während der Lyse führten. Beispielsweise wurde der TAC (Tripartite Attachment Complex) nicht als einzelnes Kompartiment aufgelöst und einige TAC-Proteine, die in T. brucei BSF den Mikrotubulistrukturen 1 zugeordnet wurden, befanden sich in PCF in mitochondrialen Kompartimenten. Angesichts der Position des TAC am Basalkörper und an der Mitochondrienmembran können solche unterschiedlichen Lokalisierungen das Ergebnis einer unterschiedlichen Trennung während der Lyse oder einer Diversität in der Anordnung dieser Strukturen zwischen den Zelltypen sein. Andere Abweichungen scheinen gutgläubig zu sein, zum Beispiel wurde RISP (Rieske-Eisen-Schwefel-Protein) bei PCF T. brucei und T. congolense dem mitochondrialen IM zugeordnet, bei T. brucei BSF jedoch der Matrix (Abb. 5B). Es wird auch der Matrix in T. congolense BSF zugeordnet, allerdings unterhalb der Konfidenzschwelle für die Klassifizierung. RISP ist eine wesentliche Untereinheit für die Aktivität von Komplex III in der Elektronentransportkette am IM. Der Zusammenbau von Komplex III erfolgt sequentiell nach dem Import, sodass das Fehlen einer Untereinheit den Zusammenbau beeinträchtigen kann. Es wird berichtet, dass T. brucei BSF eine reduzierte Elektronentransportkette aufweist, wobei Komponenten der Komplexe III und IV funktionell fehlen64. Hier wurde die Komplex-III-Untereinheit Ubiquinol-Cytochrom-C-Reduktase (Tb927.10.4280/TcIL3000.A.H_000752100) in beiden PCF-Stadien dem IM zugeordnet, fehlte jedoch in beiden BSFs. In Hefe geht dieses Protein RISP beim Aufbau des Komplexes III65 voraus. Das Fehlen dieses Proteins steht daher im Einklang mit der Anwesenheit von RISP in der Matrix und nicht an der mit Komplex III integrierten IM.

Innerhalb jeder Art gab es 593–743 stadienspezifische Proteine ​​– Proteine, die ausschließlich in nur einem Lebensstadium pro Art vorkamen. Die Darstellung der LOPIT-Kompartimente unter stadienspezifischen Proteinen wurde in Balkendiagrammen visualisiert (Abb. 5C). Die Anreicherungsanalyse zeigte, dass das sekretorische/endozytische Kompartiment mit Proteinen angereichert war, die nur für T. brucei BSF, T. congolense BSF und T. congolense PCF gelten (Abb. 5D). Während die Mitochondrienmembranen ausschließlich mit Proteinen angereichert waren, die nur in den PCF-Stadien vorkommen (Abb. 5D). Zu den stadienspezifischen sekretorischen/endozytischen Proteinen in den BSFs gehören Proteine, die als VSGs (variante Oberflächenglykoproteine) und ISGs (invariante Oberflächenglykoproteine) bezeichnet werden, zusätzlich zu Proteinen, die an der Wirtsinteraktion beteiligt sind, wie FHR (Faktor-H-Rezeptor) und HpHbR (Haptoglobin). -Hämoglobinrezeptor) in T. brucei BSF66,67. In den PCFs umfassen stadienspezifische sekretorische/endozytische Proteine ​​Transsialidasen, Adenylat- und Guanylatcyclasen sowie Aminosäuretransporter. Zu den stadienspezifischen mitochondrialen Membranproteinen in PCFs gehören Komponenten der Elektronentransportkette wie Cytochromoxidase-Untereinheiten. Diese Daten zeigen, inwieweit die sekretorischen/endozytischen Kompartimente in beiden Lebensstadien und das Mitochondrium ausschließlich in PCFs als Punkt der Entwicklungsanpassung fungieren.

Um Unterschiede zwischen Arten zu untersuchen, wurden die mit OrthoFinder bestimmten Kompartimente von 1-zu-1-Orthologen zwischen äquivalenten Lebensstadien jeder Art in einer Heatmap visualisiert (Ergänzungsdaten 11 und Abb. 6A). Basierend auf den 1-zu-1-Orthologen gab es 3635 Proteine, die den BSFs gemeinsam waren, und 3887 Proteine, die den PCFs von T. brucei und T. congolense gemeinsam waren. Wie bei der Intra-Arten-Analyse gab es in den meisten Kompartimenten eine gute Übereinstimmung zwischen den Arten. Die Kompartimente mit der geringsten Übereinstimmung waren wiederum der Zellkern und die Mikrotubuli 2. Ein ähnliches Profil der Divergenz zwischen den Kompartimenten wurde beobachtet wie in der zuvor beschriebenen vergleichenden Analyse im Lebensstadium. Es traten jedoch auch neuartige Divergenzen auf, beispielsweise wurde CDA (Cytidin-Desaminase) bei T. congolense BSF und PCF dem Zytosol zugeordnet, bei T. brucei BSF jedoch der mitochondrialen Matrix (Abb. 6B). Es wurde auch der mitochondrialen Matrix in T. brucei PCF zugeordnet, wenn auch unterhalb der TAGM-MAP-Konfidenzschwelle, und die TAGM-MCMC-Analyse legt nahe, dass dies auf die Unsicherheit zwischen der mitochondrialen Matrix 1 und 2 zurückzuführen ist (Abb. 6C und ergänzende Daten 10). CDA wurde im Mitochondrium von T. brucei PCF lokalisiert und fungiert bei der Pyrimidin-Rückgewinnung, wobei nachgeschaltete Schritte im Zytosol stattfinden68. Die Lokalisierung im Zytosol bei T. congolense stimmt auch mit anderen Eukaryoten überein, zum Beispiel wird menschliches CDA (P32320) als zytosolisch bezeichnet69.

Eine Heatmap der Übereinstimmung zwischen Kompartimenten in 1-zu-1-Orthologen gemeinsamer Proteine ​​in (i) T. brucei BSF und T. congolense BSF und (ii) T. brucei PCF und T. congolense PCF. Die Fliesenfarbe wird durch die Übereinstimmung zwischen den Lebensstadien skaliert. B Häufigkeitsverteilungsprofil für CDA in (i) T. brucei BSF, (ii) T. brucei PCF, (iii) T. congolense BSF und (iv) T. congolense PCF in Bezug auf die Zuordnung entweder zum Mitochondrium in T. brucei oder zum Cytosol in T. congolense. C Violindiagramm, das die Verteilung der Lokalisierungswahrscheinlichkeiten über jedes subzelluläre Kompartiment gemäß der TAGM-MCMC-Analyse in T. brucei PCF für CDA zeigt. D Proportionale Darstellung von Kompartimenten in verschiedenen Genset-Proteinen, visualisiert in Balkendiagrammen für den angegebenen Zelltyp. E Lollipop-Diagramm, das die Faltenanreicherung für überrepräsentierte Kompartimente in verschiedenen Gensatzproteinen für den angegebenen Zelltyp zeigt. Die Kreisgröße wird anhand der Anzahl der Proteine ​​im angegebenen Kompartiment und die Farbe anhand des p-Werts für die Überrepräsentation des Kompartiments gegenüber dem Hintergrundproteom skaliert. Die Anreicherungsanalyse wurde mit der Enricher-Funktion von ClusterProfiler (v4.0.5) mit Standardeinstellungen (hypergeometrischer Test p < 0,05 mit Benjamini- und Hochberg-Anpassung) durchgeführt.

Als nächstes wurden Proteine ​​bewertet, die keine 1-zu-1-Orthologie zwischen T. brucei und T. congolense aufwiesen; Dies sind Fälle, in denen Orthogruppen mehr als ein Gen enthalten oder eine Orthogruppe artspezifisch ist (innerhalb von T. brucei, T. congolense, T. vivax und T. cruzi). Solche Fälle sind von besonderem Interesse bei der Betrachtung der Artbildung und umfassen erweiterte Genfamilien sowie artspezifische Genomzuwächse. Um solche Gene im Hinblick auf die räumlichen Proteome zu berücksichtigen, wurde gemäß der OrthoFinder-Analyse ein Satz von Proteinen, die durch erweiterte oder artspezifische Gene kodiert werden, als „diversifizierter Proteinsatz“ definiert. In jedem Zelltyp waren 429–716 Mitglieder dieser Gruppe vorhanden. Die Anreicherungsanalyse zeigte, dass das sekretorische/endozytische Kompartiment für alle Zelltypen mit diversifizierten Proteinen angereichert war (Abb. 6D, E). Dieser Satz enthält eine Orthogruppe (hOG00009) mit einem einzelnen Gen, das als atypisches VSG in T. brucei annotiert ist und auf 212 Gene in T. congolense erweitert wurde. Während dieses Protein in den Proteomen von T. brucei fehlt, waren 14 Mitglieder dieser Orthogruppe in den Proteomen von T. congolense vorhanden: 12 in BSF und vier in PCF. Von den BSF-Proteinen wurden acht als sekretorisch/endozytisch 3 klassifiziert; Es wird vorhergesagt, dass vier einen GPI-Anker enthalten und vier nicht – was an das GPI-Format des heterodimeren TfR (Transferrinrezeptor) erinnert, bei dem nur eine Untereinheit einen GPI-Anker besitzt70.

Um die molekularen Prozesse der evolutionären Diversifizierung dieser Parasiten, den angestammten Ursprung von Orthogruppen und Fälle von Genexpansion oder -kontraktion zwischen T. brucei-T. congolense wurden untersucht. Das sekretorische/endozytische Kompartiment wurde durchgängig mit Orthogruppen angereichert, die in allen Zelltypen Neuheit und Expansion zeigten, darunter beispielsweise nicht viele Orthogruppen zwischen T. brucei-T. kongolense und artspezifische Orthogruppen (Ergänzende Abbildung 9A – C). 27 Proteine ​​in Orthogruppen, die spezifisch für T. brucei oder spezifisch für T. brucei und T. congolense sind und nicht als VSGs oder ISGs annotiert wurden, waren in T. brucei BSF in sekretorischen/endozytären Zellen 1–3 eindeutig vorhanden. Es wird vorhergesagt, dass mindestens sechs eine dreihelikale bündelartige Struktur aufweisen, die in Oberflächenproteinen von Trypanosomen wie HpHbR und FHR beobachtet wurde (ergänzende Abbildung 9D)67,71,72,73. Dies zeigt den Nutzen dieses Datensatzes, insbesondere in Kombination mit anderen proteomweiten Ressourcen, bei der Beschleunigung von Studien, die sich auf interessierende subzelluläre Kompartimente wie die Oberfläche konzentrieren. Darüber hinaus hebt diese Analyse insgesamt die sekretorischen/endozytischen Kompartimente als aktive subzelluläre Nischen der evolutionären Diversifizierung dieser Arten hervor.

In dieser Studie wurden die Proteome zweier verwandter, aber unterschiedlicher afrikanischer Trypanosomenarten für zwei Lebensstadien kartiert. Insgesamt wurden 5439–5731 Proteine ​​nachgewiesen und 2504–2795 einem von 19–23 subzellulären Kompartimenten zugeordnet. Eine Reihe maschineller Lernmethoden wurde implementiert, um granulare Datensätze zu erhalten, die die intrinsische Auflösung innerhalb jedes Zelltyps widerspiegeln. Die Genauigkeit der Klassifizierungen wurde durch orthogonale und rechnerische Ansätze untermauert.

Diese umfassenden Datensätze umfassen die höchste Anzahl an Proteinen, die bisher in einer Proteomstudie bei T. congolense nachgewiesen wurden, und gehören zu den höchsten bei T. brucei. Sie sind beispielhafte Ressourcen für die Parasitenforschungsgemeinschaft und können durch die Integration mit bestehenden und zukünftigen Omics-Datensätzen leicht genutzt werden. Zusätzlich zu den Lokalisierungsinformationen zu Tausenden von Proteinen pro Zelltyp ist eine solche Proteomabdeckung als Beweis für die Proteinexpression in jedem Zelltyp nützlich. Dies ist von besonderem Wert für T. congolense, für das wesentlich weniger experimentelle Studien durchgeführt wurden als für T. brucei, von Untersuchungen der einzelnen Proteinfunktionen bis hin zu proteomweiten Analysen. Als besonders relevantes Beispiel war T. brucei Gegenstand einer proteomweiten Lokalisierungsstudie, bei der Proteinmarkierung und Mikroskopie zum Einsatz kamen9. Die Fähigkeit, eine solche Studie durchzuführen, wird durch die Fähigkeit erleichtert, T. brucei-PCFs einfach genetisch zu modifizieren, jedoch nicht durch eines, das derzeit für T. congolense repliziert werden könnte. Die hier beschriebene T. congolense-Analyse findet Anwendung bei der Hochdurchsatz-Proteinkuration. Beispielsweise enthalten etwa 800 Proteine, die in T. congolense subzellulären Kompartimenten zugeordnet sind, keine kuratierte GO CC-Annotation basierend auf 1-zu-1-Orthologen von T. brucei. Darüber hinaus werden Tausende von Genen in T. congolense als Pseudogene bezeichnet. Ungefähr 1200 davon wurden im räumlichen BSF- oder PCF-Proteom nachgewiesen, was auf eine falsche Annotation als Pseudogene hinweist und eine weitere Korrektur der Genomkuration ermöglicht. Diese Datensätze geben auch Einblick in die proteomischen Konsequenzen der genomischen Diversität zwischen T. brucei und T. congolense. Beispielsweise gibt es in T. congolense viele erweiterte Orthogruppen. Ob sich dies jedoch auf eine Erweiterung auf Proteinebene auswirkt, war für die meisten bisher unbekannt. Hier sind mehrere Fälle erkennbar, in denen sich die Erweiterung der Genfamilie auf Proteinebene widerspiegelt, wobei in T. congolense mehrere Proteine ​​derselben Orthogruppe nachgewiesen wurden.

Die hyperLOPIT-Datensätze sind besonders aussagekräftig, wenn sie vergleichend untersucht werden. Die subzellulären Kompartimente, die an der Anpassung und Artbildung des parasitären Wirts beteiligt sind, werden durch die Analyse stadienspezifischer Proteine ​​bzw. Proteine, die von Genen kodiert werden, die zwischen den Arten unterschiedlich waren, aufgedeckt. Der stadienspezifische Satz wurde mit dem Mitochondrium ausschließlich in PCFs angereichert, wobei beispielsweise Komponenten der Elektronentransportkette vertreten waren. Dies spiegelt stark die metabolischen Unterschiede zwischen den Lebensstadien bei T. brucei wider und legt nahe, dass ähnliche Unterschiede bei T. congolense bestehen64,74.

Diese Arbeit unterstreicht auch die Schlüsselrolle oberflächenbezogener Kompartimente in der afrikanischen Trypanosomenvielfalt. Das kollektive Post-ER-Sekretions-/Endozytosekompartiment erwies sich als Hauptfaktor für stadienspezifische Unterschiede und genomische Divergenzen sowohl bei T. brucei als auch bei T. congolense. Das Oberflächenproteom stellt die physische Schnittstelle zwischen dem Wirt und diesen Parasiten dar. Wirtsspezifische Abwehrmechanismen und Ernährungsmöglichkeiten treiben die Evolution und ausgewählte Expression von Oberflächenproteinen voran, und folglich unterscheiden sich Oberflächenproteome erheblich zwischen den Lebensstadien. Unterschiedliche Wirtsbereiche und unterschiedliche Wirtsmikroumgebungen üben auch einen unterschiedlichen selektiven Druck auf die in jeder Art exprimierten Oberflächenproteine ​​aus. Beispielsweise haften T. congolense-BSFs im Gegensatz zu T. brucei in vivo an Erythrozyten und Endothelzellen53,54. Dies erfordert nicht nur das Vorhandensein biochemischer Merkmale, die die Einhaltung ermöglichen, sondern wirkt sich auch auf die Nährstoffverfügbarkeit sowie die in dieser Mikroumgebung auftretenden Belastungen und Wirtsfaktoren aus. Die Beobachtung der Anreicherung von sekretorischen/endozytischen Proteinen, zu denen auch Oberflächenproteine ​​gehören, in den stadienspezifischen und vielfältigen Proteinsätzen zeigt die Bedeutung dieser Proteine ​​für die evolutionäre Anpassung an die unterschiedlichen Umgebungen, denen jeder Zelltyp ausgesetzt ist. Insbesondere umfassen diese Sätze zahlreiche uncharakterisierte Proteine ​​und bieten ein vielversprechendes Repertoire an Kandidaten für die molekularen Determinanten der Parasitenvielfalt.

Zusammenfassend lässt sich sagen, dass hyperLOPIT verwendet wurde, um die Proteome von T. brucei und T. congolense jeweils im BSF von Säugetieren und im PCF im Mitteldarm von Insekten räumlich abzubilden. Diese äußerst umfassenden Datensätze liefern nicht nur umfassende Expressions- und Lokalisierungsinformationen zu Tausenden von Proteinen, sondern offenbaren auch die wichtigsten subzellulären Kompartimente, die an der Parasitenvielfalt auf Lebensstadiums- und Artenebene beteiligt sind.

Für die BSF- und PCF-Lebenszyklusstadien wurden Zellen des T. brucei-Stammes Lister 427 aus dem Labor von Mark Carrington (Universität Cambridge) verwendet. T. brucei BSF wurden in HMI-9 10 % FBS (fötales Rinderserum) bei 37 °C 5 % CO2 0,9 × 104 bis 1,96 × 106 Zellen/ml gehalten. T. brucei PCF wurden in SDM-79 10 % FBS bei 27 °C 5 % CO2 2,5 × 105 bis 1,63 × 107 Zellen/ml gehalten. Zellen des T. congolense-Stammes IL3000 wurden für die BSF- und PCF-Lebenszyklusstadien verwendet. T. congolense BSF-Zellen wurden aus dem Labor von Catarina Gadelha (Universität Nottingham) bezogen, T. congolense PCF-Zellen stammten aus dem Labor von Mark Carrington (Universität Cambridge). T. congolense BSF wurden in TcBSF-1 10 % GS (Ziegenserum) bei 37 °C 5 % CO2 bei 1×105 bis 6,7×106 Zellen/ml gehalten75. T. congolense PCF wurden in TcPCF-3 20 % FBS bei 27 °C 5 % CO2 bei 5 × 105 bis 1,6 × 107 Zellen/ml75 gehalten. Für HyperLOPIT-Experimente wurden logarithmisch wachsende Zellen in Suspension in 75-cm2-Kulturflaschen (T175s) für alle Zelltypen außer T. congolense BSF vergrößert, die in adhärenten Schichten in 5-schichtigen 875-cm2-Flaschen vergrößert wurden.

Logarithmisch wachsende Zellen wurden geerntet und je nach Zelltyp wie folgt gewaschen: (i) T. brucei BSF wurde durch wiederholte Zentrifugation (10 Min. 4635 x g 20 °C) mit zwei bis drei Zentrifugationswaschungen (10 Min. 1693 x g RT) gesammelt. in Voorheis PBS (136,9 mM NaCl, 3 mM KCl, 16 mM Na2HPO4, 3 mM KH2PO4, 45,9 mM Saccharose, 10 mM Glucose, pH 7,6), gefolgt von bis zum Waschen in Homogenisierungsmedium (HM: 0,25 M Saccharose, 10 mM HEPES, KOH pH 7,4, 1 mM EDTA) (ii) T. brucei PCF wurden durch wiederholte Zentrifugation (10 Min. 4635 x g 20 °C) mit drei Zentrifugationswaschgängen (10 Min. 1693 x g RT) in serumfreiem SDM-79, gefolgt von zwei Zentrifugationswaschgängen, gesammelt Waschvorgänge in HM, (iii) T. congolense BSF wurden einmal im Kolben mit serumfreiem TcBSF-1 gewaschen, gefolgt von ein bis zwei Waschvorgängen im Kolben mit HM, gesammelt durch Schütteln in Suspension und Zentrifugation, gefolgt von zwei Zentrifugationswaschgängen (10 Min. 1600 × g RT) in HM und (iv) T. congolense PCF wurden durch wiederholte Zentrifugation (10 Min. 4635 × g 20 °C) mit drei Zentrifugationswaschungen (10 Min. 1600 × g RT) in serumfreiem TcPCF gesammelt -3 folgten zwei Wäschen in HM. Jeder Zelltyp wurde schließlich in gekühltem HM, ergänzt mit Proteaseinhibitoren (cOmplete EDTA-freier Proteinaseinhibitor-Cocktail, Roche), in einer Dichte von 4 × 108/ml suspendiert.

Die Zellen wurden durch Stickstoffkavitation (Zellaufschlussgefäß Modell 4639, Parr Instrument Company) im Einklang mit anderen Arbeiten lysiert28,34,76. Kurz gesagt wurde die Zellsuspension in das vorgekühlte Gefäß geladen, das mit 350–850 psi beladen und 15 Minuten lang inkubiert wurde, bevor das Lysat mit 1–2 Tropfen/Sekunde freigesetzt wurde. Das Lysat wurde sofort auf 2 mM Magnesiumacetat-Tetrahydrat gebracht und mit 500 U Benzonase (Merck) versetzt, gefolgt von einer 20-minütigen Inkubation bei RT und einer 10-minütigen Inkubation auf Eis. Nicht lysierte Zellen wurden durch vier Zentrifugationen (5 Min. 200 × g RT) entfernt, um das geklärte Zelllysat zu ergeben. Weitere Einzelheiten finden Sie in den Zusatzdaten 1.

Die subzelluläre Fraktionierung wurde wie zuvor beschrieben mit einigen Modifikationen durchgeführt23,28. Zunächst wurden die Rohmembranen mit einem Iodixanolkissen angereichert, wobei das Zelllysat mit 6 % und 25 % Iodixanollösungen in HM unterlegt und bei 146.498 × g im SW40 Ti-Rotor (Beckman Coulter) oder 100.095 × g in einem SW55 Ti-Rotor zentrifugiert wurde (Beckman Coulter) bei 4 °C für 1,5 Stunden. Ein Aliquot wurde von der Oberseite des Kissens gesammelt und als lösliche Fraktion verwendet. Die Rohmembranen waren an den Grenzflächen zwischen den Iodixanolschichten in zwei sichtbaren Banden angereichert. Diese wurden mit einer Pasteurpipette gesammelt, mit HM verdünnt und durch 1-stündige Zentrifugation bei 200.309 × g in einem SW55 Ti-Rotor (Beckman Coulter) bei 4 ° C pelletiert. Die pelletierten Rohmembranen wurden in 32 % Iodixanollösung in HM mit 10 Hüben eines Dounce-Homogenisators (Pestle B 885300-0002, Kimble-Chase, Abstand von 0,0127–0,0635 mm) suspendiert. Die suspendierten Rohmembranen wurden dann unter einen vorgeformten Iodixanolgradienten gelegt, der aus nacheinander unterlegten Schritten einer Iodixanollösung in HM (20 %, 23 %, 26 % und 29 % Iodixanol) bestand, die über Nacht bei 4 °C diffundieren gelassen wurden. Nach dem Unterlegen wurde der Gradient 12 Stunden lang bei 99.820 × g in einem VTi65.1-Rotor (Beckman Coulter) bei 4 °C zentrifugiert. Der Gradient wurde in Fraktionen gesammelt, indem der Boden und anschließend der Hals durchstochen wurden und die Lösung tropfenweise vom Boden in etwa 22 Fraktionen zu je 0,5 ml gesammelt wurde. Nach der Sammlung wurde der Ri (Brechungsindex) für jede Fraktion mit einem Refraktometer (Bellingham Stanley) gemessen und der Proteingehalt mittels Bradford-Assay gemessen. Die Fraktionen wurden entweder bei –80 °C gelagert oder sofort zur Proteinextraktion verarbeitet.

Aus der löslichen Fraktion wurde Protein durch Zugabe des 4- bis 5-fachen Volumens eiskalten Acetons extrahiert. Protein wurde aus den iodixanolhaltigen Gradientenfraktionen durch TCA-Fällung (Trichloressigsäure) extrahiert, wobei die Fraktionen auf ~10–15 % TCA eingestellt wurden, um Protein auszufällen, gefolgt von Waschungen mit 10 % TCA und Aceton. Während des Waschens mit Aceton wurden die Pellets einer Ultraschallbehandlung unterzogen (5 Zyklen von 30 s EIN/AUS bei hoher Leistung, Ultraschalldesintegrator Bioruptor Plus, Diagenode). Alle Proben wurden dann in 100 mM TEAB-Puffer (Triethylammoniumbicarbonat) (pH 8,5) mit 0,2 % SDS (Natriumdodecylsulfat) und 8 M Harnstoff solubilisiert und einer wiederholten Ultraschallbehandlung unterzogen. Der Proteingehalt wurde mittels BCA-Assay (Bicinchoninsäure) gemessen. Fraktionen (0,2 oder 0,4 µg Beladung) wurden durch Western Blot unter Verwendung von Standardmethoden mit Antikörpern gegen eine Reihe von Kompartimentmarkerproteinen analysiert. Die Antikörper (Anti-ISG65, Anti-MI.2 C D88 (VSG221) und Anti-DHH1) wurden aus dem Labor von Mark Carrington (Universität Cambridge) bezogen. Antikörper (Anti-BiP, Anti-CatL und Anti-mtHSP70) wurden aus dem Labor von James Bangs (University of Buffalo) bezogen. Antikörper (Anti-Histon H3 (ab1791), Anti-Ratten-IgG H&L (HRP) (ab97057) und Anti-Kaninchen-IgG H&L (HRP) (ab6721)) wurden kommerziell von Abcam und Anti-Tubulin [YL1/2] (ab6160) bezogen / MAB1864) wurde von Abcam bzw. Sigma-Aldrich bezogen. Antikörper wurden in ungefähr den folgenden Verdünnungen verwendet: Anti-ISG65 (5000), Anti-MI.2 C D88 (VSG221) (50000), Anti-DHH1 (5000), Anti-BiP (1500000), Anti-CatL (5000- 10.000), Anti-mtHSP70 (10.000), Anti-Histon H3 (1.000–5.000), Anti-Tubulin [YL1/2] (1500–2.000), Anti-Ratten-IgG H&L (HRP) (20.000) und Anti-Kaninchen-IgG H&L (HRP) (30000). Beachten Sie, dass die Antikörper in allen Fällen nach der Verdünnung in der Blockierungslösung gelagert und wiederverwendet wurden.

Für jedes Experiment wurden Gradientenfraktionen verkettet, um 10 Pools (30–98 µg) zu bilden. Die Fraktionsverkettung wurde durch Western-Blot-Analyse gesteuert, um die Auflösung des subzellulären Kompartiments in einzelnen Läufen zu maximieren und gleichzeitig die Auflösung zwischen den Läufen nach Möglichkeit zu variieren, wobei die Proteinverfügbarkeit eingeschränkt war. Mit der löslichen Fraktion wurde eine 11. Probe gebildet. Die Proben wurden gemäß Barylyuk et al. reduziert, alkyliert und trypsiniert. (2020). Nach der Trypsinierung wurden die Peptide für alle Läufe mit Ausnahme der T. brucei BSF-Iteration Nr. 1 (Pierce Quantitative Fluormetric Peptide Assay) quantifiziert und die Peptidmenge für alle Fraktionspools normalisiert. Peptide (20–56 µg) wurden mit TMT-11plex-Tags (A37725 oder 90111, ergänzt mit A37724, Thermo Fisher Scientific) markiert. Kurz gesagt wurden 0,8 mg auf Raumtemperatur äquilibrierte Tags in Acetonitril (41–90 µl) suspendiert und zur Peptidmischung (54–115 µl) zugegeben (20,5–41 µl), wodurch Bedingungen geschaffen wurden, die dem 1-fachen oder 0,5-fachen der TMT-Menge entsprechen Herstelleranweisungen. Die Reaktion konnte 2 Stunden lang bei 25 °C unter Rühren (800 U/min, Eppendorf ThermoMixer) ablaufen, bevor 8 µl 5 % (v/v) Hydroxylamin zugegeben und 1 Stunde lang bei 25 °C unter Rühren (800 U/min) inkubiert wurde ). Die mit TMT markierten Proben wurden dann gepoolt und durch gekühlte Vakuumzentrifugation (Labconco) zur Trockene reduziert.

Die TMT-Pools wurden mit einer Modifikation von Mulvey et al. entsalzt. (2017) unter Verwendung der Sep-Pak tC18 Plus Light-Kartusche (WAT036805, Waters). Kurz gesagt wurden die Kartuschen mit einer Spritze mit 2 ml Acetonitril, 2 ml Elutionspuffer (70 % Acetonitril, 0,05 % Essigsäure), 2 ml Entsalzungspuffer (0,05 % Essigsäure) und 4 ml Ladepuffer (0,1 % TFA (Trifluoressigsäure) konditioniert Säure)). Peptide (suspendiert in 0,1 % TFA, eingestellt auf etwa pH 2) wurden auf die Kartuschen geladen, gefolgt von 4 ml Ladepuffer und 4 ml Entsalzungspuffer. Die Peptide wurden in 1,6 ml Elutionspuffer eluiert und durch gekühlte Vakuumzentrifugation zur Trockne reduziert. Entsalzte Peptide wurden durch Umkehrphasenchromatographie bei hohem pH-Wert nach Mulvey et al. fraktioniert. (2017) unter Verwendung eines UPLC-Systems von Waters Acquity mit einer BEH C18-Säule (1,7 μm, 2,1 × 150 mm) und einer BEH C18-VanGuard-Vorsäule (1,7 μM, 2,1 × 5 mm)23.

Alle MS-Läufe wurden auf einem Orbitrap FusionTM LumosTM TribridTM-Instrument durchgeführt, das an ein Dionex UltimateTM 3000 RSLCnano-System (Thermo Fisher Scientific) gekoppelt war. UPLC-Fraktionen wurden zu 17–19 Pools zusammengefasst und jeweils in 20 μl 0,1 % (v/v) Ameisensäure resuspendiert, und pro Injektion wurde etwa 1 μg Peptide für die LC-MS/MS-Analyse geladen. Die Nanofluss-Flüssigkeitschromatographie-Methode für die LC-MS/MS-Analyse wurde wie in früheren Arbeiten festgelegt23. Die MS-Workflow-Parameter mit XCalibur (v3.0.63) entsprachen ebenfalls denen der vorherigen Arbeit, mit Ausnahme der Orbitrap-Auflösung, die stattdessen auf 50.00023 eingestellt wurde.

Die Peptididentifizierung und -quantifizierung wurde in ProteomeDiscoverer (v2.4) mit Mascot (v2.7.0, Matrix Science) unter Verwendung von Sequenzdatenbanken von TriTrypDB (v50) nach Art durchgeführt: T. brucei (TREU927 mit angehängten Lister 427 BES40-Genen), T. Kongolense (IL3000 2019). Zu den Schadstoffdatenbanken gehörten (i) ein erweitertes GPM (Global Proteome Machine) cRAP (common Repository of Adventitious Proteins) von CamProtR (v0.0.0.9000, github.com/CambridgeCentreForProteomics/camprotR) mit angehängter Benzonase (P1371769) und (ii) die cRFP-Datenbank (Common Repository of FBS Proteins)77. Die Vorläuferfehler- und Massenfragmenttoleranzen wurden auf jeweils 10 ppm 0,6 Da festgelegt, Reporterionen wurden mit der zuverlässigsten Schwerpunktmethode quantifiziert und Trypsin wurde als Enzym der Wahl mit maximal zwei fehlenden Spaltungen festgelegt. Zu den statischen Modifikationen gehörten: Carbamidomethyl (C), TMT6plex (N-Term) und TMT6plex (K). Zu den dynamischen Modifikationen gehörten: Desamidiert (NQ), Oxidation (M), TMT6plex (S) und TMT6plex (T). Zur Beurteilung der FDR (False Discovery Rate) wurde ein Perkolator verwendet, und es wurden nur Peptide mit hoher Zuverlässigkeit zurückgehalten. Daten auf PSM-Ebene wurden exportiert und Identifikatoren wurden basierend auf dem Fasta-Header in Gen-Identifikatoren umgewandelt. Die Daten wurden in R mit folgenden Parametern weiterverarbeitet: Anzahl der Proteingruppen = 1; Rang = 1; Suchmaschinenrang = 1; Intensität > 1e3; Durchschnittlicher Reporter-S/N > = 5; Isolationsinterferenz <= 50 %32. PSMs, die mit Kontaminanten (cRAP und cRFP) übereinstimmten, und solche mit fehlenden Werten in einem der 11-Plex-TMT-Quantifizierungskanäle wurden entfernt. PSM-Intensitäten wurden summennormalisiert und dann auf Proteinebene median-aggregiert. Jedes 11-Plex-TMT-Experiment wurde dann zu einem 33-Plex-Datensatz verkettet und Proteine ​​mit fehlenden Werten in einem der Experimente wurden entfernt35.

Die Datenprüfung und -analyse wurde in R (v4.1.0) hauptsächlich mit den Bioconductor-Paketen MSnbase (v2.18.0), pRoloc (v1.32.0), Tidyverse (v1.3.1), ClusterProfiler (v4.0.5) und ggplot2 (v3.3.3) durchgeführt )25,26,27,78,79,80,81,82. Normalisierte 33-Plex-HyperLOPIT-Datensätze wurden importiert und einer Dimensionsreduktion über t-SNE gemäß Barylyuk et al. unterzogen. (2020)28,38. Unüberwachtes Clustering wurde mit dem Algorithmus HDBSCAN unter Verwendung der Python-Bibliothek (v3.7.1) hdbscan (v0.8.19) an normalisierten hyperLOPIT-Datensätzen40,83 durchgeführt. Mit Ausnahme der folgenden wurden die Standardparameter verwendet: Mindestproben = 8; Mindestclustergröße = 9; Cluster-Auswahlmethode = 'Blatt'; minimalen Spanning Tree generieren = TRUE.

Für die Entwicklung von T. brucei-Markern wurde ein erster Markerproteinsatz durch manuelle Literaturrecherche und GO-CC-Annotation unter Anleitung von HDBSCAN-Clusterinformationen und visueller Inspektion von Proteinhäufigkeitsverteilungsprofilen erstellt. Eine automatisierte Literaturrecherche zum Nachweis der Lokalisierung von HDBSCAN-Clustermitgliedern wurde auch mithilfe der ScienceDirect-API (https://www.elsevier.com/solutions/sciencedirect/librarian-resource-center/api) mit der Python-Bibliothek (v3.7.1) elsapy durchgeführt (v0.5.0). Proteine, die scheinbar Ausreißer waren oder sich zwischen den Lebensstadien bewegten, wurden ausgeschlossen und die gleichen Marker wurden für T. brucei BSF und PCF verwendet. Für die Entwicklung der T. congolense-Marker wurde ein erster Markersatz erstellt, indem die Orthologen der T. brucei-Marker oder TAGM-MAP-Zuordnungen (die wahrscheinlichste Kompartimentlokalisierung jedes Proteins, wie mit TAGM-MAP durchgeführt – siehe unten) genommen wurden. das hatte unterstützende Lokalisierungsbeweise in T. brucei. Diese wurden dann anhand von HDBSCAN-Clustering und visueller Inspektion der Proteinhäufigkeitsverteilungsprofile weiter ausgewählt. Dieser anfängliche Markersatz wurde für die halbüberwachte Analyse von Novelty-TAGM verwendet, um zusätzlich zur Zuordnung von Proteinen zu definierten Kompartimenten die Entdeckung aller nicht markierten Kompartimente als Phänotypen zu ermöglichen46. Die neuen TAGM-Parameter wurden auf Standardwerte gesetzt und der Algorithmus wurde für 10.000 Iterationen ausgeführt, 5.000 wurden automatisch verworfen, die Ausdünnung wurde auf 10 eingestellt und 9 unabhängige Ketten wurden ausgeführt. Die Ergebnisse der Neuheit-TAGM-Analyse wurden auf der Grundlage von Lokalisierungsnachweisen in T. brucei-Orthologen auf neue Phänotypen untersucht, die aufgelöste subzelluläre Nischen und Erweiterungen in bestehenden Kompartimenten für zusätzliche Kandidatenmarker darstellen. Aufgrund der unterschiedlichen Auflösung mehrerer Kompartimente zwischen BSF und PCF wurden in T. congolense dieselben Marker, jedoch mit unterschiedlicher Zusammenführung/Aufteilung der Unterkompartimente, verwendet.

Vorhersagen zur Proteinlokalisierung wurden basierend auf dem TAGM-Modell erstellt26,33. TAGM-MAP-Klassifizierungen der 33-Plex-Datensätze sind die primären Klassifizierungen und bilden die Grundlage für die in dieser Arbeit berichteten räumlichen Proteome. TAGM-MAP-Modellparameter wurden unter Verwendung der Standardeinstellungen generiert, um die hintere Zuordnung und die Ausreißerwahrscheinlichkeiten jedes Proteins zu bestimmen. Jedes Nicht-Markerprotein wurde einem Kompartiment zugeordnet, das die wahrscheinlichste Lokalisierung aller Kompartimente darstellte. Die Lokalisierungswahrscheinlichkeit wurde als Produkt der Zuordnungswahrscheinlichkeit und dem Komplement der Ausreißerwahrscheinlichkeit berechnet (\(P({Lokalisierung})=P({Zuordnung})\times (1-P({Ausreißer}))\)) . Anschließend wurden Klassifizierungen erstellt, indem zwei Schwellenwerte auf diese Zuordnungen angewendet wurden: Lokalisierungswahrscheinlichkeit > 0,999 und separat eine Ausreißerwahrscheinlichkeit <5 E-5. Proteine, die die Schwellenwertkriterien nicht erfüllten, wurden als „unbekannt“ gekennzeichnet. Um die Reproduzierbarkeit der durch einzelne experimentelle Iterationen erstellten Klassifizierungen zu beurteilen, wurde TAGM-MAP auch mit den Standardeinstellungen für jeden 11-Plex-Datensatz separat durchgeführt. Klassifizierungen wurden beibehalten, wenn sie eine Lokalisierungswahrscheinlichkeit > 0,99 überstiegen. Um die Variabilität der Klassifizierung zwischen den Experimenten zu beurteilen, wurden Datensätze paarweise mit dem angepassten Rand-Index verglichen, der eine Punktzahl von 0 zuweist, wenn die Konsistenz zufällig das ist, was erwartet wird, und 1 für perfekte Konsistenz unter Verwendung des R-Pakets mmclust (v1.0.1)47. Um zu vermeiden, dass der ARI aufgrund eines Übermaßes an „unbekannten“ Allokationen aufgebläht oder deflationiert wird, wurden diese vor dem Vergleich gefiltert. Die Analyse mit TAGM-MCMC wurde dann verwendet, um Erkenntnisse über Proteine ​​zu gewinnen, die laut TAGM-MAP unbekannt waren, wo dies auf eine dynamische Proteinlokalisierung zurückzuführen sein könnte. Dieses Modell wurde mithilfe der Markov-Kette Monte-Carlo implementiert. Der kollabierte Gibbs-Sampler wurde parallel für 9 Ketten (T. brucei) und 4 Ketten (T. congolense) betrieben, wobei jede Kette 10.000 Iterationen lang lief. Die Konvergenz wurde mithilfe der Gelman-Rubin-Diagnostik beurteilt und alle Markov-Ketten wurden für T. congolense beibehalten; während für T. brucei die besten zwei Ketten beibehalten wurden. Bei der Proteinzuteilung wurden keine Schwellenwertkriterien angewendet und es werden Kompartiment-Joint-Wahrscheinlichkeiten angegeben. Gemeinsame Wahrscheinlichkeiten wurden verwendet, um Proteine ​​zu bewerten, die möglicherweise in mehr als einem Kompartiment lokalisiert sind.

Die Annotation von Proteinmerkmalen wurde überwiegend aus TriTrypDB (heruntergeladen am 01.06.2021) für Merkmale wie Proteinnamen, Beschreibungen, Molekulargewichte, TM-Domänen, Signalpeptide, GO-Begriffe und Pfam-Beschreibungen übernommen43. Das Vorhandensein von GPI-Ankern wurde mithilfe von NetGPI online (v1.1, services.healthtech.dtu.dk/service.php?NetGPI) mit Sequenzen aus TriTrypDB (v50) vorhergesagt, die für alle proteomischen Analysen verwendet wurden44. Protein-pI-Werte (isoelektrischer Punkt) wurden mit pIR (v0.99.0) unter Verwendung der Bjell-Methode unter Verwendung von Sequenzen aus TriTrypDB (v50) vorhergesagt, die für alle proteomischen Analysen verwendet wurden41,42. DeepLoc (v1.0) subzelluläre Lokalisierungsvorhersagen wurden lokal in Python (v3.7.1) unter Verwendung vorberechneter Modellparameter generiert, die online verfügbar sind (https://services.healthtech.dtu.dk/software.php)48. Sequenzen für DeepLoc wurden von TriTrypDB wie folgt erhalten: T. brucei TREU927 (heruntergeladen am 28.02.2021) mit angehängten BES40-Genen von denen, die für alle Proteomanalysen verwendet wurden (v50); T. congolense IL3000 2019 (heruntergeladen am 01.03.2021).

Die Inferenz orthologer Gruppen (OG) zwischen T. brucei (TREU927, ergänzt mit Lister 427 BES40-Genen), T. congolense (IL3000 2019), T. vivax (Y486) und T. cruzi (CL Brener Esmeraldo-like) wurde mit OrthoFinder durchgeführt 2.5.2 Bereitstellung eines festen Artenbaums (ergänzende Abbildung 9) und mit der Option -y zum Aufteilen von OGs in hierarchische OG (hOG) basierend auf einem automatisierten Baumabgleich84. Alle Proteome wurden von TriTrypDB (v50)43 erhalten. Ähnlichkeitssuchen wurden mit BLAST (Option -S Blast) durchgeführt. Alle artspezifischen Gene, die üblicherweise von der OrthoFinder-Ausgabe ausgeschlossen werden, wurden separat als Einzelgen-OGs hinzugefügt. Darüber hinaus ergab die Inspektion der hOGs eine Überaufteilung einiger der ursprünglichen OGs, die manuell korrigiert wurde (Supplementary Data 11). Daher wurden korrigierte hOG-Identifikatoren als Index verwendet. Zusätzliche Anmerkungen wurden hinzugefügt (Ergänzende Daten 11): (i) phylogenetisches Profil: binäres Anwesenheits-/Abwesenheitsprofil von Genen in einem bestimmten hOG für jede Art, (ii) Ursprung: der abgeleitete hOG-Vorfahren-Ursprungsknoten (N0-N6, siehe ergänzende Abb . 9), (iii) die kategoriale Darstellung (Verlust/keine/ein/zwei/viele) der Genanzahl in einem bestimmten hOG für jede Art (ein Verlust kann nur in Fällen abgeleitet werden, in denen Gene von mindestens zwei Arten vorhanden sind ein hOG) und iv) die kategoriale Darstellung (Verlust/keine/eins/zwei/viele) der Genzahl in einem bestimmten hOG speziell für T. brucei-to-T. kongolesisch. Fasta-Identifikatoren wurden basierend auf den Fasta-Headern des TriTrypDB-Proteoms in Genidentifikatoren umgewandelt.

Um stadienspezifische Proteine ​​zu definieren, wurden Listen von Proteinen erstellt, die für ein bestimmtes Stadium im Vergleich zum anderen Stadium derselben Art einzigartig sind und als solche bezeichnet werden. Der diversifizierte Proteinsatz wurde basierend auf der Kodierung von Genen in artspezifischen und erweiterten Orthogruppen entwickelt, die wie folgt definiert sind: (i) artspezifisch: Orthogruppen, die nur in den angegebenen Arten vorhanden sind, und (ii) erweitert: Orthogruppen mit >=2X der Anzahl von Gene gegenüber dem Gegenstück in T. brucei oder T. congolense entsprechend. Fälle von Zwei-Eins-Genzahl-Orthogruppen bei T. brucei-T. congolense, wobei zwei Fasta-Header-Identifikatoren, die mit einem einzelnen Gen-Identifikator übereinstimmten, aus diesem Satz in T. brucei entfernt wurden.

Die Anreicherungsanalyse wurde unter Verwendung der „Enricher“-Funktion von ClusterProfiler (v4.0.5) mit Standardeinstellungen82 (hypergeometrischer Test p < 0,05 mit Benjamini- und Hochberg-Anpassung) durchgeführt und testete Folgendes: (i) Anreicherung von GO CC-Begriffen entweder in allen Proteinen oder in Nicht-Markerproteinen in jedem subzellulären Kompartiment vor dem Hintergrund des entsprechenden Proteoms, (ii) Anreicherung von LOPIT-Kompartimenten in stadienspezifischen Proteinen oder diversen Gensätzen vor dem Hintergrund des entsprechenden Proteoms und (iii) Anreicherung von hOG-Ursprungsanmerkungen in jedem LOPIT-Kompartiment gegenüber den Hintergrund des entsprechenden Proteoms.

Jeder der endgültigen 33-Plex-Datensätze pro Zelltyp besteht aus drei verketteten 11-Plex-Iterationen des experimentellen Verfahrens. Anschließend wurden Bayes'sche Statistiken zur Analyse der verketteten Daten verwendet. Weitere Einzelheiten finden Sie im Ergänzenden Hinweis. Proteine ​​mit einem fehlenden Wert in einem der 33 Datenpunkte pro Zelltyp wurden von der weiteren Analyse ausgeschlossen. Proteinmerkmale wurden anhand der Anreicherungsanalyse nach unbeaufsichtigten Clustern, subzellulären Kompartimenten, Zelltypspezifität und Artenvielfalt untersucht. Es wurden keine statistischen Methoden verwendet, um die Stichprobengrößen vorab zu bestimmen. Die Experimente waren nicht randomisiert. Die Forscher waren während der Experimente und der Ergebnisbewertung nicht blind für die Zuteilung.

Die in dieser Studie generierten MS-Proteomikdaten wurden über das PRIDE-Partner-Repository mit der Datenkennung PXD03542685 beim ProteomeXchange-Konsortium hinterlegt. Interaktive Versionen jedes Datensatzes können online über R-Shiny-Anwendungen unter https://proteome.shinyapps.io/tbrucei_bsf/, https://proteome.shinyapps.io/tbrucei_pcf/, https://proteome.shinyapps.io/ angezeigt werden. tcongolense_bsf/ und https://proteome.shinyapps.io/tcongolense_pcf/. Jedes räumliche Proteom ist auch in TriTrypDB (https://tritrypdb.org/tritrypdb/app)43 integriert. Datensätze sind auch im R-Paket pRolocdata Version 1.37.1 verfügbar. unter https://bioconductor.org/packages/release/data/experiment/html/pRolocdata.html25,86. Weitere Informationen und Anfragen nach Ressourcen und Reagenzien sollten an die entsprechende Autorin, Paula MacGregor ([email protected]), gerichtet werden und werden von dieser bearbeitet. Quelldaten werden mit diesem Dokument bereitgestellt.

Morrison, LJ, Vezza, L., Rowan, T. & Hope, JC Tierische afrikanische Trypanosomiasis: Es ist Zeit, sich stärker auf klinisch relevante Parasiten- und Wirtsarten zu konzentrieren. Trends Parasitol. 32, 599–607 (2016).

Artikel PubMed Google Scholar

Bargul, JL et al. Artspezifische Anpassungen der Trypanosomenmorphologie und -motilität an den Säugetierwirt. PLoS Pathog. 12, e1005448 (2016).

Artikel PubMed PubMed Central Google Scholar

Hemphill, A., Frame, I. & Ross, CA Die Interaktion von Trypanosoma congolense mit Endothelzellen. Parasitology 109, 631–641 (1994).

Artikel PubMed Google Scholar

Lane-Serff, H. et al. Evolutionäre Diversifizierung des Trypanosomen-Haptoglobin-Hämoglobin-Rezeptors von einem angestammten Hämoglobin-Rezeptor. Elife 5, e13044 (2016).

Artikel PubMed PubMed Central Google Scholar

Taylor, K. & Authie, EML-Pathogenese der tierischen Trypanosomiasis. In „Die Trypanosomiasen“, CABI Publishing. (Hrsg. Maudlin, I. Holmes, PH & Miles, MA) (2004).

Vickerman, K. Entwicklungszyklen und Biologie pathogener Trypanosomen. Br. Med. Stier. 41, 105–114 (1985).

Artikel CAS PubMed Google Scholar

Huh, WK et al. Globale Analyse der Proteinlokalisierung in Keimhefe. Natur 425, 686–691 (2003).

Artikel ADS CAS PubMed Google Scholar

Thul, PJ & Lindskog, C. Der menschliche Proteinatlas: eine räumliche Karte des menschlichen Proteoms. Proteinwissenschaft. 27, 233–244 (2018).

Artikel CAS PubMed Google Scholar

Billington, K. et al. Genomweite subzelluläre Proteinkarte für den Flagellatenparasiten Trypanosoma brucei. Nat. Mikro. 8, 533–547 (2023).

Artikel CAS Google Scholar

Niemann, M. et al. Das Proteom der mitochondrialen Außenmembran von Trypanosoma brucei enthüllt neue Faktoren, die zur Aufrechterhaltung der mitochondrialen Morphologie erforderlich sind. Mol. Zelle. Proteom. 12, 515–528 (2013).

Artikel CAS Google Scholar

Güther, MLS, Urbaniak, MD, Tavendale, A., Prescott, A. & Ferguson, MA Hochzuverlässiges Glykosom-Proteom für die prozyklische Form Trypanosoma brucei durch Epitop-Tag-Organellenanreicherung und SILAC-Proteomik. J. Proteome Res. 13, 2796–2806 (2014).

Artikel PubMed PubMed Central Google Scholar

Goos, C., Dejung, M., Janzen, CJ, Butter, F. & Kramer, S. Das Kernproteom von Trypanosoma brucei. PLoS ONE 12, e0181884 (2017).

Artikel PubMed PubMed Central Google Scholar

Subota, I. et al. Die Proteomanalyse intakter Flagellen prozyklischer Trypanosoma brucei-Zellen identifiziert neuartige Flagellenproteine ​​mit einzigartiger Sublokalisierung und Dynamik. Mol. Zelle. Proteom. 13, 1769–1786 (2014).

Artikel CAS Google Scholar

Peikert, CD et al. Kartierung organellarer Importome mittels quantitativer Massenspektrometrie. Nat. Komm. 8, 1–14 (2017).

Artikel Google Scholar

Geladaki, A. et al. Kombination von LOPIT mit differenzieller Ultrazentrifugation für hochauflösende räumliche Proteomik. Nat. Komm. 10, 331 (2019).

Artikel ADS PubMed PubMed Central Google Scholar

Christoforou, A. et al. Ein Kartenentwurf des räumlichen Proteoms pluripotenter Stammzellen der Maus. Nat. Komm. 7, 8992 (2016).

Artikel PubMed Google Scholar

Itzhak, DN, Tyanova, S., Cox, J. & Borner, GH Globale, quantitative und dynamische Kartierung der subzellulären Proteinlokalisierung. elife 5, e16950 (2016).

Artikel PubMed Google Scholar

Orre, LM et al. SubCellBarCode: Proteomweite Kartierung der Proteinlokalisierung und -relokalisierung. Mol. Zelle 73, 166–182. e167 (2019).

Artikel CAS PubMed Google Scholar

Beltran, PMJ, Mathias, RA & Cristea, IM Ein Porträt des menschlichen Organellen-Proteoms in Raum und Zeit während einer Cytomegalievirus-Infektion. Zellsystem 3, 361–373. e366 (2016).

Artikel Google Scholar

Jadot, M. et al. Berücksichtigung der subzellulären Proteinlokalisierung: eine Kompartimentkarte des Rattenleberproteoms. Mol. Zelle. Proteom. 16, 194–212 (2017).

Artikel CAS Google Scholar

Dunkley, TP et al. Kartierung des Arabidopsis-Organellen-Proteoms. Proz. Natl Acad. Wissenschaft. USA 103, 6518–6523 (2006).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Foster, LJ et al. Eine Organellenkarte von Säugetieren durch Proteinkorrelationsprofilierung. Zelle 125, 187–199 (2006).

Artikel CAS PubMed Google Scholar

Mulvey, CM et al. Verwendung von hyperLOPIT zur Durchführung einer hochauflösenden Kartierung des räumlichen Proteoms. Nat. Protokoll. 12, 1110–1135 (2017).

Artikel CAS PubMed Google Scholar

Breckels, LM et al. Die Auswirkung der Entdeckung von Organellen auf die subzelluläre Proteinlokalisierung. J. Proteom. 88, 129–140 (2013).

Artikel CAS Google Scholar

Gatto, L., Breckels, LM, Wieczorek, S., Burger, T. & Lilley, KS Massenspektrometriebasierte räumliche Proteomik-Datenanalyse mit pRoloc und pRolocdata. Bioinformatik 30, 1322–1324 (2014).

Artikel CAS PubMed PubMed Central Google Scholar

Crook, OM, Breckels, LM, Lilley, KS, Kirk, PDW & Gatto, L. Ein Bioconductor-Workflow für die Bayes'sche Analyse räumlicher Proteomik. F1000Research 8, 446 (2019).

Artikel PubMed PubMed Central Google Scholar

Breckels, LM, Mulvey, CM, Lilley, KS & Gatto, L. Ein Bioconductor-Workflow zur Verarbeitung und Analyse räumlicher Proteomikdaten. F1000Research 5, 2926 (2016).

Artikel PubMed Google Scholar

Barylyuk, K. et al. Ein umfassender subzellulärer Atlas des Toxoplasma-Proteoms über hyperLOPIT bietet räumlichen Kontext für Proteinfunktionen. Cell Host Microbe 28, 752–766.e759 (2020).

Artikel CAS PubMed Central Google Scholar

Nightingale, DJ, Geladaki, A., Breckels, LM, Oliver, SG & Lilley, KS Die subzelluläre Organisation von Saccharomyces cerevisiae. Curr. Meinung. Chem. Biol. 48, 86–95 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Tan, DJ et al. Kartierung von Organellenproteinen und Proteinkomplexen in Drosophila melanogaster. J. Proteome Res. 8, 2667–2678 (2009).

Artikel CAS PubMed Google Scholar

Levin, M., Scheibe, M. & Butter, F. Proteotranskriptomik unterstützte die Genannotation und räumliche Proteomik der Bombyx mori BmN4-Zelllinie. BMC Genomics 21, 690 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Mulvey, CM et al. Räumlich-zeitliches proteomisches Profiling der proinflammatorischen Reaktion auf Lipopolysaccharid in der menschlichen Leukämiezelllinie THP-1. Nat. Komm. 12, 1–19 (2021).

Artikel ADS Google Scholar

Crook, OM, Mulvey, CM, Kirk, PDW, Lilley, KS & Gatto, L. Ein Bayesianischer Mischungsmodellierungsansatz für räumliche Proteomik. PLoS Comput. Biol. 14, e1006516 (2018).

Artikel ADS PubMed PubMed Central Google Scholar

Hauser, R., Pypaert, M., Hausler, T., Horn, EK & Schneider, A. In-vitro-Import von Proteinen in Mitochondrien von Trypanosoma brucei und Leishmania tarentolae. J. Cell Sci. 109, 517–523 (1996).

Artikel CAS PubMed Google Scholar

Trotter, MW, Sadowski, PG, Dunkley, TP, Groen, AJ & Lilley, KS Verbesserte subzelluläre Auflösung durch gleichzeitige Analyse von Organellen-Proteomikdaten unter verschiedenen experimentellen Bedingungen. Proteomics 10, 4213–4219 (2010).

Artikel CAS PubMed Google Scholar

Holmes, S. & Huber, W. Moderne Statistiken für die moderne Biologie (Cambridge University Press, 2019).

Nguyen, LH & Holmes, S. Zehn schnelle Tipps für eine effektive Dimensionsreduktion. PLoS Comput. Biol. 15, e1006907 (2019).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Van der Maaten, L. & Hinton, G. Visualisieren von Daten mit t-SNE. J. Mach. Lernen. Res. 9, 2579–2605 (2008).

de Duve, C. Gewebefraktion – Vergangenheit und Gegenwart. J. Cell Biol. 50, 20 (1971).

Artikel PubMed PubMed Central Google Scholar

Campello, RJGB, Moulavi, D. & Sander, J. In Advances in Knowledge Discovery and Data Mining. P. 160-172 (Springer Berlin Heidelberg, 2013).

Perez-Riverol, Y. et al. Optimierung isoelektrischer Punkte mithilfe von Peptiddeskriptoren und Support-Vektor-Maschinen. J. Proteom. 75, 2269–2274 (2012).

Artikel CAS Google Scholar

Audain, E., Ramos, Y., Hermjakob, H., Flower, DR & Perez-Riverol, Y. Genaue Schätzung des isoelektrischen Punkts von Protein und Peptid basierend auf Aminosäuresequenzen. Bioinformatik 32, 821–827 (2016).

Artikel CAS PubMed Google Scholar

Aslett, M. et al. TriTrypDB: eine funktionelle genomische Ressource für die Trypanosomatidae. Nukleinsäuren Res. 38, D457–D462 (2010).

Artikel CAS PubMed Google Scholar

Gíslason, MH, Nielsen, H., Almagro Armenteros, JJ & Johansen, AR Vorhersage von GPI-verankerten Proteinen mit neuronalen Zeigernetzwerken. Curr. Res. Biotechnologie. 3, 6–13 (2021).

Artikel Google Scholar

Kurotani, A. et al. Lokalisierungsspezifische Verteilungen von Protein pI im menschlichen Proteom werden durch den lokalen pH-Wert und die Membranladung bestimmt. BMC Mol. Zellbiol. 20, 36 (2019).

Artikel PubMed PubMed Central Google Scholar

Crook, OM et al. Ein halbüberwachter Bayes'scher Ansatz zur gleichzeitigen Zuordnung der subzellulären Proteinlokalisierung und zur Erkennung von Neuheiten. PLoS Comput. Biol. 16, e1008288 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Hubert, L. & Allemand, P. Vergleich von Partitionen. J. Classif. 2, 193–218 (1985).

Artikel MATH Google Scholar

Almagro Armenteros, JJ, Sønderby, CK, Sønderby, SK, Nielsen, H. & Winther, O. DeepLoc: Vorhersage der subzellulären Proteinlokalisierung mithilfe von Deep Learning. Bioinformatik 33, 3387–3395 (2017).

Artikel PubMed Google Scholar

Ramakrishnan, S., Asady, B. & Docampo, R. Kontaktstellen zwischen Acidocalcisom und Mitochondrienmembran in Trypanosoma brucei. Krankheitserreger 7, 33 (2018).

Artikel PubMed PubMed Central Google Scholar

Csordás, G. et al. MICU1 steuert sowohl den Schwellenwert als auch die kooperative Aktivierung des mitochondrialen Ca2+-Uniporters. Zellmetabolismus 17, 976–987 (2013).

Artikel PubMed PubMed Central Google Scholar

Moosavi, B., Berry, EA, Zhu, X.-L., Yang, W.-C. & Yang, G.-F. Der Aufbau der Succinatdehydrogenase: ein Schlüsselenzym in der Bioenergetik. Zelle. Mol. Lebenswissenschaft. 76, 4023–4042 (2019).

Artikel CAS PubMed Google Scholar

Verner, Z. et al. Formbares Mitochondrium von Trypanosoma brucei. Int. Rev. Cell Mol. Biol. 315, 73–151 (2015).

Artikel CAS PubMed Google Scholar

Banks, KL Bindung von Trypanosoma congolense an die Wände kleiner Blutgefäße. J. Protozool. 25, 241–245 (1978).

Artikel CAS PubMed Google Scholar

Banks, KL In-vitro-Bindung von Trypanosoma congolense an Erythrozyten. J. Protozool. 26, 103–108 (1979).

Artikel CAS PubMed Google Scholar

Sunter, JD & Gull, K. Die Flagellum-Anheftungszone: „der zelluläre Herrscher“ der Trypanosomenmorphologie. Trends Parasitol. 32, 309–324 (2016).

Artikel CAS PubMed PubMed Central Google Scholar

Zhou, Q., An, T., Pham, KT, Hu, H. & Li, Z. Das CIF1-Protein ist ein Hauptorchestrator der Trypanosomen-Zytokinese, der mehrere Zytokinese-Regulatoren an der Zytokinese-Initiationsstelle rekrutiert. J. Biol. Chem. 293, 16177–16192 (2018).

Artikel CAS PubMed PubMed Central Google Scholar

Hu, H., An, T., Kurasawa, Y., Zhou, Q. & Li, Z. Die Trypanosomen-spezifischen Proteine ​​FPRC und CIF4 regulieren die Zytokinese-Initiierung, indem sie CIF1 an der Zytokinese-Initiationsstelle rekrutieren. J. Biol. Chem. 294, 16672–16683 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

McAllaster, MR et al. Proteomische Identifizierung neuer Zytoskelettproteine, die mit TbPLK assoziiert sind, einem wesentlichen Regulator der Zellmorphogenese bei Trypanosoma brucei. Mol. Biol. Zelle 26, 3013–3029 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Jackson, AP et al. Ein Zelloberflächenphylom für afrikanische Trypanosomen. PLoS Negl. Trop. Dis. 7, e2121 (2013).

Artikel CAS PubMed PubMed Central Google Scholar

Wheeler, RJ, Scheumann, N., Wickstead, B., Gull, K. & Vaughan, S. Die Zytokinese bei Trypanosoma brucei unterscheidet sich zwischen Blutkreislauf- und Tsetse-Trypomastigoten-Formen: Auswirkungen auf die Mikrotubuli-basierte Morphogenese und Mutantenanalyse. Mol. Mikrobiol. 90, 1339–1355 (2013).

Artikel CAS PubMed PubMed Central Google Scholar

Wheeler, RJ, Gull, K. & Sunter, JD Koordination des Zellzyklus in Trypanosomen. Annu. Rev. Microbiol. 73, 133–154 (2019).

Artikel CAS PubMed Google Scholar

Fritz, M. et al. Neue Einblicke in RNP-Granula durch den Einsatz des Mikrotubuli-Skeletts des Trypanosoms als Molekularsieb. Nukleinsäuren Res. 43, 8013–8032 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Kramer, S., Marnef, A., Standart, N. & Carrington, M. Die Hemmung der mRNA-Reifung in Trypanosomen führt zur Bildung neuer Herde an der Kernperipherie, die zytoplasmatische Regulatoren des mRNA-Versands enthalten. J. Cell Sci. 125, 2896–2909 (2012).

CAS PubMed PubMed Central Google Scholar

Zíková, A., Verner, Z., Nenarokova, A., Michels, PAM & Lukeš, J. Ein Paradigmenwechsel: Die Mitoproteome von prozyklischem und Blutkreislauf-Trypanosoma brucei sind vergleichsweise komplex. Plus Pathog. 13, e1006679 (2017).

Artikel PubMed PubMed Central Google Scholar

Conte, L. & Zara, V. Das Rieske-Eisen-Schwefel-Protein: Import und Zusammenbau in den Cytochromkomplex von Hefe-Mitochondrien. Bioinorg. Chem. Appl. 2011, 1–9 (2011).

Artikel Google Scholar

Vanhollebeke, B. et al. Ein Haptoglobin-Hämoglobin-Rezeptor vermittelt beim Menschen eine angeborene Immunität gegen Trypanosoma brucei. Wissenschaft 320, 677–681 (2008).

Artikel ADS CAS PubMed Google Scholar

Macleod, OJ et al. Ein Rezeptor für den Komplementregulator Faktor H erhöht die Übertragung von Trypanosomen auf Tsetsefliegen. Nat. Komm. 11, 1–12 (2020).

Artikel Google Scholar

Moro-Bulnes, A. et al. Beitrag der Cytidin-Desaminase zur Thymidylat-Biosynthese in Trypanosoma brucei: intrazelluläre Lokalisierung und Eigenschaften des Enzyms. Msphere 4, e00374–00319 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

UniProt. UniProt: die universelle Protein-Wissensdatenbank im Jahr 2021. Nucleic Acids Res. 49, D480–D489 (2021).

Artikel Google Scholar

Salmon, D. et al. Ein neuartiger heterodimerer Transferrinrezeptor, der von einem Paar VSG-Expressionsstellen-assoziierter Gene in T. brucei kodiert wird. Zelle 78, 75–86 (1994).

Artikel CAS PubMed Google Scholar

Higgins, MK et al. Struktur des Trypanosom-Haptoglobin-Hämoglobin-Rezeptors und Auswirkungen auf die Nährstoffaufnahme und die angeborene Immunität. Proz. Natl Acad. Wissenschaft. USA 110, 1905–1910 (2013).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Varadi, M. et al. AlphaFold-Proteinstrukturdatenbank: Erweitert die strukturelle Abdeckung des Proteinsequenzraums massiv mit hochpräzisen Modellen. Nukleinsäuren Res. 50, D439–D444 (2022).

Artikel CAS PubMed Google Scholar

Jumper, J. et al. Hochpräzise Vorhersage der Proteinstruktur mit AlphaFold. Natur 596, 583–589 (2021).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Steketee, PC et al. Der unterschiedliche Stoffwechsel zwischen Trypanosoma congolense und Trypanosoma brucei führt zu einer unterschiedlichen Empfindlichkeit gegenüber Stoffwechselhemmungen. PLoS Pathog. 17, e1009734 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Coustou, V., Guegan, F., Plazolles, N. & Baltz, T. Vollständiger In-vitro-Lebenszyklus von Trypanosoma congolense: Entwicklung genetischer Werkzeuge. PLoS Negl. Trop. Dis. 4, e618 (2010).

Artikel PubMed PubMed Central Google Scholar

Nightingale, DJ, Lilley, KS & Oliver, SG Ein Protokoll zur Kartierung des räumlichen Proteoms mithilfe von HyperLOPIT in Saccharomyces cerevisiae. Bioprotokoll 9, e3303 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Shin, J. et al. Gemeinsames Repository für FBS-Proteine ​​(cRFP), das einer Suchdatenbank für die massenspektrometrische Analyse des Zellsekretoms hinzugefügt werden soll. J. Proteome Res. 18, 3800–3806 (2019).

Artikel CAS PubMed Google Scholar

Gatto, L. & Lilley, KS MSnbase – ein R/Bioconductor-Paket für die Visualisierung, Verarbeitung und Quantifizierung isobar markierter Massenspektrometriedaten. Bioinformatik 28, 288–289 (2012).

Artikel CAS PubMed Google Scholar

Gatto, L., Gibb, S. & Rainer, J. MSnbase, effiziente und elegante R-basierte Verarbeitung und Visualisierung von Rohdaten der Massenspektrometrie. J. Proteome Res. 20, 1063–1069 (2020).

Artikel PubMed Google Scholar

Wickham, H. et al. Willkommen im Tidyverse. J. Open Source Softw. 4, 1686 (2019).

Artikel ADS Google Scholar

Wickham, H. ggplot2: Elegante Grafiken für die Datenanalyse (Springer-Verlag New York, 2016).

Wu, T. et al. ClusterProfiler 4.0: ein universelles Anreicherungstool zur Interpretation von Omics-Daten. Innovation 2, 100141 (2021).

CAS PubMed PubMed Central Google Scholar

McInnes, L., Healy, J. & Astels, S. hdbscan: hierarchisches dichtebasiertes Clustering. J. Open Source Softw. 2, 205 (2017).

Artikel ADS Google Scholar

Emms, DM & Kelly, S. OrthoFinder: Die Lösung grundlegender Verzerrungen bei Gesamtgenomvergleichen verbessert die Genauigkeit der Orthogruppen-Inferenz erheblich. Genombiol. 16, 1–14 (2015).

Artikel CAS Google Scholar

Perez-Riverol, Y. et al. Die PRIDE-Datenbankressourcen im Jahr 2022: eine Drehscheibe für massenspektrometriebasierte Proteomik-Beweise. Nukleinsäuren Res. 50, D543–D552 (2022).

Artikel CAS PubMed Google Scholar

Gatto, L., Crook, OM & Breckels, LM pRolocdata: Begleitende Daten zum pRoloc-Paket https://github.com/lgatto/pRolocdata (2022).

Referenzen herunterladen

Diese Arbeit wurde durch ein BBSRC David Phillips Fellowship (BB/P010849/1) an PM und ein Isaac Newton Trust, Wellcome Trust, University of Cambridge Joint Research Grant an PM finanziert; KB wurde durch einen Wellcome Trust Investigator Award (214298/Z/18/Z) an RFW und ein Leverhulme Early Career Fellowship (ECF-2015-562) an KB unterstützt, das gemeinsam vom Leverhulme Trust und Isaac Newton Trust finanziert wurde. ET dankt der niederländischen Wissenschaftsorganisation (VI.Veni.202.223) für ihre Unterstützung. Wir danken: Mark Carrington (Universität Cambridge) für die Bereitstellung von Antikörpern und Zellen, James Bangs (Universität Buffalo) für die Bereitstellung von Antikörpern, Catarina Gadelha (Universität Nottingham) für die Bereitstellung von Zellen, Mike Deery (Cambridge Center for Proteomics) für Durchführung von Massenspektrometrieanalysen und Yagnesh Umrania (Cambridge Centre for Proteomics) für Unterstützung bei der Proteomikanalyse.

Abteilung für Biochemie, Universität Cambridge, Cambridge, CB2 1QW, Großbritannien

Nicola M. Moloney, Konstantin Barylyuk, Oliver M. Crook, Lisa M. Breckels, Kathryn S. Lilley, Ross F. Waller und Paula MacGregor

Zellbiochemie, Institut für biomolekulare Wissenschaften und Biotechnologie Groningen, Universität Groningen, 9747 AG, Groningen, Niederlande

Eelco Tromer

Institut für Statistik, Universität Oxford, Oxford, OX1 3LB, Großbritannien

Oliver M. Crook

School of Biological Sciences, University of Bristol, Bristol, BS8 1TQ, Großbritannien

Paula MacGregor

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

PM konzipierte die Studie, wobei NMM, KSL und RFW zum Studiendesign beitrugen. NMM führte und analysierte die hyperLOPIT-Experimente, wobei KB zum experimentellen Design beitrug. NMM und OMC führten die TAGM-Analyse durch. NMM führte eine rechnerische Analyse durch, wobei KB, OMC und LMB zum Entwurf und zur Implementierung der Analyse beitrugen. ET führte die Orthologieanalyse durch und trug zur Gestaltung und Analyse der orthologiebasierten Ergebnisse bei. LMB hat die Shiny-Apps entwickelt. PM überwachte das Projekt, wobei LMB, KSL und RFW zur Projektbetreuung und -überwachung beitrugen. NMM und PM verfassten das Manuskript, das von allen Autoren gelesen und genehmigt wurde.

Korrespondenz mit Paula MacGregor.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Nature Communications dankt den anonymen Gutachtern für ihren Beitrag zum Peer-Review dieser Arbeit.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die Originalautor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Moloney, NM, Barylyuk, K., Tromer, E. et al. Kartierung der Diversität in afrikanischen Trypanosomen mithilfe hochauflösender räumlicher Proteomik. Nat Commun 14, 4401 (2023). https://doi.org/10.1038/s41467-023-40125-z

Zitat herunterladen

Eingegangen: 29. Juli 2022

Angenommen: 06. Juli 2023

Veröffentlicht: 21. Juli 2023

DOI: https://doi.org/10.1038/s41467-023-40125-z

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein gemeinsam nutzbarer Link verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.