Neue Potency Assays zur Bestimmung der Wirksamkeit von anti-VEGF-Antikörpern

Geschrieben von Dr. Janet Thode Veröffentlicht in Methodenvalidierung

Einleitung und Hintergrund

Die Gruppe der vaskulären endothelialen Wachstumsfaktoren (vascular endothelial growth factor, VEGF) spielt eine entscheidende Rolle bei der Gefäßneubildung (Angiogenese), da sie (u.a.) wie es der Name schon andeutet, das Wachstum, sprich die Teilung und Migration von Endothelzellen stimulieren. Da einige Tumorarten die Fähigkeit besitzen, sich über eine verstärkte Angiogenese besser mit Nährstoffen zu versorgen und dadurch schneller zu wachsen, stellen anti-VEGF-Antikörper ein bedeutsames Krebstherapeutikum dar. Allerdings sind die diversen Krebsarten nicht die einzige Indikation, auch bei bestimmten Augenkrankheiten ist eine verstärkte Angiogenese von Bedeutung. Zu den anti-VEGF-Antikörpern bzw. Fragmenten gehören z.B. Bevacizumab (Avastin®), Ranibizumab (Lucentis®) oder Aflibercept (Eylea®) und eine ansteigende Anzahl sich bereits auf dem Markt sowie in den späten Phasen klinischer Studien befindlicher Biosimilars, wie beispielsweise Mvasi®, Zirabev® oder BevaciRel®.

Für die Analyse der Wirksamkeit der anti-VEGF-Antikörper während der Freigabe- und Stabilitätsanalytik können unterschiedliche Potency Assays, sogenannte Bioassays, eingesetzt werden. Der klassische Potency Assay für anti-VEGF-Antikörper ist der sogenannte HUVEC Proliferationsassay [1]. Bei diesem Bioassay werden primäre HUVECs (human umbilical vein endothelial cells) nach entsprechender Vorkultur in bestimmter Zellzahl in eine 96 well-Platte ausgesät und mit dem anti-VEGF Antikörper in unterschiedlichen Konzentrationen, welcher zuvor mit VEGF vorinkubiert wurde, versetzt. Nach einer Inkubationsdauer von 3 - 4 Tagen wird ein Reagenz zur Bestimmung der Zellviabilität (z.B. Alarmar blue® oder CCK-8®) zugegeben und für eine bestimmte Zeit weiter inkubiert. Anschließend wird mit einem Mikrotiterplatten-Reader die Fluoreszenz bzw. Absorption gemessen, um die Anzahl lebender Zellen zu bestimmen und eine Dosis-Wirkungskurve zu erzeugen. Der Bioassay basiert dabei auf dem Prinzip, dass sich die Endothelzellen natürlich durch die Zugabe von VEGF teilen möchten, aber durch die konzentrationsabhängige Bindung des anti-VEGF-Antikörpers an das VEGF daran unterschiedlich stark gehindert werden, weswegen man eigentlich eher von einem Zellprofilerations-Inhibitionsassay sprechen sollte ????

Wenn man sich diesen Bioassay genauer anschaut, wird einem auffallen, dass er einige Nachteile in sich birgt. Die reine Durchführungsdauer des Bioassays ist nicht gerade kurz und die Verwendung primärer Zellen sorgt für eine erhöhte Variabilität in den Ergebnissen verschiedener Bioassays aufgrund unterschiedlicher Spender und Anzahl an Passagen. Zudem kann die Kultur von Primärzellen auch nicht ganz ohne sein… Wenn man dann noch bedenkt, dass die Zellen vor dem Bioassay eine gewisse Zeit kontinuierlich kultiviert worden sein müssen und dies gewaltig viel Zeit in Anspruch nimmt, ist es verständlich, dass neuere Trends z.B. zur Verwendung von kryokonservierten, ready-to-use Zellen gehen. Neben konventionellen ELISAs zeigt auch eine Application Note von 2018 zur Anwendung der AlphaLISA®-Technologie von Perkin Elmer in Zusammenarbeit mit dem Schweizer Auftragslabor IBR Inc. ebenfalls eine Möglichkeit eines alternativen, zellfreien und somit deutlich schnelleren Potency Assays [2].

Zwei weitere alternative Potency Assays, ein Reportergen-Assay [3] und ein Enzym-Fragment-Komplementierungsassay (enzyme-fragment complementation, EFC), werden im Folgenden mit dem Fokus auf ihren Methodenvalidierungen vorgestellt.

 

Testprinzipien

Für den Reportergen-Assay ist eine neue Zelllinie (NFAT-RE-Luc2P/KDR HEK293) generiert worden. Dafür wurden HEK293 Zellen stabil mit den Genen für den VEGF-Rezeptor 2 (VEGFR-2) und das VEGF165 response element nuclear factor of activated T cells (NFAT-RE) sowie dem Reportergen für Luciferase transfiziert. Somit tragen die HEK293 Zellen nun den VEGFR-2 auf ihrer Oberfläche. Wenn VEGF daran bindet, dimerisieren die beiden Rezeptormoleküle und es folgt eine Signalkaskade, die im Zellkern dafür sorgt, dass der Transkriptionsfaktor NFAT an sein Response Element NFAT-RE bindet und damit die Expression der Luciferase in Gang setzt. Wenn nun ein anti-VEGF-Antikörper in verschiedenen Konzentrationen ins Spiel kommt, bedeutet dies, dass entsprechend weniger Luciferase gebildet wird und somit das von der Luciferase katalysierte Lichtsignal schwächer ausfällt, da der anti-VEGF-Antikörper das verfügbare VEGF ja konzentrationsabhängig „wegfängt“, oder etwas eleganter ausgedrückt „neutralisiert“. Dieser Assay inklusive der Zelllinie ist kommerziell von Promega erhältlich.

Dem Enzym-Fragment-Komplementierungsassay (PathHunter® Bevacizumab Bioassay von Eurofins DiscoverX) liegt ebenfalls eine stabil transfizierte HEK293 Zelllinie zu Grunde. Hierbei wurden „nur“ die Gene für die beiden Monomere des VEGFR-2 in die HEK293 Zellen eingebracht. Das Besondere ist jedoch, dass die beiden Monomere im Zellinneren mit je einem Fragment der β-Galaktosidase (EA und ED) fusioniert wurden. Die beiden Enzymfragmente EA und ED sind getrennt voneinander inaktiv. Kommt es jedoch durch die Bindung von VEGF an die Monomere zur Dimerisation des Rezeptors, gelangen sie in unmittelbare räumliche Nähe und generieren so das aktive Enzym, welches seinerseits ein zugegebenes Substrat hydrolysiert und dadurch Chemilumineszenz erzeugt. Im Falle von anwesenden anti-VEGF-Antikörpern wird die Dimerisierung verhindert und das Signal bleibt aus.

 

Gegenüberstellung der beiden Bioassays, Schwerpunkt: Methodenvalidierung

Vorweg sei gesagt, dass beim Enzym-Fragment-Komplementierungsassay die dargestellten Informationen aus verschiedenen Quellen [4-6] zusammengestellt wurden und die Informationsgrundlagen nicht immer ganz eindeutig und vollständig waren (mehr dazu auch in der Diskussion). Da mir zudem einige Fehler aufgefallen sind, habe ich alle in den Quellen gezeigten Daten nachgerechnet, so dass in diesem Blogbeitrag außer den einwandfreien Angaben die gemäß meinen Berechnungen korrigierten Werte gezeigt werden.

Die nachfolgende Tabelle stellt die Ergebnisse der einzelnen, für die Validierung eines Potency Assays erforderlichen Parameter sowie weitere nützliche Informationen der beiden Bioassays einander gegenüber.

 
   Reportergen-Assaya  Enzym-Fragment-Komplementierungsassay
 2016 [4]  2017 [5]  2018 [6]
 Eingesetzte Zellen  Kryokonservierte, ready-to-use Zellenb
 Durchführungsdauer  < 8 h  < 24 h  
 „Art“ der Validierung und experimentelles Set-up

 „preliminary validation“ (gemäß ICH Q2R1)

 1 Linearitätsexperiment mit 4 Replikaten (Anzahl Analysten unklar, vermutlich 1)

 Qualifizierung (gemäß ICH Q2R1)

 1 Linearitätsexperiment mit je 1 Messung an 3 Tagen (Anzahl Analysten unklar, vermutlich 1)

 Qualifizierung

 1 Linearitätsexperiment mit je 1 Messung eines Analysten an 4 Tagen 

 Validierung gemäß USP <1033>

 1 Linearitätsexperiment, 2 Analysten, 6 unabhängige Läufec

  Linearitätd  5 Konzentrationen (50, 75, 100, 125, 150%); R2 = 0,9968  4 Konzentrationen (50, 75, 125, 150%), R2 = 0,9879e  6 Konzentrationen (50, 71, 90, 100, 121, 150%), R2 = 0,9935  6 Konzentrationen (50, 71, 90, 100, 121, 150%), R2 = 0,9899f
  Richtigkeit  Verwendung der Daten des Linearitätsexperiments; Recoveries zwischen 85 - 120% (nur grafisch gezeigt)  Verwendung der Daten des Linearitätsexperiments; mittlere Recovery: 95,9%  Verwendung der Daten des Linearitätsexperiments; mittlere Recovery: 98,0%  Verwendung der Daten des Linearitätsexperiments; mittlere Recovery: 99,9%g
  Wiederholpräzision  5 Analysen am gleichen Tag; RSD = 7,0% (Datengrundlage nicht gezeigt)  RSD = 7,3% (Datengrundlage nicht gezeigt)  Nicht untersucht oder gezeigt  Verwendung der Daten des Linearitätsexperiments; RSD von 6,4% bis 14,2%, im Mittel 10,1%h
  Interne Laborpräzision  Je 1 Analyse an 5 Tagen; RSD = 7,6% (Datengrundlage nicht gezeigt)  Verwendung der Daten des Linearitätsexperiments; RSD von 2,7% bis 5,0%, im Mittel 3,5%i  Verwendung der Daten des Linearitätsexperiments; RSD von 2,7% bis 8,5%, im Mittel 5,5%j  Verwendung der Daten des Linearitätsexperiments; RSD von 6,6% bis 14,2%, im Mittel 10,2%h
  Spezifität  Keine Inhibition bei denaturiertem BVZ oder anti-CD25-, -EGFR-, -TNFα- oder -IL-6-Antikörpern  Nicht untersucht oder gezeigt  
  Robustheit  Nach Generierung der Zelllinie, Einsatz von Zellen, die zu unterschiedlichen Passagen (3, 15, 33) eingefroren wurden: vergleichbare Kurven  Einsatz von 3 verschiedenen Zell-Chargen: vergleichbare VEGF-Kurven mit einer RSD von 11% bezogen auf den EC50 der Kurven der 3 Zellchargen  Nicht untersucht oder gezeigt 

 a In dieser Tabelle sind die Ergebnisse der Publikation dargestellt, weitere - hier nicht gezeigte - Validierungsdaten finden sich im Benutzerhandbuch von Promega [7].
 b Beim Reportergen-Assay sind ready-to use-Zellen Bestandteil des Kits von Promega, in der Publikation von Wang wurde die Zelllinie erst etabliert.
 c unklare Formulierung in der Quelle, siehe auch Diskussion
 d Hierbei handelt es sich nicht um die Auftragung des Signals (RLU) gegen die (logarithmierte) BVZ-Konzentration (also die Linearität im eigentlichen Sinne), sondern um die Auftragung der gemessenen relativen Potency gegen die erwartete / theoretische relative Potency. Sie gibt daher Auskunft über die Richtigkeit.
 e eigene Berechnung anhand der 4 Konzentrationen (das R2 in der publizierten Abbildung berücksichtigt einen nicht gezeigten 100 = 100%-Wert)
 f Einzeldaten nicht gezeigt, eigene Berechnung anhand der Daten für die Richtigkeit
 g eigene Berechnung, aber die gezeigten Einzeldaten für den prozentualen Fehler sind übereinstimmend
 h keine Darstellung der zu Grunde liegenden Einzelwerte. In der gezeigten Tabelle zur Wiederhol- und internen Laborpräzision stimmen die Werte in zwei Fällen (100% und 150%) bei beiden  Präzisionsarten mit allen 4 Nachkommastellen überein, was auf Tippfehler rückschließen lässt, Gesamtangaben daher fraglich
 i Daten eigener Berechnungen, da zwei Berechnungsfehler in den publizierten einzelnen RSDs
 j Daten eigener Berechnungen, da alle publizierten RSDs abweichend waren

 BVZ = Bevacizumab       EC50 = Half maximal effective concentration       RSD = relative Standardabweichung  

Diskussion

Bevor auf fachliche Punkte eingegangen werden soll, sei erwähnt, dass sich in jeder der 3 Quellen [4-6] zum Enzym-Fragment-Komplementierungsassay Fehler befanden. Diese reichten von falschen Seitenzahl-Angaben der aufgeführten Referenzen, über falsch berechnete Werte (s.o.), eine falsche Beschriftung beim Reaktionsprinzip (2017 ist es richtig gezeigt, 2018 müsste PK durch ED ersetzt werden) bis zu (möglicherweise) falschen Beschriftungen. So wird beispielsweise 2018 bei den Accuracy-Daten vom „geometrischen Mittelwert“ gesprochen, die Berechnungen von 2016 und 2017 zeigten aber den arithmetischen… und auch bei der Gegenüberstellung des PathHunter® Assays gegen den klassischen HUVEC-Assay scheint die Achse des PathHunter® Assays falsch beschriftet zu sein, da wahrscheinlich nicht die VEGF-Konzentration, sondern die BVZ-Konzentration dargestellt ist, wie sich aus dem Kurvenverlauf im Vergleich mit den Abbildungen der anderen Publikationen ableiten lässt…

Daneben waren einige Formulierungen etwas unklar… Bedeuten die Angaben zur Durchführung 2018 („2 analysts, 2 plates, 2 replicates/plate; 6 Independent runs per analyst to achieve n=8 per target potency”), dass jeder Analyst je 1 Platte mit 1 Replikat hat? Und wie kommt man mit 6 Läufen auf ein n = 8? Sollte das n = 6 heißen oder hatte jeder Analyst doch 2 Platten, was dann einem n = 12 entspräche? Und wann fanden diese 6 unabhängigen Läufe statt (2 an einem Tag gestaffelt oder an 6 verschiedenen Tagen)?

Aber um nicht zu viel „Nichtfachliches“ anzukreiden, soll an dieser Stelle damit Schluss sein und ein intensiver Blick auf die Methodenvalidierungen und die beiden Potency Assays an sich geworfen werden.

Schauen wir uns zuerst die Daten zur Linearität an. Abgesehen vom Assay von 2016 werden jeweils 5 oder mehr Konzentrationen untersucht, wie das von der ICH Q2(R1) gefordert ist. Doch sagen uns diese Daten wirklich etwas über die Linearität der Methode? Sie zeigen jeweils eine super Korrelation zwischen gemessenem und theoretisch erwartetem Wert bei Anwendung verschiedener Konzentrationen, geben aber keine Auskunft darüber, wie sich das Signal in Abhängigkeit von der Konzentration ändert. Dabei sollten wir jedoch bedenken, dass bei solchen Assays keine Einzelwerte gemessen werden, sondern die Proben und der Standard in einer Vielzahl an Verdünnungen aufgetragen werden, woraus 4-Parameter Logistic Fit-Kurven (4PL) resultieren und die Kurven der Proben anschließend mit der des Standards auf Gleichartigkeit verglichen werden. Somit müssen wir uns von dem einfachen Bild einer Gerade, wo eine halbierte Konzentration zu einem halb so starken Signal führt, lösen, da dieses hier nicht anwendbar ist. Wenn wir hier zur Evaluierung der Linearität bzw. Richtigkeit verschiedene Konzentrationen des Standards verwenden und diese entsprechend weiter verdünnen, resultiert das in seitlich versetzten Kurvenverläufen. Insofern sagt uns eine gute Korrelation zwischen gemessenem und erwartetem Wert bei verschiedenen Konzentrationen zwar in erster Linie etwas über die Richtigkeit der Methode, aber indirekt auch etwas über die Linearität. Wenn die erhaltenen Ergebnisse trotz angewandter Verdünnungen gut mit den theoretischen übereinstimmen, scheinen die Verdünnungen kein Problem darzustellen. Oder andersrum ausgedrückt: in dem Bereich der angewandten Verdünnungen können gute Ergebnisse erzielt werden.

Und wo wir gerade beim Arbeitsbereich sind: ja, auf den ersten Blick könnten wir denken, dass alle 4 gezeigten Validierungsexperimente den gleichen Bereich umfassen, da sie alle von 50 - 150% gehen. Da wir allerdings keine Angaben zum Standard haben, wissen wir nicht, ob für alle Experimente der gleiche Standard eingesetzt wurde und falls nicht, wie sich seine Konzentration und Aktivität möglicherweise unterscheidet. Die Vergleichbarkeit von Assays könnte zukünftig durch Verwendung eines von der WHO entwickelten internationalen Standards einfacher werden [8].

Beide Assays scheinen aber dem klassischen HUVEC-Assay hinsichtlich des Arbeitsbereichs überlegen zu sein. Bei Wang wird von einer Dosis-Wirkungs-Kurve für den Reportergen-Assay im Bereich von 4,6 - 370 ng/mL (ca. 80x Fenster) gesprochen und von 100 - 500 ng/mL (ca. 5x Fenster) für den HUVEC-Assay. Bei den gezeigten Graphen schwankt das Fenster jedoch nur zwischen ca. 4x - 10x (visuelle Abschätzung meinerseits) [3]. In der Präsentation des Enzym-Fragment-Komplementierungsassay von 2018 [6] wird diesem Assay ein 3x Fenster attestiert und dem HUVEC-Assay ein 1,5x bis max. 3x.

Wie sich aus den super Korrelationen der Daten der Linearität bereits ergibt, zeigt auch die Evaluierung der Richtigkeit über die Wiederfindungsrate beim Enzym-Fragment-Komplementierungsassay hervorragende Ergebnisse mit gemittelten Wiederfindungsraten von 96 - 100%. Beim Reportergen-Assay war die Schwankung der Wiederfindungsraten mit 85 - 120% etwas größer, wobei angemerkt werden muss, dass dies jetzt ein wenig ein Vergleichen von Äpfeln mit Birnen ist. Die genannten Wiederfindungsraten beim Enzym-Fragment-Komplementierungsassay sind gemittelt, die Schwankung bei Reportergen-Assay reflektiert die Breite der Einzelergebnisse.

Über die Wiederholpräzision möchte ich mich ungerne lang und breit auslassen, da entweder die Datengrundlage nicht gezeigt oder es nicht untersucht wurde oder nicht klar hervorgeht, wie viele Analysen wirklich von einem Analysten gemacht wurden.

Bei der Betrachtung der internen Laborpräzision des Enzym-Fragment-Komplementierungsassays über die 3 Jahre fällt auf, dass diese unter Vergrößerung der Datensatzes (von 4 auf 6 Konzentrationen) und unter Einbezug eines zweiten Analysten zunehmend größer wird, wie dies auch zu erwarten ist. Das ist hier schön erkennbar. Das gleiche lässt sich auch für den Reportengen-Assay unter Berücksichtigung der Daten einer weiteren Methodenvalidierung [7] beobachten.

Die Spezifität wurde beim Reportergen-Assay ausreichend untersucht, für den Enzym-Fragment-Komplementierungsassays liegen hierzu basierend auf den herangezogenen Quellen keine Daten vor, was schade ist, da die Untersuchung der Spezifität für Potency Assays gemäß ICH Q2(R1) wie auch gemäß USP <1033> gefordert ist.

Zur Evaluierung der Robustheit der Assays verschiedene Passagen bzw. Chargen der Zelllinie zu verwenden ist sinnvoll und spiegelt die späteren Anwendungsbedingungen wider. Beim Enzym-Fragment-Komplementierungsassay wäre es jedoch schöner gewesen, für die Auswertung anstatt VEGF-Kurven Bevacizumab-Kurven aufzunehmen. Wenn man sich neben diesen Versuchen aber vor Augen führt, dass beide Assays jeweils in verschiedenen Jahren wiederholt qualifiziert / validiert wurden und konstant gute Ergebnisse ergeben haben, spricht dies für sehr robuste Assays in beiden Fällen.

Eine Validierung eines Bioassays muss nicht zwangsläufig gemäß den Vorgaben der ICH Q2(R1) erfolgen. Eine Alternative stellt das USP-Kapitel <1033> „Biological Assay Validation“ dar, wie es hier auch bei dem Enzym-Fragment-Komplementierungsassay im Jahr 2018 angewandt wurde. Im Zuge dessen muss die relative Richtigkeit als Bias, die Spezifität, die interne Laborpräzision und der Arbeitsbereich untersucht werden und es kann eine ausgedehntere statistische Auswertung zur Anwendung kommen. Die Entscheidung, gemäß welchen regulatorischen Vorgaben die Methodenvalidierung durchgeführt werden soll, bleibt dem Anwender überlassen.

Abschließend sei noch bemerkt, dass sowohl der Reportergen-Assay als auch der Enzym-Fragment-Komplementierungsassay mit weiteren anti-VEGF-Therapeutika evaluiert wurden, wie beispielsweise Aflibercept und Ranibizumab [5, 7].

Und wenn man mich jetzt fragen würde, welchen der beiden Potency-Assays ich lieber in meinem Labor (wenn ich denn eines hätte) etablieren würde, so muss ich zunächst sagen, dass ich den Eindruck habe, dass grundsätzlich beide Potency-Assays auf soliden Füßen stehen. Unter Berücksichtigung der Zeitdauer für die Durchführung des jeweiligen Assays und der Tatsache, dass in dem Labor, in dem ich in der letzten Zeit Transfers und Validierungen von Bioassays begleiten durfte, bereits andere Reportergen-Assays mit den gleichen Luciferase-Substratmöglichkeiten etabliert und die den Analysten vertraut sind, würde ich mich für den Reportergen-Assay entscheiden (doch das ist nur meine ganz persönliche, subjektive Meinung).

 

Referenzen

[1] Wang Y., Fei D., Vanderlaan M., Song A. (2004) Biological activity of bevacizumab, a humanized anti-VEGF antibody in vitro. Angiogenesis. 7(4):335-345

[2] Morra L., Moser R. (2018) Alpha Technology: A Fast and Sensitive Orthogonal Approach to Cell-based Potency Assays, www.perkinelmer.com/de/libraries/APP_AlphaLISA_Bevacizumab, zugegriffen am 27.01.2023

[3] Wang L. et al. (2016) Development of a robust reporter-based assay for the bioactivity determination of anti-VEGF therapeutic antibodies. J. Pharm. Biomed. Anal. 125:212-218

[4] Lamerdin J., Daino-Laizure H., Saharia A., Charter N.W. (2016) Accelerating Biologic and Biosimilar Drug Development: Ready-to-Use, Cell-Based Assays for Potency and Lot-Release Testing. BioProcess Inter. 14:36-44.

[5] Lamerdin J., Caldwell P., Daino-Laizure H., Paranjpe G., Saharia A. (2017) Ready-to-Use Potency Assays for Bevacizumab, Aflibercept, & Ranibizumab, www.discoverx.com/tools-resources/document-resource-library/documents/bebpa-usa-2017-ready-to-use-potency-assays-for-bevacizumab,-aflibercept,-ranibizumab, zugegriffen am 27.01.2023

[6] Urquhart P., Lamerdin J. (2018) Accelerating Biologics and Biosimilars Development:Case Studies on Implementing Robust and Simple Potency Bioassays, www.discoverx.com/CMSPages/GetAmazonFile.aspx?path=~%5Cdiscoverx%5Cfiles%5C80%5C80188177-deda-4aee-9035-e05a77fa3e9b.pdf&hash=8314548a675bebfaf40d2ce953615441cff230a9f85882ad1cbbac255adb25a8, zugegriffen am 27.01.2023

[7] Promega Technical Manual VEGF Bioassay (TM544, revised 12/22)

[8] Jia H., Harikumar P., Atkinson E., Rigsby P., Wadhwa M. (2021) The First WHO International Standard for Harmonizing the Biological Activity of Bevacizumab. Biomolecules. 11(11):1610

 

Disclaimer

Am Ende dieses hoffentlich interessanten Beitrages eine vielleicht nicht ganz unwichtige letzte Information: Die Nennung der Markennamen in diesem Beitrag sind zwingend für die Verständlichkeit notwendig gewesen und die Markennamen sind durch ihre Eigentümer geschützt. Wir haben zu keinem Zeitpunkt finanzielle Unterstützung durch die in diesem Beitrag genannten Firmen oder die Firmen der genannten Marken erhalten. Dieser Blogbeitrag spiegelt einzig meine persönliche Meinung wider.