Wo endet die Linearität - gibt es eine „Obergrenze“?

Geschrieben von Dr. Janet Thode Veröffentlicht in Methodenvalidierung

Einleitung

Auch wenn es diesmal nicht um eine Methodenvalidierung im pharmazeutischen Bereich geht1, möchte ich eine interessante Fragestellung zur „Obergrenze“ der Linearität aufgreifen. Wir haben folgende Thematik:

Für die Durchführung von Echtzeit-Polymerasekettenreaktionen (Real-time PCR, RT-PCR) zum Nachweis von SARS-CoV-2 sollte die Vergleichbarkeit von 2 Thermocyclern bestimmt werden. Dafür wurden die Ct-Werte der beiden Thermocycler (nennen wir sie A und B) bei verschiedenen Probenkonzentrationen gegeneinander aufgetragen.

 

Ein wenig Hintergrundwissen

Um den Ct-Wert (Ct steht für „cycle threshold“) zu verstehen, muss man sich das Reaktionsprinzip der PCR vor Augen halten. Dabei verlängert das Enzym DNA-Polymerase in Anwesenheit eines Primers einzelsträngige DNA zu einem Doppelstrang. Anschließend wird dieser Doppelstrang durch einen Denaturierungsschritt wieder getrennt und die Primer können erneut an beiden neuen Einzelsträngen binden und wieder zu Doppelsträngen verlängert werden. Da dieser Prozess in vielen aufeinanderfolgenden Zyklen stattfindet, erfolgt auf diese Weise eine exponentielle Amplifizierung einer zuvor geringen DNA-Menge. Da die neu synthetisierten Produkte der vorherigen Zyklen als Ausgangsstoffe für die nachfolgenden Zyklen dienen, spricht man von einer Kettenreaktion. Da in unserem Falle nicht DNA, sondern RNA vorliegt, erfolgt eine vorgeschaltete reverse Transkription, um die RNA in DNA zu konvertieren und somit die Untersuchung von RNA-Viren zu ermöglichen.

Der Ct-Wert bezeichnet jetzt bei einer RT-PCR denjenigen Amplifikationszyklus, bei dem die oben geschilderte Reaktion in die exponentielle Phase eintritt und somit den Schwellenwert überschreitet (zuvor war das mathematisch gesehen zwar auch schon der Fall, aber die Reaktion war am Gerät noch nicht messbar, befand sich also noch unterhalb des Schwellenwerts (à threshold)). 

Der Ct-Wert ist somit ein Maß für - in unserem Beispiel - die RNA-Konzentration des in der Probe vorhandenen SARS-CoV-2 Virus. Ein niedriger Ct-Wert korreliert mit einer größeren RNA-Konzentration, da eine geringere Anzahl an Amplifikationszyklen zum Nachweis benötigt wird im Vergleich zu einem höheren Ct-Wert, bei dem mehr Zyklen durchlaufen werden mussten, weil die RNA-Ausgangskonzentration in der Probe deutlich niedriger war.

 

Zurück zum Beispiel und zur Fragestellung

Die Auftragung der Ct-Werte der beiden Thermocycler sah dann so aus:

Je näher die einzelnen Punkte an der Geraden liegen, desto ähnlicher sind sich die Proben-Ergebnisse bei beiden Thermocyclern. Auffällig ist jedoch, dass ab einem Ct-Wert von ca. > 34 die Werte anfangen zu streuen.

Es ist leicht verständlich, dass die Streuung umso größer wird, je weniger Virus-Material in der Ausgangsprobe ist, weil die Wahrscheinlichkeit abnimmt, dass man beim Pipettieren exakt die gleiche Menge an RNA für beide Thermocycler erwischt hat. Aus diesem Grunde ist ein Vergleich der beiden Thermocycler nur im linearen Bereich sinnvoll.

Dies führt zu der Frage: Wo hört der lineare Bereich der Methode auf, was ist die „Obergrenze der Linearität“? Wie können wir das objektiv bestimmen? 

 

Lösungsmöglichkeiten

Um nicht sukzessive vom oberen Ende der Gerade beginnend einzelne Punkte auszuschließen und dann zu prüfen, wann der Korrelationskoeffeizient R der Regressionsgerade dem Wert 1 am nächsten kommt, sondern um der Frage nach der Obergrenze der Linearität objektiver auf den Grund zu gehen, gibt es verschiedene statistische Methoden, die angewendet werden können, wie z.B. die Berechnung der Responsivität (relative Reponse) oder eine Residuenanalyse. Unter letztere fallen auch tiefergehende statistische Techniken wie die Bestimmung der D Werte (Cooks Distance) oder der H Werte (Hat Values). Daneben existieren noch weitere Möglichkeiten zur Evaluierung der Linearität, deren Auflistung den Rahmen dieses Blogbeitrages jedoch sprengen würden. Eine Anwendung von Linearitätstests, wie sie zur Überprüfung von Kalibriergeraden eingesetzt werden, macht bei diesem Beispiel keinen Sinn.

Entsprechend sollen hier nachfolgend die Responsivität und die Residuenanalyse für unser Beispiel zur Ermittlung der Obergrenze der Linearität vorgestellt werden.

Da wir die Ct-Werte des Thermocyclers A gegen B aufgetragen haben, fungieren die Ct-Werte des Thermocyclers A als y-Werte, die von B als x-Werte. Die Responsivität wird als y/x berechnet, für das Residuum subtrahieren wir y-x.

Ct-Wert Themocycler B [-] (x [-])

Ct-Wert Themocycler A [-] (y [-])

Responsivität [-] Residuum [-]
20,91 21,19 1,01 0,28
21,53 21,89 1,02 0,36
22,29 22,38 1,00 0,09
22,44 22,60 1,01 0,16
23,03 23,37 1,01 0,34
23,16 23,80 1,03 0,64
23,73 23,93 1,01 0,20
24,60 24,81 1,01 0,21
25,23 25,55 1,01 0,32
25,73 26,06 1,01 0,32
26,63 27,04 1,02 0,41
26,93 27,28 1,01 0,35
29,05 29,35 1,01 0,30
30,88 31,07 1,01 0,19
32,02 32,83 1,03 0,81
34,29 35,97 1,05 1,68
34,30 35,08 1,02 0,78
34,73 37,06 1,07 2,33
34,77 37,34 1,07 2,57
34,97 37,41 1,07 2,44
35,18 39,58 1,13 4,40
35,33 37,69 1,07 2,36
36,19 38,68 1,07 2,49
36,19 40,31 1,11 4,12
36,42 35,08 0,96 -1,34
36,45 37,98 1,04 1,53
36,93 36,73 0,99 -0,20
36,97 37,49 1,04 0,52

Anschließend berechnen wir den Mittelwert der Responsivität (hier: 1,031, unter Einbezug aller Werte, was durchaus hinterfragt werden darf) und legen entsprechende Grenzwerte fest (hier: exemplarisch ± 3% vom Mittelwert; also 1,000 & 1,062). Auf welcher Basis die Grenzwerte festgelegt werden, sowie die Frage, ob alle Werte für die vorherige Berechnung des Mittelwerts verwendet werden dürfen oder ob zuvor mit einem Ausreißertest (und wenn ja, mit welchem) Einzelwerte ausgeschlossen werden sollten, sollte im regulierten Umfeld den internen Vorgaben z.B. einer Arbeitsanweisung entnommen werden. Im nicht-regulierten Umfeld wären entsprechende Begründungen hierzu im Bericht sicherlich nicht von Nachteil ;-)

Wenn wir die berechneten Daten (Responsivität und Residuen) für unsere Fragestellung „Obergrenze der Linearität“ jetzt grafisch darstellen, kann das z.B. so aussehen:

Wir sehen, dass bei der Auswertung mittels Responsivität erst ab eines Ct-Werts des Thermocyclers B von 34,73 die Werte außerhalb der (selbstgewählten!) Grenzen liegen, während eine Betrachtung des Residuenplots bereits ab dem Ct-Wert des Thermocyclers B von 32 eine deutliche Auffälligkeit erkennen lässt. Dies deutet daraufhin, dass das lineare Modell für diesen Teil der Daten nicht mehr geeignet ist.

Zusammengefasst lässt sich festhalten, dass mit den statistischen Methoden „Responsivität“ und „Residuenanalyse“ die Obergrenze der Linearität objektiv ermittelt werden kann. Welche Methode mit welchen Details letztendlich anzuwenden ist, ist entweder in internen Vorgaben festgelegt oder mit entsprechender Begründung selbst zu entscheiden.

 

1 Wir können hierbei also getrost alles zum linearen Bereich zwischen üblicherweise 80-120% (oder 70-130% bei content uniformity) ausblenden, da hier nicht von Relevanz.