Was ist eigentlich ein Konfidenzintervall?

Geschrieben von Dr. Eva Arnold am . Veröffentlicht in Methodenvalidierung

Bei der Herstellung eines Arzneimittels sind die Kontrollen mandatorisch. Hier kommt man schnell auf ein Problem: Um den Endverbraucher zu schützen, möchte man keine Fehler in einem Produktionsschritt übersehen. Andererseits ist eine 100 % Kontrolle in einigen Produktionsschritten nicht möglich. So kann man beispielsweise nicht jede einzeln verpackte Tablette wieder auspacken und auf ihre Beschaffenheit untersuchen, nur um sicher zu sein, dass kein Fehler übersehen wurde.

Aus diesem Grund nimmt man eine Stichprobe, das heißt man entscheidet sich für eine gewisse Menge an Tabletten pro Charge, um diese auf Fehler zu untersuchen. Anschließend muss von dieser Stichprobe ausgehend eine Schätzung abgegeben werden, die sich auf die gesamte Charge bezieht. Hier kommt das sogenannte Konfidenzintervall ins Spiel.

So werden bei In-Prozess-Kontrollen ermittelte Werte mit einem zuvor definierten Soll-Wert verglichen. Wenn man davon ausgeht, dass die Produktion diesen Wert sehr genau einhält, schwanken also die echten Werte in einer Normalverteilung um diesen Soll-Wert. Einfach gesagt: Eine Tablette soll 400 Milligramm eines Wirkstoffs enthalten. Die produzierten Tabletten enthalten selten exakt 400 Milligramm, sondern schwanken zwischen 390 und 410 Milligramm. Da der Produzent natürlich bemüht ist, den Sollwert von 400 Milligramm einzuhalten, kommen die meisten Tabletten sehr nah an die 400 Milligramm heran, beispielsweise enthalten die meisten Tabletten zwischen 395 und 405 Milligramm. Würde man eine komplette Tablettencharge und die jeweiligen Gewichte des Wirkstoffs gegeneinander auftragen, würde man eine klassische Normalverteilung erhalten. Daraus lässt sich auch der „echte“ Mittelwert, der sogenannte Erwartungswert, bestimmen. Als Qualitätsmerkmal haben wir in der Spezifikation festgelegt, dass dieser „echte“ Mittelwert zwischen 395 und 405 Milligramm liegen soll.

Wie oben bereits erwähnt, können wir nicht jede einzelne Tablette untersuchen. Daher bleibt dieser Erwartungswert für uns unbekannt. Da wir dennoch wissen wollen, ob die aktuelle Tablettencharge dem Soll-Wert des Wirkstoffgehalts entspricht, ziehen wir also eine Stichprobe von beispielsweise 100 Tabletten und analysieren diese. Mit sehr hoher Wahrscheinlichkeit unterscheidet sich der Mittelwert der Stichprobe vom „echten“ Mittelwert. Andersherum gesagt: Es ist sehr unwahrscheinlich, mit einem Stichprobenmittel auf exakt den Erwartungswert zu kommen, den man haben möchte. Nun stehen wir vor dem folgenden Problem: Unser Stichprobenmittelwert ist nur eine Schätzung, und den „echten“ Mittelwert können wir nie und nimmer bestimmen, ohne unsere ganze Charge zu zerstören.

Um dieses Problem zu umgehen, legen wir einen Bereich fest, in dem dieser „echte“ Mittelwert zu vermuten ist. Dieser Bereich wird Konfidenzintervall (oder auch Vertrauensintervall) genannt. Je größer dieser Bereich ist, desto wahrscheinlicher enthält dieser auch den „echten“ Mittelwert. Nun könnte man meinen, es sei von Vorteil, ein möglichst breites Konfidenzintervall zu bestimmen, damit der „echte“ Mittelwert immer enthalten ist. Je größer das Konfidenzintervall ist, desto schlechter ist jedoch die Genauigkeit der Schätzung. Entsprechend wollen wir also ein möglichst schmales Konfidenzintervall. Damit kommen wir zu einem weiteren Problem: Bei einer zufällig gezogenen Stichprobe können auch Ausreißer dabei sein, die sich bei der oben genannten Normalverteilung zum Beispiel am äußeren Rand der Wirkstoffmenge befinden. Diese Ausreißer enthalten selbst mit dem Konfidenzintervall nicht den „echten“ Mittelwert. Die Wahrscheinlichkeit, solche Ausreißer in der Stichprobe zu haben, ist zwar entsprechend gering, aber nicht unmöglich. Um diese Wahrscheinlichkeit miteinzubeziehen, legt man ein sogenanntes Konfidenzniveau (auch Vertrauensniveau genannt) fest. Nehmen wir ein Konfidenzniveau von 95 % an, so bedeutet dies, dass 95 % der Stichprobenwerte mit Konfidenzintervall den „echten“ Mittelwert enthalten. Damit dürfen 5 % der Werte Ausreißer sein.

Doch wie legt man das Konfidenzintervall fest? Die Breite des Konfidenzintervalls hängt von der Standardabweichung (σ) der Stichprobe und dem gewählten Konfidenzniveau ab. Die Wahl des Konfidenzniveaus ist einem selbst überlassen. In der Pharmabranche wird üblicherweise das 95 %-Niveau verwendet. Das gewählte Konfidenzniveau wird verwendet, um den kritischen Wert Za/2 zu ermitteln. Dafür wird für 0,95 / 2 = 0,475 der dazugehörige Wert in einer z-Tabelle (Normalverteilungstabelle) nachgeschaut. Für ein Konfidenzniveau von 95 % ergibt das einen Za/2-Wert von 2. Mit diesem Wert, der Standardabweichung (σ) der Stichprobe und der Stichprobengröße (n) lässt sich das Konfidenzintervall bestimmen. Nehmen wir an, wir haben 100 Tabletten analysiert und kommen auf einen Mittelwert von 398,8 Milligramm und eine Standardabweichung von 12,4 Milligramm. Unser Konfidenzintervall berechnet sich damit aus:

2* σ / √(n) = 2*12,4 / √(100) = 2,48

Das heißt, der „echte“ Mittelwert liegt bei 398,8 im Konfidenzintervall [396,32; 401,28] und wäre damit innerhalb unser Spezifikation (zwischen 395 und 405 mg).

Je größer die Standardabweichung, also die Streuung unserer Stichprobe ist, desto größer ist unser Konfidenzintervall. Hieraus ergibt sich auch, weshalb ein breites Konfidenzintervall ein Zeichen für eine schlechte Schätzung darstellt. Gleichzeitig lässt sich unser Konfidenzintervall verkleinern, indem wir unsere Stichprobengröße (n) erhöhen. Wenn wir unsere Stichprobe erhöhen, reduzieren wir gleichzeitig auch unsere Streuung und damit Standardabweichung, da wir, je mehr Tabletten wir analysieren, der „echten“ Normalverteilung immer näherkommen. Würden wir beispielsweise nur 10 Tabletten untersuchen, kämen wir bei gleichem Mittelwert und gleicher Standardabweichung auf ein Konfidenzintervall von 7,8, womit unsere Schätzung mit dem Konfidenzintervall [391,0; 406,6] nicht mehr der Spezifikation entspricht und die Charge nicht freigegeben werden kann.

Stellen wir also abschließend fest: Je größer die Stichprobe (n) gewählt ist, desto kleiner ist das Konfidenzintervall und desto genauer ist unsere Schätzung. Die Wahl der Stichprobe ist also maßgeblich für die Vertrauenswürdigkeit einer Kontrolle eines Herstellungsprozesses – wohingegen die Anzahl der Stichproben weniger ausschlaggebend ist. Nehmen wir also unser Tablettenbeispiel: Wenn wir pro Charge 10 Stichproben à 10 Tabletten nehmen, ist unsere Schätzung weniger genau, als wenn wir 1 Stichprobe à 100 Tabletten nehmen, obwohl dieselbe Menge Tabletten, nämlich 100 Stück, „geopfert“ werden musste.

Um den Bogen zur Methodenvalidierung zu spannen, soll abschließend erwähnt werden, dass auch hierfür die Kenntnis der Berechnung von Konfidenzintervallen notwendig ist, da die Angabe von Konfidenzintervallen von der ICH Q2(R1) Guideline sowohl für den Parameter Richtigkeit (accuracy) als auch für alle Arten der Präzision (precision) empfohlen wird.

Tags: Methodenvalidierung ICH Q2(R1) Konfidenzintervall

Cookies erleichtern die Bereitstellung unserer Dienste. Mit der Nutzung unserer Dienste erklären Sie sich damit einverstanden, dass wir Cookies verwenden.
Weitere Informationen