20.08.2024 | LOGFILE Leitartikel 17/2024

Validierung analytischer Verfahren: Regulatorische Anforderungen – Teil 2

Validierung analytischer Verfahren: Regulatorische Anforderungen – Teil 2

5 Min. Lesezeit | von Joachim Ermer

Wichtige Aspekte bei der Umsetzung der regulatorischen Anforderungen

Die ICH-Guideline enthält allgemeine Anforderungen und Empfehlungen für grundlegende statistische Leistungsparameter und experimentelle Ansätze. Dies sollte jedoch nicht als Checkliste verstanden oder missbraucht werden. Auf die Verantwortlichkeit des Anwenders zur Anpassung an die Aufgabenstellung wird ausdrücklich hingewiesen: „It is the responsibility of the applicant to choose the validation procedure and protocol most suitable for their product“. Eine nicht auf das konkrete Prüfverfahren und dessen beabsichtigten Einsatz abgestimmte Validierung ist zumindest eine Verschwendung von Zeit und Ressourcen, da dann die Eignung nicht zuverlässig eingeschätzt werden kann.

Was beinhaltet nun eine „geeignete“ Methodenvalidierung?

Insbesondere muss immer das Ziel der Validierung, d. h. der Nachweis der Eignung des Prüfverfahrens in der Routineanwendung im Auge behalten werden. Soweit möglich, sollten die Routinebedingungen in den experimentellen Validierungsuntersuchungen reflektiert werden, beispielsweise durch repräsentative Zusammensetzung der Proben bei Richtigkeit und Untergrenze des Arbeitsbereichs, oder Verwendung von authentischen Proben in Präzisionsstudien. Nur dann entspricht die Probenvorbereitung, die oft einen bedeutenden Beitrag zur Präzision liefert, der in der Chargenprüfung. Falls die Routinebedingungen aus experimentellen Gründen nicht realisierbar sind, sollte zumindest der mögliche Einfluss auf die Beurteilung betrachtet werden. Auf die Berücksichtigung dieser „regular test conditions“ wird in der Revision 2 der Validierungsguideline ausdrücklich hingewiesen.

Der Anwender muss die für das Prüfverfahren und dessen Einsatz kritischen Leistungsparameter identifizieren, diese Parameter in sinnvoller und effektiver Weise experimentell ermitteln und hinreichende Akzeptanzkriterien zur Bestätigung der Eignung definieren.

Auf Grund des iterativen Charakters von Methodenentwicklung und -validierung ist ein rationales Design des Prüfverfahrens die erste Voraussetzung für eine optimale Validierung. Ein umfassendes Verständnis des Prüfverfahrens ist eine wesentliche Zielrichtung der neuen ICH Q14-Guideline „Analytical Procedure Development“, mit einem systematischen Quality-by-Design-Ansatz (gültig seit 14.Juni 2024).


Festlegung von Akzeptanzkriterien

Um beurteilen zu können, ob eine Methode für die beabsichtigte Anwendung geeignet ist, muss man Akzeptanzkriterien festlegen. Die Festlegung von Akzeptanzkriterien wurde in der Revision 2 der Validierungsguideline ergänzt, allerdings fehlt oft eine Orientierung zur Ableitung. Die (richtige) Anforderung im Guideline-Entwurf (Schritt 2), dass die Präzision mit den Spezifikationsgrenzen kompatibel sein muss, wurde aus der finalen Guideline entfernt.

Die Akzeptanzgrenzen der Spezifikation repräsentieren die Anforderungen an das jeweilige Qualitätsattribut. Beispielsweise definiert die ICH-Guideline Q3A eine erforderliche Berichtsgrenze für unbekannte Nebenprodukte von 0,05 % bzw. 0,03 %, abhängig von der Tagesdosis des jeweiligen Wirkstoffs (≤ bzw. > 2 g). Demzufolge muss das Prüfverfahren in der Lage sein, unbekannte Nebenprodukte bei dieser Konzentration zu quantifizieren, d. h. die Berichtsgrenze stellt die maximale Bestimmungsgrenze dar.

Die maximal zulässige analytische Variabilität für Gehaltsbestimmungen wird durch die Spezifikationsgrenzen vorgegeben. Andere Leistungsparameter sind methodenspezifisch und beispielsweise mit der Art der Kalibrierung, oder mit dem experimentellen Validierungsansatz verbunden, die zufällige Variabilität stellt jedoch immer den Mindestbeitrag dar, der berücksichtigt werden muss.

Statistische Signifikanztests prüfen allein auf eine statistische Signifikanz, z. B. der Mittelwert-t-Test auf eine statistisch signifikante Differenz zwischen zwei Mittelwerten, was direkt ein Akzeptanzkriterium darstellt. Ob eine solche signifikante Differenz eine praktische Bedeutung hat, ist gar nicht Gegenstand des Tests.

Hier können zwei Szenarien unterschieden werden:

  • Produzentenrisiko: Einerseits können sehr geringe Variabilitäten oder eine große Datenzahl schnell zu einer Signifikanz führen. In diesem Fall spricht man von einem Produzentenrisiko, d. h. eine an sich akzeptable Methode erfüllt die Akzeptanzkriterien nicht. Durch reine Erhöhung der Datenzahl wird jede – noch so kleine – Differenz irgendwann signifikant.
  • Konsumentenrisiko: Andererseits kann aber auch eine zu große Variabilität praktisch bedeutsame Differenzen überdecken, d. h. diese werden als nicht signifikant getestet. In diesem Fall spricht man von einem Konsumentenrisiko, d. h. eine mangelhafte Leistungsfähigkeit wird nicht entdeckt, was zur Freigabe nicht spezifikationskonformer Chargen führen kann.

Auf diese Problematik der Signifikanztests wird auch im USP-Kapitel zur Validierung <1225> hingewiesen: „Setting an acceptance criterion based on the lack of statistical significance … is not an acceptable approach.“

Deshalb ist zu empfehlen, dass absolute Akzeptanzkriterien definiert werden, bevorzugt für normalisierte (prozentuale) Leistungsparameter. Diese können aus Erfahrungswerten abgeleitet werden und sind auch zwischen verschiedenen Methoden vergleichbar. Da solche Leistungsparameter mit der Variabilität der betreffenden Methode verknüpft sind, ist die Kenntnis einer für die jeweilige Anwendung akzeptablen Präzision wichtig.

Statistische Äquivalenztests werden in ICH Q2(R2) für Präzision und Richtigkeit empfohlen: „The observed … 100(1-α)% confidence interval (or justified alternative statistical … interval should be compatible with the corresponding accuracy acceptance criteria“. Hier ist – richtigerweise – die Fragestellung nicht, ob die beobachtete Differenz statistisch signifikant ist, sondern ob diese Differenz (einschließlich ihres Vertrauensbereichs als Maß der Unsicherheit) innerhalb eines zuvor definierten Akzeptanzbereiches liegt. Mit letzterem wird ein Maß für die praktische Relevanz eingeführt. Da Vertrauensbereiche mit zunehmender Datenzahl und abnehmender Variabilität geringer werden, steigt hier die Wahrscheinlichkeit eines positiven Testergebnisses, im Gegensatz zu den Signifikanztests. Diese Vorgehensweise wird auch im Allgemeinen USP Informationskapitel <1010> sowie in der Fachliteratur beschrieben und erlaubt eine numerisch abgesicherte Risikokontrolle über den verwendeten α-Fehler. Die Einbeziehung der Unsicherheit erfordert gegenüber einem einfachen Vergleich der berechneten Parameter mit dem Akzeptanzkriterien entweder weitere Akzeptanzgrenzen oder eine größere Anzahl an Werten, zur Verringerung der Vertrauensbereiche.

Leider wird in ICH Q2(R2) kein Kontext diskutiert, d. h. ob Äquivalenztests in allen Fällen erwartet werden. Nach Meinung des Autors sollte der Vergleichsansatz je nach Risiko des Qualitätsattributes und des Prüfverfahrens (Komplexität) gewählt werden. Bei geringerem Risiko ist ein einfacher Vergleich durchaus vertretbar.


Akzeptanzgrenzen für Präzisionen

Da das Endergebnis (reportable result) mit den Spezifikationsgrenzen verglichen wird (USP <General Notices>), ist dessen Präzision ausschlaggebend für die Eignung des Prüfverfahrens. Die Spezifikationsgrenzen müssen mindestens die Herstell- und die analytische Variabilität beinhalten. Die Herstellvariabilität kann für einen Herstellungstyp auf Grund von Erfahrung abgeschätzt werden, bzw. durch Bestimmung einer größeren Anzahl von Chargen in einer Messserie mittels Varianzanalyse ermittelt werden. Aus dem restlichen zur Verfügung stehenden Bereich kann die Mindestanforderung an die Präzision des Endergebnisses abgeleitet werden, zum Beispiel aus den Wahrscheinlichkeiten der Normalverteilung. Als Maß der Eignung dient eine akzeptable Wahrscheinlichkeit innerhalb oder außerhalb (OOS) der Spezifikationsgrenzen.

Für LC-Gehaltsbestimmungen bei Wirkstoffen gibt es in Ph.Eur. und USP Vorgaben für Injektionspräzisionen. Diese sind abhängig von der Anzahl der Injektionen und der Differenz zwischen Spezifikationsobergrenze der Wirkstoffmonographie und der theoretischen Obergrenze des wahren Gehaltes 100 %, d. h. dem zur Verfügung stehenden Bereich für die analytische Variabilität. Zur Sicherstellung derselben Unsicherheit sinkt die akzeptable Präzision bei geringerer Anzahl an Injektionen. Die zufällige Streubreite von Standardabweichungen hängt von der Anzahl der Werte ab (Chi-Quadrat-Verteilung). Man kann jedoch einen allgemeinen Faktor von 2 zwischen wahrer Standardabweichung und Obergrenze der Verteilung annehmen. Die Akzeptanzgrenze von 0,85 % für die Injektionspräzision aus 6 Injektionen und 102 % oberer Spezifikationsgrenze wäre somit bis zu einer wahren RSD von etwa 0,4 % realistisch, bei 3 Injektionen darf die wahre RSD jedoch 0,2 % nicht überschreiten.

Bei Quantifizierung von Nebenprodukten oder anderer Spurenanalytik ist die starke Konzentrationsabhängigkeit der Präzision zu beachten. Die Berichtsgrenze kann hier als einheitliche Bezugskonzentration zur Sicherstellung der Anforderungen verwendet werden, da eine Wiederhol- bzw. Laborpräzision von 25 % bzw. 30 % eine akzeptable Quantifizierung erlauben.

 
Joachim Ermer

Autor

Dr. Joachim Ermer
Berater bei Ermer Quality Consulting
E-Mail: info@ermer-quality-consulting.com

 
GMP-BERATER

GMP-BERATER


Die weltweit größte Wissenssammlung im Bereich der Good Manufacturing Practice!

Der GMP-BERATER verbindet die permanent aktualisierten Vorschriften der globalen Regelwerke mit Handlungsanweisungen zur sofortigen Umsetzung in Ihrem Betrieb.

Lernen Sie hier den GMP-BERATER kostenlos und unverbindlich kennen.


> Mehr Informationen und Bestellung
 
 

Kommentare


Schreiben Sie einen Kommentar zu diesem Leitartikel.

> Zögern Sie nicht, wir freuen uns auf Ihr Feedback!