Neue Metaanalyse zu Schultertesten

In einem systematischen Review (SR) von 2017 haben Gismervik, Drogset, Granviken, Ro und Leivseth (vgl. 1) die aktuelle Evidenzlage zu der Untersuchung der Schulter zusammengefassst. In diesem Artikel werden die Ergebnisse der Studie dargestellt und interpretiert. Für die Interpretation werden die Studieninhalte in Bezug zur Methodenliteratur gesetzt.

zum systematischen Review

Klinische Relevanz der Studie: Die Forscher begründen die Relevanz des SR mit der Inhomogenität bisheriger SRs. Bisherige SRs haben entweder verschiedenen Teste untersucht oder sind bei den gleichen Testen zu unterschiedlichen Ergebnissen gekommen.

PICO des SR: P = Patienten mit allen Schulterdiagnosen, die häufig in spezialisierten Kliniken anzutreffen sind  ohne Frakturen, Dislokationen, Gelenk- und Nervendysfunktionen I = Mindestens ein Schultertest wird auf diagnostische Genauigkeit untersucht C = Ein angemessener Referenztest wird in der Primärstudie als Vergleichstest herangezogen O = Die Sensitivität und Spezifität wurde in den Primärstudien berechnet oder kann für mindestens einen Schultertest erkannt werden.

Methode: Es wurden Diagnostische Odds Ratios (DOR) berechnet. Diagnostische Odds Ratios werden aus der Falsch-Positiv-Rate und Richtig-Positiv-Rate eines diagnostischen Testes errechnet. Daraus soll die Wahrscheinlichkeit eines positiven Testergebnisse bei Vorliegen der Krankheit (= erkrankte Person) und die Chance eines positiven Testergebnisses bei Nicht-Vorliegen der Krankheit (= gesunde Person) ermittelt werden. Je höher DOR, desto stärker kann der Test zwischen dem Vorliegen und Nicht-Vorliegen einer Krankheit unterscheiden (diskriminieren) (vgl. 2 , S. 50).

Die Richtig-Positiv-Rate entspricht dabei der Sensitivität.

Interpretation: In einem Artikel von 1995 beschreiben Irwig, Macaskill, Glasziou und Fahey, dass beim Pooling von Falsch-/ und Richtig-Positiv-Raten aus Primärstudien beachtet werden muss, dass in den Primärstudien die Kriterien zur Beurteilung der Testperformance unterschiedlich definiert sein können (vgl. 3 , S. 3).

In der einer der eingeschlossenen Studien kann ein Speedtest als positiv bewertet werden, wenn der  Studienteilnehmer bei dem Test Schmerzen angibt, auf der betroffenen Seite weniger Kraft entwickelt als auf der nicht-betroffenen Seite und/oder der Untersucher palpiert eine Hypermobilität der langen Bicepssehne im sulcus intertubercularis humeri der betroffenen Seite. In einer anderen eingeschlossenen Studie können sich die Forscher darauf geeinigt haben, starke Schmerzen, die Unmöglichkeit den betroffenen Arm gegen den Untersucherwiderstand zu bewegen und/oder ein sehr deutliches palpierbares Hüpfen der langen Bizepssehne als positiven diagnostischen Befund zu werten (=hoher Grenzwert). Wenn ein Grenzwert niedrig angesetzt wird, wird der Test sensitiver, wird der Grenzwert hoch angesetzt, wird der Test spezifischer (vgl. 3, S. 3). Mit einer erhöhten Sensitivität steigt die Wahrscheinlichkeit Falsch-Positiver Befunde (vgl. 4, S. 103).

Zusammenfassung: Die in den Primärstudien gewählten Grenzwerte für die diagnostischen Schulterteste beeinflussen die Sensitivität, Spezifität, Falsch-Positiv und Falsch-Negativ Raten und damit die DORs der untersuchten Schulterteste.

Die eingeschlossenen Studien wurden mit dem Quadas-Tool auf mögliche Quellen für Verzerrungen bewertet.

Viefelder-Tafeln wurden konstruiert und die Sensitivität, Spezifität. Genauigkeit und Likelihoodratios (LR +/-) und DORs wurden gepoolt, statistisch zusammengefasst.

Teste mit ähnlichen biomechanischen Grundannahmen wurden ebenfalls gepoolt, um die diagnostische Validität zu prüfen. Dies war nur für die Teste der SLAP-Läsionen möglich.

Ergebnisse: Es wurden 20 Artikel für das Review ausgesucht. Davon konnten elf in die Metaanalyse einbezogen werden. In der Metaanalyse konnten Teste für drei Schulterdiagnosen (zehn für SLAP, zwei subacromiales Impingement und einer für Rotatorenmanschettenruptur).

Gepoolte Ergebnisse für die SLAP-Diagnose:

  • Compression-Rotation Test DOR 6.36 (95%CI: 1.41 – 28.59) Spezifität 0.89 Sensitivität 0.43

Subakromiales Impingement-Diagnose:

  • Hawkins Test DOR 2.86 (95%CI: 1.14 – 7.71) Spezifität 0.67 Sensitivität 0.58

Rotatorenmanschettenruptur-Diagnose:

  • Supraspinatus Test DOR 9.24 (95%CI: 1.99 – 42.84) Spezifität 0.77 Sensitivität 0.74

Diagnostische Validität der Teste

  • Nur die SLAP-Teste konnten gepoolt werden, weil sie auf ähnlichen biomechanischen Überlegungen beruhen. DOR 1.38 (95%CI: 1.13 – 1.69). Die Heterogenität (Unterschiedlichkeit) der gepoolten DORs wurde mittels Chi² Test geprüft und war nicht signifikant (Chi² = 26.6 [d.f. = 19]; p = 0.12) der I² Test auf Heterogenität ergab 28.5% ( zu Heterogenität in Metanalysen ).

Diskussion: Die Forscher stellen fest, dass auch in dieser Metananlyse kein Schultertest mit überlegener diagnostischer Validität gefunden werden konnte. Außer den schon genannte Testen zeigt der Yergason Test für SLAP-Läsionen eine ähnliche positive Likelihoodratio wie in einer früheren Metanalyse LR+ 2.50 , in der früheren Studie LR+ 2.29 ( Walton, Sadi 2008 ).

Die gepoolten Ergebnisse für einzelne Schulterteste erzielten alle LR+ im Bereich von 2-5. Die Autoren bezeichnen dieses Ergebnis als gering, mit einem Hinweis auf folgenden Artikel  Jaeschke, Gyatt, Sackett 2002 .

Die Autoren bemerken, dass für einige Schulterpathologien (z.B. adhesive Kapsulitis, multidirektionale Instabilität) bisher Goldstandardteste fehlen, was die Vergleichbarkeit der Studien mit verschiednen Designs erschwert. Die Autoren empfehlen randomisierte Studien für diagnostische Subgruppen, um den Vergleich verschiedener Diagnosestrategien direkt an reduzierten Schmerzleveln oder Funktionsskalen abbilden zu können.

Nadja Thöner

Literaturverzeichnis

(1) Gismervik, S.O. Drogset, J.O. Granviken, F. Ro, M. Leivseth, G.  Physical examination tests of the shoulder: a systematic review and meta-analysis of  diagnostic test performance. BMC Musculoskeletal Disorders. 2017; 18:41. Link , letzter Zugang am 23.03.17.

(2) Raum, E. Perleth, M. Methoden der Metaanalyse von diagnostischen Genauigkeitsstudien. Informationssystem Health Technology Assessment (HTA) in der Bundesrepublik Deutschland 2002. Link , letzter Zugang am 23.03.17.

(3) Irwig,I. Macaskill, P. Glasziou, P. Fahey, M. Meta-Analytic Methods for Diagnositc Test Accuracy. J Clin Epidemiol.1995; 48: 119-130. Link , letzter Zugang am 23.03.17.

(4) Giegerenzer,G. Das Einmaleins der Skepsis. Über den richtigen Umgang mit Zahlen und Risiken. 5.Auflage. Berlin: BvT Berliner Taschenbuch Verlag; 2009.

Advertisements

Kommentar verfassen

Bitte logge dich mit einer dieser Methoden ein, um deinen Kommentar zu veröffentlichen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s