enfermedad, aquellas que no la padecen, pero presentan síntomas similares. Se asume que el problema de salud, puede medirse de forma válida y fiable, mediante un proceso de referencia. O gold standard, y se desea evaluar la utilidad de una nueva prueba.
En términos generales, un test diagnóstico es útil si permite diferenciar dos o más condiciones que de otro modo podrían ser confundidas. En otras palabras, para diferenciar entre distintas enfermedades o condiciones clínicas, así como entre la condición de sano y la de enfermo.
En los estudios sobre tests diagnósticos, al igual que en el análisis crítico de cualquier estudio, el primer paso es evaluar su validez, es decir, cuál es la probabilidad de que exista sesgo por características del diseño. Este aspecto ha sido revisado en artículos anteriores de esta serie.
Una vez definida la validez del estudio, el siguiente paso será analizar la correcta interpretación de los resultados presentados en ellos, ya que es posible que un estudio cumpla con todas las características que aseguren su validez, sin embargo, si los resultados muestran que carece de capacidad de discriminar entre las condiciones de interés, éste no tendrá utilidad.
La estrategia de investigación consiste en aplicar una muestra de sujetos, tanto el criterio de referencia, como la prueba de estudio. El primero permitirá diferenciar los sujetos que padecen la enfermedad, de los que no la padecen, de forma que se podrá evaluar la capacidad de la nueva prueba diagnóstica, para discriminar entre ambos grupos .Los resultados permiten clasificar (8), a los sujetos estudiados en una tabla 2 por 2, a partir de la que se calculan la sensibilidad, la especificidad y otros índices de utilidad.
El área de (9) de investigación en pruebas diagnósticas, es junto con la de innovaciones terapéuticas, una de las áreas con mayor y más rápido desarrollo en la medicina actual. Es posible que éste rápido desarrollo de nuevos procedimientos diagnósticos, no haya tenido un paralelismo en el desarrollo, de las más adecuadas estrategias de evaluación, y en éste sentido si encontramos diferencias destacables, con el proceso previo a la introducción de un fármaco nuevo, sometido a estrictos requisitos legales y a una evaluación formalizada, que generalmente toma la forma de ensayo clínico aleatorizado.
Diversas revisiones de artículos originales que describen la evaluación de pruebas diagnósticas han mostrado, tanto en el ámbito internacional (3,4,5) como en el ámbito nacional, grandes deficiencias en la metodología empleada, lo que aconseja el desarrollo de nuevos estándares que contribuyan a la mejor calidad del área diagnóstica. Distintos grupos editoriales y revisores participaron en la publicación de la guía STARD (Standards for Reporting of Diagnostic Accuracy ‘Normas para el informe de la precisión diagnóstica’)9 en el año 2003, con este objetivo de aumentar la calidad de la publicación de estudios de pruebas diagnósticas, analizar los posibles sesgos de estos estudios y mejorar la aplicabilidad de los nuevos métodos diagnósticos en la práctica clínica. Es importante señalar que tanto esta guía como otras que han surgido en ámbitos distintos al diagnóstico (CONSORT, STROBE, etcétera) no son escalas de calidad, ya que su principal objetivo se centra en la escritura de la investigación de manera clara y transparente para los lectores. Por tanto, la ausencia de cumplimiento de criterios no significa que los errores estén presentes en los estudios, sino que la probabilidad de error no puede determinarse . (10)
Tras la publicación de la guía STARD, hay estudios que han evaluado su impacto en la metodología de los estudios de diagnóstico, ya sea analizando distintos trabajos que evalúan una misma prueba diagnóstica o centrándose en estudios publicados en una misma área de interés. El resultado de estos estudios refleja un bajo cumplimiento de los estándares, lo que remarca la necesidad de extender su uso. Para esto, muchas revistas de ámbito internacional, como Clinical Chemistry, British Medical Journal y JAMA, entre otras, incluyeron en las instrucciones para el autor la recomendación del uso de la guía STARD en los estudios de investigación diagnóstica. Sin embargo, en publicaciones de ámbito nacional, esta guía todavía no se ha incorporado a las instrucciones para los autores, aunque sí se ha traducido en interés.
Los rápidos avances en los métodos diagnósticos implican la necesidad de que los profesionales dispongan de la información correcta sobre sus características y la aplicabilidad en su ámbito de trabajo. Así pues, la investigación sobre pruebas diagnósticas tiene como objetivos estimar la capacidad discriminatoria de una prueba diagnóstica entre enfermos y no enfermos (sensibilidad-especificidad), determinar el rendimiento de la misma (valores predictivos) o evaluar la utilidad y satisfacción de un procedimiento diagnóstico. La utilidad de una prueba diagnóstica depende de su capacidad de producir los mismos resultados cada vez que se aplica en similares condiciones (fiabilidad) y de que sus mediciones reflejen exactamente el fenómeno que se intenta medir (validez o exactitud), pero también de su rendimiento clínico y de su coste.
Si evaluamos nuestra práctica clínica observaremos que a menudo empleamos procedimientos diagnósticos de los que desconocemos estos parámetros. Para conocer esta información debemos recurrir a los estudios de evaluación de pruebas diagnósticas publicados. Sin embargo, en muchos de estos estudios no siempre encontramos información válida, relevante o aplicable a nuestro entorno clínico.
En esencia, realizar el diagnóstico es asignar con razonable incertidumbre (es decir, con razonable probabilidad) un paciente a una clase (o grupo) constituida por sujetos con una enfermedad o entidad nosológica. Por lo tanto, el diagnóstico es el primer paso, sin duda crucial, que nos permite la utilización de otras evidencias en la toma de decisiones sobre el paciente. El diagnóstico no es un fin en sí mismo, sino un instrumento en la toma de decisiones clínicas; de hecho no es preciso tener una seguridad diagnóstica absoluta para adoptar la decisión terapéutica correcta.
El modelo de razonamiento que subyace en un estudio sobre pruebas diagnósticas podría esquematizarse del siguiente modo: existe un fenómeno clínico que puede ser medido de forma fiable y válida por un procedimiento que se llamará diagnóstico o gold standard. En este marco nos planteamos dos tipos de pregunta: ¿hay un segundo procedimiento de medida, que llamaremos test o prueba, que podría medir también este fenómeno, de modo fiable y válido? y ¿ese segundo procedimiento tiene algún tipo de ventaja respecto al primero? Las ventajas del segundo método podrán ser teóricas, es decir, que mejore la validez y precisión del primer