28 agosto 2008

Diseño de experimentos: ¿Cuántos individuos necesitamos?

La pregunta del título puede parecer irrelevante para aquel que no se dedica a la investigación pero sin embargo puede ser de gran ayuda para evaluar las conclusiones de una investigación o incluso de aseveraciones que se hacen en la vida diaria. Ahí va algún ejemplo: ¿Tomarías una pastilla que ha sido probada (aunque ha mostrado eficacia) en tan sólo una persona?¿Probarías una pastilla que ha sido eficaz en un 25% de 1500 personas?¿Confiarías en alguien que dice poder curarte pero sin aportar datos sobre el número de pacientes tratados y la eficacia del tratamiento? Estas preguntas no son fáciles de responder porque en función de la técnica que usemos, de los individuos experimentales con los que estemos trabajando y del coste que ello suponga el número de individuos será variable en una investigación.
Empecemos por ejemplo, con la antropología o la paleontología y el estudio de huesos. En este caso nos encontramos con un problema de escasez de muestras. A veces los resultados que se presentan en este campo proceden de tan sólo un ejemplar. Algunas de las descripciones de las distintas especies de dinosaurios que se han hecho, se han realizado a partir de un solo ejemplar y en la mayoría de los casos ni siquiera se tiene el esqueleto completo. Pero, ¿sería razonable pedir a los antropólogos que dispusieran de más esqueletos antes de dar por válidos sus datos? En condiciones ideales se les deberían pedir más individuos, pero la realidad es que eso no depende de ellos (o, al menos, sólo hasta cierto punto). Y además a veces no es necesario disponer de un esqueleto completo. Teniendo una sola de las mitades podríamos deducir más o menos fácilmente cómo es el otro.
Otra área en las que a veces sólo se dispone de un número limitado de individuos es la medicina en el caso de las llamadas enfermedades raras (aquellas que se dan en un porcentaje muy bajo de la población) o en el caso de tratamiento de estas enfermedades. ¿Debemos confiar en trabajos basados en un solo individuo? Seguramente no, pero a falta de más datos, es lo que hay. Para solventar este problema se emplearon los metaanálisis, que, como su nombre indica, son análisis estadísticos que incluyen varios trabajos que tratan el mismo tema, reuniendo todos esos datos como si hubiesen formado parte de un solo diseño experimental. Estos análisis pueden darnos una mejor idea de conjunto del tratamiento evaluado.

En la investigación biológica el número de individuos de los que se compone una muestra es también variable.
A veces depende de la especie animal que empleemos: por ejemplo, los trabajos con monos, sobre todo si requieren cirugía, no pasan de los 4 ó 5 individuos. Cuando el individuo experimental es una rata el número ya puede llegar hasta las 9 ó 10 por grupo experimental y si hablamos de moscas en estudios de genética los números se pueden disparar hasta las varias decenas o los centenares por grupo experimental. Y, por supuesto, en los casos donde no se trabaja con animales o éstos son microscópicos (ej: contaje de neuronas, bacterias o edafofauna) el número de individuos puede alcanzar los millares.
En otras ocasiones el número depende de lo controlables que sean las variables con las que trabajamos. En el laboratorio habitualmente se requieren muchos menos individuos que cuando se trabaja en el campo, ya que los animales en el laboratorio tienen condiciones mucho más parecidas entre sí que los que se encuentran en el campo, incluso aunque permanezcan a la misma especie o sean consanguíneos.
El coste del equipamiento o incluso el de los animales empleados también puede condicionar el número de individuos de la muestra. Pensemos, por ejemplo, en el nuevo acelerador de partículas de Suiza y en lo costosos que pueden ser los experimentos que allí se van a realizar.
Pero generalmente el número de individuos a emplear suele venir dado por el análisis estadístico que se vaya a emplear para analizar los datos, algo que debe seleccionarse a priori, aunque hay quien no respeta esta condición y emplea a posteriori el análisis estadístico que más le conviene. Por suerte no suele ser esa la práctica habitual.
Y, por último existen áreas donde los experimentos pueden repetirse más o menos de forma ilimitada, como es el caso de los modelos computacionales.

Por tanto, el número de individuos empleado puede ser muy importante para analizar los resultados y las conclusiones que se extraen de los trabajos científicos (en ocasiones algunos científicos extraen conclusiones muy importantes de muy pocos datos), así como de las aseveraciones de los gurús de las medicinas alternativas que aseguran curar enfermedades incurables con tan sólo el poder de sus manos o unas hierbitas mágicas aportando sólo el dato de las personas curadas (que suele ser testimonial).

10 comentarios:

Sophie dijo...

Excelente artículo :) Quizá te ha faltado poner el ejemplo de las mujeres embarazadas, porque no es muy ético experimentar con ellas pero apenas disponemos de fármacos para tratarlas cuando les surge un simple resfriado, por ejemplo, ya que el riesgo de dañar al feto es mayor que el riesgo de que la madre empeore.
Con las estadísticas y la epidemiología se juega mucho a la hora de presentar los resultados de un ensayo. Presentan porcentajes cuando es interesante conocer porcentajes y cantidad total, o cantidades totales sin los porcentajes...

biocomplex dijo...

Hola quizás este enlace interese.

¿cuánta ciencia falsa circulante es admisible?

Un saludo.

Brainy dijo...

sophie: gracias. Lo de las mujeres embarazadas es cierto. También existe ese mismo problema en los trabajos con niños, donde los problemas éticos se agudizan. En cuanto a cómo se proporcionan los datos sin duda es con lo que continuamente se juega, tanto en ciencia, como en política o economía. Hay que estar alerta.

biocomplex: muchas gracias por el enlace. Me parece muy interesante. Lo he estado leyendo y coincido, aunque hasta cierto punto con él. Estoy pensando si dedicarle algún apunte porque creo que puede dar para discutir sobre él.

Un saludo a los dos.

Parasite dijo...

Sobre esto ya hemos discutido muchas ocasiones entre nosotros. Es cierto que la imposibilidad de alcanzar tamaños muestrales elevados en ciertas ramas hace que se basen en pocos individuos, pero aunque en cierto modo es admisible, también es peligroso y hace que todo esté atado con alfileres. Me explico, el problema de describir especies fósiles en base a un o unos pocos individuos hace que podamos estar tomando individuos "anormales" como modelo y con ello, describir especies nuevas donde sólo hay variabilidad. En este punto también habría que decir que las descripciones de especies típicas, basadas en un ejemplar modelo, es en mi opinión, un error, pues las especies son un continuo de cambio (es una separación categórica que nosotros marcamos para manejar más facilmente). Es lógico que se minimicen al máximos los ejemplares que se necesiten matar, etc. Máxime en condiciones de laboratorio, donde se supone que se controlan "todas" las variables y se modifica uno (unos pocos) factores. El problema de ello es que cuando miramos eso en condiciones naturales no siempre encontramos los mismos efectos, porque pueden ser efectos sutiles que para detectarlos necesitamos de altos tamaños muestrales para disolver el ruido de los factores que afectan en el medio natural. Por eso, el tamaño muestral utilizado en el estudio es de vital importancia para "creerte" los resultados.

Otra cosa son los metanálisis. Yo aunque soy partícipe de ellos, también pienso que tienen mejor fama (y se publican demasiado bien) que los trabajos individuales. Es cierto que la metodología que emplean estos análisis sirve para mitigar posibles efectos como la dirección predilecta de los resultados publicados,... pero estos análisis pueden adolecer de estos problemas. Del mismo modo, para su realización se necesitan estudios que empleen técnicas comparables (lo cual, no siempre es del todo real y posible), necesitan estadísticos no siempre disponibles en los trabajos,... y eso también les puede afectar. Es por eso que aunque sean útiles, sus conclusiones tampoco tienen que considerarse como definitivas.

Un abrazo

Brainy dijo...

Es porque hemos discutido esto alguna vez por lo que he decidido escribir sobre ello.
Llevas razón en cuanto a los restos fósiles. No sabemos a veces si los individuos que hemos obtenido eran "normales" o no. Nos fiamos de la estadística, pero a veces podemos estar ante casos "extraños" y darlos por normales.

Y, por supuesto, coincido contigo en lo de los metaanálisis. Yo nunca he sido demasiado amigo de ellos pero los he incorporado al apunte porque, bien diseñados pueden ser útiles. El problema es que mucha gente cree que los metaanálisis son sacos sin fondo donde se pueden echar todos los trabajos sobre el mismo tema sin tener encuenta el resto de variables de cada uno de los trabajos, el número de animales o las técnicas empleadas. A veces se emplean con demasiada alegría y, por supuesto, nunca son concluyentes pero pueden darnos una idea de por dónde van los tiros.

Héctor dijo...

Interesante apunte sobre metodología. Es el primero que veo en un blog sobre el tema.

En psicología se suelen emplear con mucha frecuencia un mínimo de 30 personas por grupo a analizar, para poder usar pruebas estadísticas paramétricas.

Aunque lo ideal sería usar un tamaño muestral en función de unas fórmulas matemáticas dadas, que te facilitan conocer el tamaño muestral necesario en función del error con el que quieres trabajar.

Lo ideal es trabajar con un error mínimo aceptable. Claro que eso suele necesitar de una muestra bastante más numerosa, en muchas ocasiones puede que más de 100 sujetos experimentales.

En la práctica se hacen muchas pruebas como ya digo con grupos de 30, que luego otro investigador repite en otro lugar...

Por supuesto que muchas veces no se puede trabajar con un mínimo de sujetos. Un ejemplo serían los estudios de caso único...

Un saludo ;)

Brainy dijo...

Hola Héctor:

El tema no se fácil. Como tu dices, lo ideal es saber qué test estadístico se va a usar y cuál es por tanto el tamaño muestral necesario para contar con unos resultados fiables. Pero eso no siempre es tan fácil. Por ejemplo, cuando comienzas estudiando algo que nunca se ha estudiado no sabes qué dispersión pueden tener los datos y eso puede condicionar mucho los resultados, y eso depende mucho de lo controlables que sean las variables. En el laboratorio todo eso es más fácil y por eso se requieren menos sujetos pero en el campo el número de animales necesario se dispara. E incluso en algunos experimentos dde psicología se necesitan a veces incluso miles de sujetos. Un ejemplo son los resultados obtenidos por Marc Hauser sobre la moral, que los consiguió a través de un cuestionario en Internet. También Wiseman, el de Rarología ha hecho alguno por el estilo, por ejemplo para ver si la gente que considera que tiene buena suerte ha nacido en alguna época determinada del año (llegó a contar con 40000 individuos de muestra). Por cierto, me estoy leyendo el libro (lo he conseguido en Cambridge por 8 libras) y me está gustando bastante. Si puedes léelo.

Un saludo. Lo de la magia está en marcha.

Héctor dijo...

Ok, tomo nota.

Espero ese post sobre la magia...

Un saludo ;)

Pearl strands dijo...

Good

jorge dijo...

Ecxelente articulo y muy claro son cosas que la verdad ignoraba pero para mi son muy interesantes gracias y me gustaria decirles que cuando uno tiene un problema como disfuncion erectil no puede tener una buena concentracion por la depresion que causa peo mi solucon es Buy Generic Viagra y ahora me siento mejor.