Por:
Francisco Javier Jaramillo Álvarez
Ingeniero de Alimentos, egresado de la Corporación Universitaria Lasallista, Medellín, Colombia
Especialista en estadística, Universidad Nacional de Colombia
Diplomado en Formación en tutoría virtual, OEA.
Docente Institución Universitaria CEIPA.
francisco.jaramillo@ceipa.edu.co
Resumen
Es por todos conocido que la estadística es un socio estratégico para la investigación, pero la experiencia demuestra que en los ejercicios investigativos que se realizan en el área administrativa el manejo estadístico es tomado, muchas veces, superficialmente. Este artículo busca crear un espacio de reflexión al respecto, utilizando como ejemplo algunas investigaciones hechas en nuestra ciudad.
Palabras clave
Rigor estadístico, muestra, inferencia estadística.
AbstractPIt is for us known that stadistic is a strategic partner for investigation, but experiences have shown that during investigation exercises done in the administration area, the stadistic management is many times taken superficially.
This article is looking forward to create a reflexion in this matter, having as an example some investigations done in our city.
Keywords
Statistical rigor, sample, statistical inference.
No es extraño encontrar investigaciones en el área de administración que tienen poco o ningún rigor estadístico. Puede parecer algo de poca relevancia, pero el manejo estadístico de la información constituye una etapa crítica porque si se hace mal se desvirtúa todo el trabajo. Lo que se afirma no es una hipótesis lanzada sin ninguna base; para escribir este artículo fueron evaluados muchos informes de investigaciones apoyadas por instituciones de educación superior de nuestro Departamento.
El autor quería basar su análisis en las publicaciones de informes de investigación hallados en las páginas web de los centros de educación superior. Infortunadamente, pudo comprobarse que la inmensa mayoría de ellos no tienen alojados en sus páginas web estos informes de manera completa.
Este artículo no pretende criticar mordazmente ni descalificar el trabajo de otras personas; su propósito es hacer un llamado de atención a poner más cuidado a este tema.
Si establecemos una comparación entre investigaciones de hace algunos años y las actuales, podremos notar que se ha mejorado en este aspecto; pero aún queda mucho por hacer. En el artículo no se hace alusión a métodos estadísticos complicados, sino únicamente a análisis estadísticos sencillos, y los que se realizan se enfocan desde las diferentes lecturas de la estadística, con el fin de explicar algunos errores típicos que se encuentran en los informes de investigación y que evidencian la falta de claridad estadística cuando se hace el análisis de la información y la formulación de conclusiones, que son momentos que, en todo proyecto, son de gran relevancia para quienes se apoyan en estos resultados.
No se citan nombres propios porque en ningún momento se pretende hacer una denuncia de hechos sino una reflexión.
En este artículo se muestran los casos tomados en una forma textual de los informes de investigación que fueron objetos de consulta y se acompañan del análisis respectivo.
Por ejemplo, un investigador encuesta a cinco gerentes de pymes de Sabaneta y encuentra que cuatro exportan parte de su producción; concluye, entonces, que un 80% de las pymes antioqueñas exportan parte de lo que producen. Eso constituye una situación exagerada y no real, pero todas las que se mencionarán en este artículo de aquí en adelante son verídicas y demostrables.
Es trascendental tener en cuenta que para garantizar la validez de las conclusiones obtenidas en una investigación, la muestra tomada debe ser representativa.
Un informe de investigación consultado revela en su aspecto metodológico lo siguiente: “El público objetivo son personas entre los 18 y 50 años de edad de la zona metropolitana de Medellín”. Luego saca, entre otras, las siguientes conclusiones: “De un total de 50 encuestas realizadas, el 68% de los encuestados da una respuesta positiva a la necesidad de repeler insectos voladores, por consiguiente este producto es viable para lanzarlo al mercado” y “para la elaboración de un producto es importante conocer las características más significativas que el consumidor tiene en cuenta en el momento de la compra. Entre los criterios más importantes se destacan la duración del producto con un 52%, la calidad con un 44% y la marca con un 40%, lo cual demuestra que son las principales variables para triunfar en el mercado”.
Antes de cualquier análisis es conveniente recordar que el nivel de confianza indica qué tan probable es que la estimación efectuada se ajuste al valor real de la característica evaluada en la población y el margen de error es una medida de la imprecisión que se está dispuesto a aceptar (Jaramillo, 2009)
Con un nivel de confianza de 99%, el margen de error es 18.2%; con nivel de confianza de 95%, el margen de error es 13.9%; y con un nivel de confianza de 90%, el margen de error es 11.6%. Eso significa que, por ejemplo, considerando un nivel de confianza de 95% (intermedio), cuando dice que un 40% destaca la marca como un criterio importante de selección, realmente se estaría diciendo que entre un 26% y un 54% de los consumidores afirma esto; eso constituye un rango extremadamente amplio. Igualmente, considerar que es viable lanzar un producto al mercado porque 34 personas manifestaron su agrado, suena como algo poco razonable. De igual forma, sacar una conclusión tan sustancial como la relacionada con las variables básicas para triunfar en el mercado, basándose en una muestra tan reducida, es insensato.
La muestra debe ser representativa, no sólo en cantidad, sino también en calidad. Eso implica que si, por ejemplo, se quiere sacar una conclusión para toda la población colombiana, en la muestra debe haber costeños, paisas, gente de diferentes estratos sociales, hombres, mujeres...
Otro informe acerca de las marcas propias revela: “La investigación tuvo como escenario la ciudad de Medellín. El deseo del investigador es prolongar en otra oportunidad este estudio en otras ciudades como Bogotá y Cali, pero por razones presupuestales y de tiempo, en esta ocasión sólo se hizo para la ciudad de Medellín”.
Al final concluye: “Del total de amas de casa encuestadas, el 85.5% dijo adquirir marcas propias; es decir, un alto porcentaje de ellas se lleva para su hogar por lo menos un producto con marca propia. Esta cifra revela el alto grado de difusión que están teniendo las marcas propias en Colombia”.
El error que se comete en esta situación es muy común; no es conveniente sacar conclusiones sobre la aceptación de marcas propias en todo el país, cuando el muestreo sólo se hizo en una ciudad.
Al respecto, Anderson (2008) escribió lo siguiente:
En las encuestas muestrales es necesario distinguir entre la población objetivo y la población muestreada; la primera es la población sobre la cual se quieren hacer inferencias y la segunda es la población de la que, realmente, se toma la muestra. Las conclusiones que se obtienen sólo son válidas para la población muestral; para permitir ampliar esas conclusiones debe existir una semejanza suficiente entre las dos poblaciones (p.917).
Por razones muy obvias, considero que no es prudente suponer esto en Colombia, dadas las marcadas diferencias entre las idiosincrasias de los habitantes de regiones distintas.
Parecería que muchas veces se confunde investigación con indagación o se considera que la realización de una encuesta es una investigación. No son pocos los informes de investigación consultados que presentan este problema; inclusive, en algunos casos, la “investigación” parece más bien una encuesta adornada con un marco referencial.
“Una estadística no es ciencia. Ese es el gran error de muchas tesis que se presentan a tribunales pretendiendo haber hecho investigación científica por el mero hecho de incorporar un estudio estadístico. Una herramienta matemática como ésta sirve para denotar un estado de las cosas que no tienen en absoluto validez si lo examinamos fuera del estado de ese campo de conocimiento e, incluso, sin la visión que da el transcurso del tiempo” (García, 2002)
Se puede incurrir en mentiras o en verdades a medias por el uso de la estadística. En muchos de los informes consultados se muestran los resultados como una verdad absoluta e irrefutable; como bien lo dice Durango “no hay absolutamente nada que pueda garantizar la veracidad de los resultados de una investigación científica y tecnológica” y “no podemos creer que, como por arte de magia, las matemáticas darán por sí solas veracidad y coherencia a ideas formadas ilógicamente”.
En muchos de los casos indagados, parecería que se intenta establecer una teoría. Por ejemplo, uno de estos informes concluye que “Las marcas propias tienen una relación inversa con respecto al estado de la salud de la economía del país, así: cuando hay recesión se disparan sus ventas y cuando hay bonanza se contraen”, pero resulta que se basa en una muestra de 24 empresas; en las conclusiones habla de porcentajes, cuando un solo elemento representa más del 4%.
En casi ningún caso se incluye ficha técnica; el tamaño de la muestra es siempre revelado, pero no el nivel de confianza, el margen de error ni el tamaño de la población -cuando no puede considerarse infinita-. Igualmente, se encontró que, en no pocas oportunidades, se omite información sobre el procedimiento de muestreo, asunto de suma importancia, así el tamaño de la muestra sea el adecuado; es obvio que si el procedimiento de muestreo es inadecuado, las conclusiones extraídas no son válidas aunque la muestra seleccionada haya permitido trabajar con un margen de error muy bajo.
El hecho de no incluir esos parámetros “podría llevar de forma engañosa al usuario de los resultados a pensar que la estimación puntual es todo lo que se necesita para predecir las características de la población con precisión” (Levine, 2006).
No puede desconocerse la importancia de la investigación cualitativa para la administración, pues “sus ágiles instrumentos permiten indagar en poco tiempo los aspectos más relevantes del problema investigado, con la ventaja adicional de que el investigador puede chequear sobre la marcha la calidad y la validez de la información recolectada y por lo tanto puede revisar y reorientar el proceso en la dirección correcta, si se detectan vacíos o deficiencias en los datos” (Bonilla-Castro, 2005). La misma autora manifiesta con suma razón que “la cuantificación no es la única forma de aproximar el conocimiento”, pero lo que resulta inaceptable es que se saquen conclusiones propias de un estudio cuantitativo cuando se hace una investigación cualitativa.
Sucede también que, aunque se haga un muestreo no probabilístico, se hacen inferencias de características poblacionales.
En ambos casos se puede extractar información muy valiosa, pero no resulta lógico generalizar los resultados; por ejemplo, cuando se entrevista a expertos en un determinado tema no deben extenderse los resultados a una población ajena. Del mismo modo, si se hace un muestreo de conveniencia, no deben extenderse las observaciones a una población diferente; por ejemplo, porque el 25% de los elementos de una muestra de conveniencia hayan mostrado determinada inclinación, no puede considerarse que el 25% de los elementos de la población a la que ellos pertenecen también la muestren; eso es ilógico y no es extraño que se saquen conclusiones de ese estilo.
Cuando se selecciona una muestra mediante muestreo aleatorio simple, todos los elementos de la población deben tener la misma probabilidad de ser elegidos en la muestra. Si el muestreo se hace en forma estratificada, los elementos de la población se dividen en subgrupos, según características definidas por el investigador; posteriormente, se selecciona la muestra de una manera proporcional a lo encontrado en los subgrupos formados, es decir, por ejemplo, que si se quiere seleccionar una muestra donde la población objetivo es Colombia, deben seleccionarse más personas de Medellín (que tiene aproximadamente 2.500.000 habitantes) que de Leticia (que tiene 30.000 habitantes).
Cierta investigación que busca la caracterización del consumidor de los centros comerciales del sur del Valle de Aburrá cita cuatro centros comerciales como objeto de estudio, pero más del 90% de las encuestas se hicieron en dos de los centros, más del 60% de los encuestados tienen entre 18 y 25 años y más del 60% son mujeres. Podría pensarse que se trata de un muestreo estratificado, pero es fácil confirmar que los centros comerciales donde más encuestas se hicieron no son los más visitados; igualmente, no es muy probable que un porcentaje tan alto de los clientes que visitan esos centros comerciales estén en ese rango de edad; finalmente, lo del sexo de los encuestados puede presentar un claro sesgo en los resultados.
No debe olvidarse jamás que toda investigación exige un buen proceso de planeación; por ello es necesario asesorarse de una persona con conocimientos estadísticos desde el inicio de la investigación y no, como suele suceder con frecuencia, cuando ya se han recogido los datos.
Puede suceder en cualquier investigación que, aunque la información recolectada sea adecuada, la interpretación estadística de esa información haga que las conclusiones pierdan total validez.
ANDERSON, D.; SWEENEY, D. y WILLIAMS, T. (2008). Estadística para administración y economía. México: CENGAGE Learning.
BONILLA-CASTRO, Elssy y Penélope Rodríguez Sehk (2005). Más allá del dilema de los métodos, la investigación en ciencias sociales. Bogotá: Grupo editorial Norma.
DURANGO YEPES, Carlos Mario (2008). Mitos sobre la naturaleza de la investigación en administración en Colombia y otros países latinoamericanos. Revista Ciencias Estratégicas. Vol 16 núm. 19, p. 23-32
GARCÍA ABAD, Lito (2002). Errores estadísticos. http://clasica.xornal.com/article.php?sid=20020218142506 Consultado el 3 de mayo de 2010.
JARAMILLO ÁLVAREZ, Francisco (2009). Tamaño apropiado de muestra para obtención de conclusiones válidas en una investigación.