El mundo de la educación canina ha venido creciendo con fuerza en los últimos años, tenemos cada vez más conciencia del perro como especie, sus necesidades, su forma de aprender y cómo se vinculan con nosotros. Esto ha llevado que muchos científicos estudien tanto el comportamiento como el bienestar canino, encontrándose infinidad de publicaciones sobre estos temas que, como toda ciencia, tiene evidencia a favor y en contra sobre diferentes tópicos. Es por esto que se hace de importancia aprender a leer de forma crítica los artículos científicos. En una publicación anterior había mencionado sobre la significancia estadística y la relevancia clínica.
Hoy tomaré un artículo de Ana Vieira de Castro y colaboradores (2020) titulado "Does training method matter? Evidence for the negative impact of aversive-based methods on companion dog welfare" (¿Importa el método de adiestramiento? Pruebas del impacto negativo de los métodos aversivos en el bienestar de los perros de compañía) publicado en el Journal Plus One en diciembre 2020 y que puedes revisar en este link.
Tenemos que agradecer a los autores que hicieron pública toda la data cruda del artículo, lo que me permitió descargar los datos y correr otros análisis estadísticos no reportados en el estudio original.
En primer lugar nos topamos con la declaración de financiamiento, en donde se señala que el estudio fue financiado por la Fundação Portuguesa para a Ciência e Tecnologia y la Universities Federation for Animal Welfare, declarando que los financiadores no participan en el diseño del estudio, recolección y análisis de datos y la preparación del manuscrito. No obstante, conocemos del intrusismo de los financiadores de los estudios, de los paneles de ética o de las posiciones políticas de las academia. Will Atherton quien, como adiestrador balanceado, empezó una titulación de Maestría en Comportamiento y Adiestramiento Aplicado a los Animales en el 2020, con el fin de estudiar académicamente el efecto de las herramientas aversivas en la modificación de conducta en los perros y esperando poder optar por un PhD en el área.
Se encontró que para poder conducir un experimento debería presentarlo primero ante un panel para ser aprobado, se presentó con el título de su estudio: eficacia del collar de pinchos en el adiestramiento y modificación de conducta basados en el condicionamiento operante, inmediatamente le dijeron que no era viable, iba en contra de la ética usar un castigo físico con un animal, no obstante, más allá de que la ética es correcta o no, objetivamente no le permitían probar académicamente su planteamiento.
El mismo Will sugiere que aquellos que ondulan un paper académico y científico, lo hacen porque los programas de Master y PhD no permitirán el estudio experimental controlado de herramientas para adiestramiento, por lo que, en esencia, tienen un sesgo hacia el estudio del adiestramiento basado en recompensas. Puedes ver la entrevista completa de Atherton aquí.
Siguiendo con el estudio de Castro, el objetivo de su investigación se centró en realizar una evaluación exhaustiva de los efectos de los diferentes métodos de adiestramiento en el bienestar de los perros de compañía, tanto dentro como fuera del contexto del adiestramiento. Para esto, se propuso realizar una evaluación objetiva de los métodos de adiestramiento y usando medidas objetivas de bienestar (datos conductuales y fisiológicos y una tarea de sesgo cognitivo).
Los autores señalan que es una investigación cuasi-experimental por lo que se topa con las limitaciones derivadas de los efectos de la no asignación aleatoria de los sujetos a los grupos, el sesgo en la selección de los grupos y el no poder compensar los factores "no observables" que pudieran influir en los resultados. Por lo tanto, lo revisaremos como un estudio que no propone una relación causal sino una asociación entre variables, bajo el supuesto de la existencia de multiplicidad de variables no observadas que pudieran afectar los resultados, tal como lo mencionan los mismos autores al decir: "no podemos inferir una verdadera relación causal entre los métodos de adiestramiento y el bienestar de los perros".
Con respecto a la selección y creación de los grupos encontramos que las escuelas participantes pertenecían a la Región Metropolitana de Oporto, Portugal.
Sin embargo las escuelan tenían diferentes ubicaciones y estructura de las clases, algunas daban clases en zonas rurales, otras en zonas urbanas, las clases podrían ser en interiores o exteriores, podrían ser individual o grupales en sesiones de 15 a 60 minutos, variando la frecuencia, hora del día y número de sesiones a la semana. En lo único que mostraron homogéneas, además de la ciudad de locación, es que eran clases dictadas en el contexto de obediencia (sentado, acostado, quieto, venir al llamado y caminar sin tirar de la correa). Ya aquí nos encontramos con multiplicidad de variables no medidas que pudieron haber afectado los resultados, lo que me lleva a construir preguntas cómo:
¿Los resultados pudieron haber sido influenciados por el número de sesiones a la semana. Donde, las escuelas con más clases a la semana según su metodología arrojaron mayores niveles de estrés en los perros que aquellas con una clase semanal?
¿Afecta la zona de clases (rural/urbano) en el estrés al que es sometido el perro en adiestramiento?
¿Afecta si las clases son en interiores en recintos cerrados o en exteriores en plazas o parques?.
Después de una detallada observación y clasificación de las consecuencias según los parámetros del condicionamiento operante, las escuelas quedaron asignadas arbitrariamente en tres grupos: basado en aversivos, mixtos y grupo recompensa.
A continuación una tabla que señala la proporción del uso de técnicas aversivas sobre el total de técnicas operante. En estricto rigor fue (CP+RN / CP+CN+RP+RN).
Ahora, sin entrar siquiera al resto del estudio aquí nos podemos detener a analizar las características de los grupos. El promedio de los aversivos usados para el grupo Aversivo es de 0.80, eso significa que el 80% de las consecuencias eran aversivas en un contexto de obediencia. Ocho de cada diez consecuencias eran un castigo positivo o un refuerzo negativo. Hoy día, con todo lo que sabemos, es asombroso que existan escuelas que el 80% del tiempo están trabajando con aversivos al momento de enseñar ejercicios como el sentado o el llamado.
Llama la atención, dada toda la minuciosidad con la que los autores describen los procedimientos e instrumentos de medición, desde los modelos de las cámaras usadas, pasando por los detalles de la recolección de muestras de saliva y la temperatura de la caja de transporte, hasta los gramos de peso de las salchichas usadas en el experimento, que no se expliquen con detalle en que consistían los métodos aversivos. No hay mención de la marca o modelo de los collares, de la experiencia del adiestrador que los usó, el tiempo que fue usado, si pasaron o no por una etapa de precondicionamiento de la herramientas, timing del uso y la intensidad en que fueron usados. Esto ya lo había señalado Tyler Muto en el 2017, en una carta que dirigió a los concejales de Toronto y su alcalde, en calidad de presidente de la IACP (Asociación Internacional de Profesionales Caninos) con respecto a la prohibición de collares de ahorque y de pinchos
En el estudio que revisamos, se agrupó todo en un gran saco llamado "técnicas aversivas". Sin embargo, aquellos que hemos experimentado con collares de pinchos y collares electrónicos sabemos la gran diferencia entre un Herm Sprenger Prong Collar y un collar de pinchos económico encontrado en un supermercado, así como un collar electrónico Dogtra o Petsafe de 100 a 127 grados de estimulación versus un collar electrónico genérico de 5 a 7 niveles de estimulación.
Con todo lo anterior, no es posible evaluar en este estudio si el impacto de la calidad de las herramientas utilizadas, la intensidad de uso, tiempo de uso, precondicionamiento o experiencia del adiestrador influyeron en los resultados.
Con respecto al grupo Mixto, encontramos una amplitud de uso de técnicas aversivas, que van desde un 9% de las consecuencias operantes totales de una sesión hasta el 58% de las consecuencias totales de una sesión. Asimismo, partimos de la idea de que las cosas no son blanco y negro en adiestramiento, sino que hay un gran matiz de grises que considerar, bajo está lógica podríamos considerar a la escuela C menos aversiva que la F, que a su vez es menos aversiva que la A. Por lo que es necesario contemplar, no sólo la presencia/ausencia de las técnicas aversivas, sino la proporción del uso de las mismas. Los mismos autores lo señalan en la discusión de resultados al exponer:
"En particular, encontramos que cuanto mayor es la proporción de estímulos aversivos utilizados en el adiestramiento, mayor es el impacto en el bienestar de los perros (tanto dentro como fuera del contexto de adiestramiento). Este resultado está en consonancia con las conclusiones de un estudio anterior, que demostró que una mayor frecuencia de castigos se correlacionaba con mayores puntuaciones de ansiedad y miedo (Arhant, 2010 cp Castro 2020)".
Por lo que hace mención a un fenómeno que queda de nuevo resaltado en la conclusión final al exponer:
"Nuestro estudio señala que el bienestar de los perros de compañía adiestrados con métodos basados en la aversión está en peligro, especialmente si se utilizan en altas proporciones".
Vale la pena mencionar que los autores ponen el énfasis en la proporción de uso y no en la técnica per se, ya que he visto que se usa este estudio para criticar las herramientas de adiestramiento a pesar de no ser ese el objeto del estudio de Castro.
Sin embargo, ¿Cómo midieron bienestar animal?
Al revisar el estudio se definieron tres variables para medir bienestar animal:
1. La primera variable hace referencia a los niveles de cortisol en saliva, bajo la noción de ser un indicador fisiológico de estrés físico o emocional. Sin embargo, el uso del cortisol ha sido poco confiable para medir el estrés de los perros ante estímulos aversivos, en tanto podría haber aumento del cortisol por el estrés del ejercicio físico (Ando, 2016) o por excitabilidad. Incluso es posible encontrar la evidencia contradictoria, Steiss (2007) evaluó los niveles de cortisol en un grupo perros que usaban collar electrónico antiladrido, otros con collar antiladrido de spray de limón y un tercer grupo con un collar control que no emitía estímulos, encontró que no hay diferencias estadísticas en los niveles de cortisol en los tres grupos. Muchos autores consideran al cortisol como indicador de bienestar canino poco confiable.
2. El lenguaje no verbal de los perros. Para esto, descargué la data cruda que los autores colgaron en la investigación y, para estimar la relevancia clínica, calculé un promedio de los comportamientos clave a los cuales los autores describen con significancia estadística. Los autores mencionan:
"Durante la evaluación del bienestar en las sesiones de adiestramiento, se observó a los perros del Grupo Aversivo con más frecuencia en estados de comportamiento bajos que los perros del Grupo Recompensa."
Sin embargo, al comparar los promedios, si bien pueden arrojar diferencias estadísticamente significativas encontramos lo siguiente:
Con estos datos me preguntaría si es relevante en la práctica este hallazgo. No tenemos a disposición el instrumento de medición, pero al ver otras variables del mismo instrumento llegando a valores como 55, podemos pensar que la magnitud de 0.2 que vemos en esta tabla podría caer en hallazgos que son estadísticamente significativos pero que carecen de relevancia clínica.
"A los perros tanto del Grupo Aversivo como del Grupo Mixto se les observó con más frecuencia en estados de comportamiento tensos y con más frecuencia jadeando que los perros del Grupo Recompensa."
Con el jadeo encontramos algo similar, pareciera que la significancia estadística está presente, pero considerar que una diferencia de 1 jadeo por sesión como indicador de bienestar animal podría carecer de relevancia clínica. Dejé fuera de la tabla los datos de comportamientos tensos porque repetían el mismo patrón.
Sin embargo, con el comportamiento de Lamida de Labios, no sólo se encontró diferencia significativa estadística sino que impresiona la magnitud de la diferencia, lo que sugiere una relevancia clínica a tener en cuenta.
Podemos ver como la frecuencia de Lamida de Labios es mucho más alta en el grupo Aversivo, siendo menor en el Grupo Mixto y más bajo en el grupo Recompensa. Este comportamiento está asociado a situaciones sociales estresantes en perros. Por lo que podría pensarse que el estrés social encontrado estaría asociado con la frecuencia del uso de técnicas aversivas.
Al observar la posible poco relevancia clínica de los otros comportamientos y la poca confiabilidad del cortisol como indicador de estrés, podríamos pensar que estamos en presencia de estrés agudo por la técnica más que un tema de bienestar animal a largo plazo. Es allí donde entramos en la tercera variable.
3. El tiempo de latencia en una tarea de sesgo cognitivo y la cantidad de ensayos para aprender la tarea. Variable que usaron para medir el bienestar animal tiempo después de las sesiones de adiestramiento.
Los autores plantean: "Los perros del Grupo Recompensa mostraron una tendencia a aprender la tarea de sesgo cognitivo más rápidamente que los perros del Grupo Mixto". Argumento que he visto es usado por colegas para sustentar que la aplicación de técnicas aversivas inhibe el aprendizaje. Sin embargo al revisar los promedios de ensayos por grupos, el valor mínimo (el perro que aprendió más rápido) y el valor máximo (el perro que demoró más en aprender), encontramos lo siguiente:
Aquí me planteo la siguiente interrogante: Que en promedio, un grupo demore 3 o 4 ensayos más en aprender una tarea, ¿sugiere una "inhibición del aprendizaje"?. ¿Podrían deberse la diferencia por otras variables la edad del perro y la raza, por ejemplo, que conocemos que influyen en la capacidad de aprendizaje? (Coren, 2006,. Piotti 2018).
Finalmente, los autores parten de la hipótesis que el afecto ejerce una gran influencia en la toma de decisiones ante la ambigüedad. Plantean que la elección en la tarea de sesgo cognitivo depende de dos componentes diferentes del proceso de toma de decisiones: la probabilidad percibida y la valoración percibida de las recompensas (y los castigos).
Los autores continúan en la discusión: "Un individuo puede ser menos propenso a dar una respuesta menos "arriesgada" o más "pesimista" si considera que la recompensa es menos probable (o el castigo más probable) y/o si considera que la recompensa es menos valiosa (o el castigo más aversivo).
Por lo tanto, la explicación más probable que plantean de los resultados del estudio es que los perros del Grupo Aversivo consideraron la recompensa de comida menos probable y también mostraron una mayor valoración de la pérdida de la recompensa en relación con la ganancia. En general, indican que los perros del Grupo Aversivo estaban en un estado afectivo menos positivo que los del Grupo Recompensa".
Sin embargo, cabe la pregunta ¿Está esto midiendo realmente Bienestar Animal? ¿El que un perro demore unos segundos más en resolver una tarea es sugerencia de que no se encuentra en un estado de bienestar?.
Los autores plantean que un perro es menos propenso a responder cuando considera que la probabilidad de recompensa es baja o que la probabilidad de castigo es alta, no obstante, ¿no es así la realidad?. En términos más simples, los autores plantean que si el perro sospechaba que ir a un tazón podría no traerle una recompensa rica y cuantiosa, tardaba más en acercarse al tazón. ¿Es que acaso se espera que los perros "deberían" hacer todo de manera impulsiva sin que consideren las consecuencias (positivas o negativas) de su comportamiento?
Con respecto a la relevancia clínica, los autores nos comparten una gráfica donde podemos ver los tiempos de respuesta promedio de cada grupo. Dado que la tarea del sesgo cognitivo se encuentra estandarizada y que los autores citan al estudio de Mendl (2010) como referencia, agregué los hallazgos de Mendl a la gráfica. Este autor estudió la relación entre la intensidad de la ansiedad por separación y el tiempo de respuesta de la tarea de sesgo cognitivo, encontrando que a mayor gravedad del cuadro clínico, mayores latencias de respuestas en la tarea. Los valores promedios aproximados en su grupo de estudio fueron añadidos a la tabla del estudio que analizamos, encontrando:
Bien podríamos entrar a estudiar la relevancia clínica, la mayor diferencia entre el grupo Aversivo y Recompensa en la tarea es de 2,6 segundos. Podríamos preguntar ¿son suficiente 2,6 segundos de retraso en una tarea para señalar un empobrecimiento del bienestar animal?, de ser así ¿los perros con ansiedad por separación se encuentran mucho peor que los perros que el 90% de las veces reciben consecuencias aversivas al adiestrar en obediencia?
Todo lo anterior sugiere que debemos leer los artículos científico a la luz de la significancia estadística y la relevancia clínica, tomando cada dato y cada conclusión con extremo cuidado. La academia no está exenta de sesgos políticos y socio-económicos. Asimismo, dentro del cuidado que hay que tener en el uso de los papers científicos es posible rescatas las palabras de los autores:
"Además, nuestros resultados sugieren que la proporción de estímulos aversivos utilizados en el adiestramiento juega un papel más importante en los niveles de estrés de los perros que las herramientas específicas de adiestramiento utilizadas. Por ejemplo, una escuela del Grupo Mixto utilizó collares de pinchos y electrónicos, mientras que otra escuela del Grupo Aversivo sólo utilizó collares de ahorque durante el adiestramiento. Aunque las herramientas utilizadas por la primera escuela pueden percibirse como más aversivas, la frecuencia de las conductas de estrés fue mayor en los perros entrenados en la segunda escuela".
Dejando así sobre la mesa que: es la proporción de lo estímulos aversivos la variable más importante en el estrés y no la herramienta específica. No es la herramienta. Nunca ha sido la herramienta. Sino cómo y con qué frecuencia se usa.
Dadas mis preguntas e inquietudes, consideré necesario escribirle a la autora de la investigación con algunas preguntas, en pro de iniciar un intercambio de ideas. A la fecha aún espero respuesta, pero seguramente escribiré sobre más adelante.
Espero este artículo pueda propiciar una discusión constructiva en los círculos de educación canina sobre el estado actual de las ciencias en el área.
Referencias
Ando I., Karasawa K., Matsuda H., Tanaka A. (2016). Changes ni serum NGF levels after the excercise load in dogs: a pilot study. J Vet Med Sci. 78(11): 1709-1712. DOI: 10.1292/jvms.16-0258
Coren S. (2006). The Intelligence of Dogs. Pocket Books; New Edition Edition.
Guilherme-Fernandes J., Olsson I., Vieira de Castro A. (2017). Do aversive-based training methods actually compromise dog welfare?: A literature review. Appl Anim Behav Sci. 2017; 196, 1–12.
Mendl M., Brooks J., Basse c., Burman O., Paul E., Blackwell E., Casey R.(2010) Dogs showing separation-related behaviour exhibit a ‘pessimistic’ cognitive bias,
Current Biology,Volume 20, Issue 19,2010,Pages R839-R840, https://doi.org/10.1016/j.cub.2010.08.030.
Pawluski J, Jego P., Henry S., Bruchet A., Palme R., Coste C., Hausberger M. (2017). Low plasma cortisol and fecal cortisol metabolite measures as indicators of compromised welfare in domestic horses (Equus caballus). PLOS ONE, 2017; 12 (9): e0182257 DOI: 10.1371/journal.pone.0182257
Piotti, P., Szabó, D., Bognár, Z. et al (2018) . Effect of age on discrimination learning, reversal learning, and cognitive bias in family dogs. Learn Behav. 46, 537–553. https://doi.org/10.3758/s13420-018-0357-7
Salgirli, Y., Schalke E., Hackbarth H. (2012). Comparison of learning effects and stress between 3 different training methods (electronic training collar, pinch collar and quitting signal) in Belgian Malinois Police Dogs. Rev. Méd. Vét. 163, 530–535. DOI:http://dx.doi.org/10.1016/j.jveb.2009.05.014
Steiss J., Schaffer C., Ahmad H., Voith V. (2007). Evaluation of plasma cortisol levels and behavior in dogs wearing bark control collars, Applied Animal Behaviour Science, Volume 106, Issues 1–3, 2007, Pages 96-106, https://doi.org/10.1016/j.applanim.2006.06.018
Comments