Entrenando murciélagos en el bosque al azar con la matriz de confusión

Cuando se explora el ámbito del Aprendizaje Automático, siempre es bueno tener algunos datos reales e interesantes con los que trabajar. Ahí es donde entran en juego los murciélagos – son animales fascinantes que emiten llamadas ultrasónicas muy particulares que pueden ser grabadas y analizadas con un software de ordenador para tener una idea bastante buena de qué especies son. Cuando se analiza con un espectograma FFT, podemos ver las formas de las llamadas individuales muy claramente.

Nyctalus noctula (murciélago nocturno) Myotis nattereri (murciélago natterero) Plecotus auritus (oreja larga marrón) Pipistrellus pipistrellus (pipistrelo común)

La creación de un clasificador de código abierto para murciélagos también es potencialmente útil para el mundo fuera del aprendizaje automático, ya que no sólo nos permitiría supervisar más fácilmente a los murciélagos, sino también los efectos de los métodos de cultivo modernos en el entorno natural. Los murciélagos se alimentan de polillas y otros insectos voladores nocturnos que han sido diezmados en número. Incluso en las profundidades del campo aquí en el Reino Unido estos insectos son una fracción de la población que solían ser hace 30 años, pero nadie parece haber monitoreado esta disminución.

Así que volviendo a nuestros espectogramas, sería perfectamente razonable lanzar estas imágenes a una red neural convolucional (CNN) y usar una estrategia de reconocimiento de características de la imagen. Pero yo quería explorar las profundidades del misterioso Bosque Aleatorio.

¿Y qué es exactamente un Bosque al azar? Como era de esperar, el bosque está compuesto por árboles, árboles de decisión. Es como jugar un juego de veinte preguntas. Se toman decisiones secuenciales, y cada una de ellas descarta algunas clasificaciones posibles. Si cada juego de veinte preguntas es un árbol, el Bosque al azar (RF) del ejemplo siguiente está compuesto de 4.000 árboles y es como pedirle a 4.000 personas que jueguen el juego por ti. Aplicamos algún tipo de fórmula de promediación para cotejar todas las respuestas y obtener un método para tomar la decisión final que es marcadamente mejor que si lo hubiéramos hecho solos.

Cuando juegas a las veinte preguntas, preguntas sobre los rasgos definitorios de la cosa en cuestión. El lugar obvio para empezar es el punto de la llamada donde la llamada es más fuerte (se muestra en negro en la imagen de la izquierda), lo que nos daría una frecuencia. Así que en el caso del murciélago de orejas marrones, el número sería algo así como 30 kHz. Ni siquiera tenemos que llamarlo de otra manera – los árboles simplemente procesarán a ciegas todos los números de una columna de datos sin necesidad de saber lo que significan en el mundo real. Sin embargo, como seres sensibles, podemos ver los datos si queremos e incluso ver qué características del espectograma eran las más importantes. ¿Quizás la frecuencia de amplitud máxima también es importante? No lo sabemos todavía – dejaremos que los árboles de decisión lo decidan por sí mismos. La línea roja en la imagen de la izquierda muestra la forma distintiva de la llamada de localización de eco de pipistrelle, filtrada por el software para producir una bonita línea delgada de la que ahora podemos derivar valores para cosas como la pendiente ascendente y la inclinación.

Extraer las características relevantes como esta es increíblemente importante. Un científico de datos, junto con un experto en llamadas de murciélagos, miraría ahora toda la gama de llamadas de murciélagos y haría conjeturas educadas sobre qué características merecen ser observadas – ¿quizás la forma en que la llamada se inclina o si comienza con un $0027bang$0027 de amplitud o no? Podrían producir varios cientos de columnas diferentes para el conjunto de datos y podarlas hasta una veintena, descartando todas las que los propios árboles decidan no utilizar mucho.


Traer a los expertos en murciélagos

Después de algunos inicios en falso, finalmente me decidí por este sistema escrito por Jean Marchal, Francois Fabianek y Christopher Scott. Es básicamente un paquete de extracción de características escrito en R que ha sido específicamente dirigido a los llamados de murciélagos y pájaros. Hay un tutorial fácil de seguir que descarga datos de aves y clasifica un solo pájaro y, como alguien que no tiene absolutamente ninguna experiencia previa con R, pude usarlo fácilmente para armar una versión multiclase que clasificó las seis especies de murciélagos que viven cerca de mi casa. Estoy seguro de que hay una manera más elegante de implementar en Random Forest, pero sólo clasifiqué cada especie por separado y luego combiné los resultados. Por favor, siéntase libre de mejorar mi método, pero parece funcionar bien.

El sistema se ejecuta mejor en Rstudio en Windows 10 y todo se instala sin problemas de principio a fin. También lo tengo funcionando en Ubuntu 18, pero sólo desde la línea de comandos usando $0027$ Rscript Train_bats.R$0027 . En realidad nunca terminé el tutorial oficial y encontré la estructura de datos bastante confusa para empezar. Afortunadamente, resultó ser muy simple. Parece que el sistema que he creado es una serie de $0027clasificadores binarios$0027 que escupe una nueva matriz de confusión para cada especie, que está entrenada contra todas las demás especies del directorio $0027data$0027.

La especie que se está investigando es el pipistrel común – c_pip. Durante el entrenamiento automático y el proceso de prueba, 1435 puntos de datos que en realidad $0027no eran c_pip$0027 fueron correctamente pronosticados como $0027no c_pip$0027 … ¡lo cual es bueno! Además, se predijo correctamente que 880 etiquetas que eran realmente c_pip eran c_pip, lo cual también es bueno. Desafortunadamente, 33 de los murciélagos de c_pip fueron incorrectamente predichos como que no eran de esa especie y, peor aún, 28 que no eran c_pip fueron incorrectamente predichos como c_pip – ¡maldita sea! Afortunadamente, los porcentajes de predicciones incorrectas son bastante bajos – 2.2% y 3.1% respectivamente, a pesar de tener sólo 320 MB de datos de murciélagos.

Los resultados pueden mejorarse trabajando con más datos, así que si tienes algún archivo .wav de espectro completo acechando en tus unidades USB para las 17 especies de murciélagos del Reino Unido, ¡por favor envíamelo! Las grabaciones deben ser del orden de 384 ks por segundo (192 KHz) y no deben estar distorsionadas / recortadas. Grabaciones débiles están bien, ya que representan las condiciones de la vida real. La otra cosa que hay que mencionar es que la misma especie de murciélago en una ubicación geográfica diferente puede tener diferentes llamadas, por lo que es importante añadir las propias llamadas de murciélagos locales a los datos para obtener buenos resultados.

Mis propios datos se ofrecen sin licencia de Google Drive aquí. ¡Utilízalos de la manera que creas conveniente! Las especies fueron identificadas con la ayuda de expertos en la localización del eco de murciélagos en el grupo de Facebook: Taller de Análisis de Sonido de Llamada de Murciélago. (¡Gracias chicos!)

Así que tenemos unos 320 MB de datos de entrenamiento, un clasificador de trabajo en Rstudio y una grabación de un bate de la noche anterior con un micrófono UltraMic384K. Ahora sólo hay que encontrar el directorio Bioacoustics/unknown_bat_audio/, borrar los archivos existentes y pegar en nuestro bate desconocido. Es muy sencillo! Presiona el botón $0027run$0027 ……..

Es muy probable que sea un plecotus auritus, el murciélago de orejas largas marrón eminentemente lindo! A veces el clasificador tiene dificultades, sobre todo si las grabaciones son indistintas. Además, los murciélagos del género Myotis tienden a tener llamadas muy similares entre sí y en realidad se superponen, por lo que a menudo es imposible clasificarlos sin atrapar físicamente a la criatura y extraerle el ADN, o algo parecido. Esto no lo recomiendo y si realmente debe hacerlo, compruebe si se requiere una licencia de la Reserva Federal y no sea mordido – los murciélagos pueden ser portadores de algunas enfermedades mortales.

¿Y qué es lo siguiente? ¿Tal vez llevar el clasificador a un Raspberry PI y enviar los resultados a través de una conexión LoRa? ¿O si hay una señal de teléfono móvil 2G, enviarla a través de HTTP? O un detector de murciélagos de mano que diga el nombre del murciélago. “Hola amigos. Ahí va Barry el murciélago de orejas marrones, y está de humor para la fiesta!”

Una bicicleta de época que da poder a Briggs y a Stratton

Una bicicleta de época que da poder a Briggs y a Stratton

eBay hizo popular el proceso de motorización de una bicicleta, con motores baratos de China combinados con un puñado de ...
Leer Más
La lámpara del globo sigue la ISS por ti

La lámpara del globo sigue la ISS por ti

Suponiendo que no trabaje en una agencia espacial importante, es probable que no necesite saber en todo momento la ubicación ...
Leer Más
Llevando el Cartucho de NES a la era USB

Llevando el Cartucho de NES a la era USB

Un cartucho de NES en su forma más básica es un dispositivo sorprendentemente simple, contiene dos ROMs que albergan todo ...
Leer Más
Los satélites Starlink plantean problemas a los astrónomos

Los satélites Starlink plantean problemas a los astrónomos

La observación de satélites desde la tierra es un pasatiempo popular entre los astrónomos aficionados. Típicamente, los satélites ISS e ...
Leer Más
Vea un tirachinas hecho en arena, de principio a fin

Vea un tirachinas hecho en arena, de principio a fin

La fundición en arena de piezas metálicas es una técnica que existe desde hace mucho tiempo, pero puede ser educativo ...
Leer Más
Esta semana en seguridad: Vulnerabilidades de Unicode, Truecrypt y NPM

Esta semana en seguridad: Vulnerabilidades de Unicode, Truecrypt y NPM

Unicode, la maravillosa extensión a ASCII que nos da gemas como "", "", y "", ha tenido algunas ramificaciones de ...
Leer Más
El laboratorio de juegos: La otra insignia de la FPGA para la consola de juegos

El laboratorio de juegos: La otra insignia de la FPGA para la consola de juegos

Cualquiera que haya estado en la Supercon, sin duda recordará las insignias que colgaban en el cuello de todos. Algunas ...
Leer Más
radio ww2

La radio de los aviones de la Segunda Guerra Mundial

Toda mi vida me han hablado de las antiguas tiendas de excedentes del Ejército y la Marina donde se podían ...
Leer Más
La impresora 3D y el CNC hacen que esta calculadora rusa sea bilingüe

La impresora 3D y el CNC hacen que esta calculadora rusa sea bilingüe

Seamos claros desde el principio: probablemente hay soluciones más obvias al problema de usar una calculadora rusa cuando no se ...
Leer Más
Construyendo su propia estructura de Tensegridad

Construyendo su propia estructura de Tensegridad

Parece que las estructuras de tensegridad están de moda en Internet, posiblemente debido a la naturaleza aparentemente imposible de su ...
Leer Más
La aplicación de teléfono de AI aprende las señales de béisbol

La aplicación de teléfono de AI aprende las señales de béisbol

Ver un deporte puede ser un poco extraño si no estás familiarizado con él. La mayoría de los estadounidenses, por ...
Leer Más
La caja ocupada vence al aburrimiento del bebé

La caja ocupada vence al aburrimiento del bebé

Nos encantaría ser una mosca en la pared la mañana de Navidad para ver al hijo de [Wilksyonreddit] arrancar el ...
Leer Más
Landbeest, un robot caminante de un solo servo

Landbeest, un robot caminante de un solo servo

Los robots caminantes tienen una rica historia dentro y fuera de las páginas de Digital Lithium, pero si perdonamos la ...
Leer Más
John McMaster explica las teclas del teléfono con ignición por criptografía y cómo reproducirlas

John McMaster explica las teclas del teléfono con ignición por criptografía y cómo reproducirlas

Cuando eres una nación estado, las comunicaciones seguras son clave para proteger tu soberanía y mantener tus mejores planes en ...
Leer Más
No olvides al bebé!

No olvides al bebé!

Debe ser una preocupación común entre los padres, que pueden olvidar a sus hijos y dejarlos en el coche donde ...
Leer Más
194 La bola LED es una soldadura de forma libre en otro nivel

194 La bola LED es una soldadura de forma libre en otro nivel

Todos hemos visto muchas soldaduras de forma libre impresionantes en estas páginas, tal vez algunos de nosotros incluso lo hemos ...
Leer Más
Un brazo robótico de asistencia abierto para ayudar a las personas a alimentarse

Un brazo robótico de asistencia abierto para ayudar a las personas a alimentarse

A pesar de ser capaces de hacerlo, no todos son capaces de alimentarse a sí mismos. El proyecto del brazo ...
Leer Más
Un disparador mecánico para una cámara digital

Un disparador mecánico para una cámara digital

La mayoría de las cámaras digitales de hoy en día vienen con algún tipo de disparador electrónico a distancia. Existen ...
Leer Más
Cómo imprimir en 3D su gemelo idéntico

Cómo imprimir en 3D su gemelo idéntico

Es posible pasar un fin de semana agradable recorriendo una ciudad con un recorte de cartón robado de algún expositor ...
Leer Más
Elegante y sofisticado clasificador de bolos

Elegante y sofisticado clasificador de bolos

Clasificar los dulces por color es un problema clásico que tiene sus raíces en los contratantes de las estrellas de ...
Leer Más
La quema de propano ilustra perfectamente el funcionamiento de una válvula Tesla

La quema de propano ilustra perfectamente el funcionamiento de una válvula Tesla

Cuando se escucha el nombre "Tesla", es muy probable que los pensamientos se dirijan instantáneamente a la empresa que está ...
Leer Más
Colorear las imágenes con la ayuda de la IA

Colorear las imágenes con la ayuda de la IA

El mundo nunca fue en blanco y negro, simplemente carecíamos de la tecnología para capturarlo a todo color. Muchos han ...
Leer Más
Hacer trampa en los bolos, a la manera de los hackers

Hacer trampa en los bolos, a la manera de los hackers

Cualquier persona que haya ido alguna vez a una bolera sabrá la técnica preferida (pero ineficaz) para controlar telepáticamente una ...
Leer Más
Control de los temblores en el momento en que ocurren

Control de los temblores en el momento en que ocurren

Algunos trastornos neurológicos, como el mal de Parkinson, pueden causar temblores musculares que pueden empeorar con el paso del tiempo ...
Leer Más
¿Qué necesita un banco de trabajo electrónico?

¿Qué necesita un banco de trabajo electrónico?

¿Alguna vez ha estado en una situación en la que no está seguro de dónde empezar a construir su propio ...
Leer Más
La dobladora de rodillos eléctrica DIY puede manejar el material grueso (er)

La dobladora de rodillos eléctrica DIY puede manejar el material grueso (er)

Todo trabajador metalúrgico serio terminará por conseguirse un rodillo de doblar en algún momento, pero si eres tan dedicado como ...
Leer Más
El programa secreto del C64 se encuentra en el disco de vinilo de una banda de rock cristiano

El programa secreto del C64 se encuentra en el disco de vinilo de una banda de rock cristiano

¿Con qué frecuencia encuentras huevos de Pascua en los viejos discos de vinilo? Seguro que fue una sorpresa para [Robin ...
Leer Más
Viaje a través del funcionamiento interno de un PCB

Viaje a través del funcionamiento interno de un PCB

La mayoría de los aparatos electrónicos con los que trabajamos día a día están compuestos por placas de circuito. No ...
Leer Más
El calor de los momentos - Visualización de la ubicación en Python

El calor de los momentos – Visualización de la ubicación en Python

¿Alguna vez has echado un vistazo a toda la información que Google ha recopilado sobre ti durante todos estos años? ...
Leer Más
Hackaday Links: 15 de diciembre de 2019

Hackaday Links: 15 de diciembre de 2019

Cuando tienes razón, tienes razón. En enero, predijimos que los exoesqueletos estaban a punto de estallar como producto principal, y ...
Leer Más

Deja un comentario