Hay un nuevo jugador en la escena de la búsqueda por inteligencia extraterrestre, SETI por sus siglas en inglés, y ya está encontrando misteriosas señales de radio que podrían de una civilización.
Durante más de seis décadas, los astrónomos han buscado a través de miles de millones de canales de radio de banda estrecha, luchando por encontrar cualquier signo de inteligencia. Y además del desafío de escuchar en el momento adecuado, en el lugar correcto, hay innumerables señales confusas en toda la Tierra, desde teléfonos celulares hasta GPS, wi-fi y hornos de microondas, que se lavan sobre un radiotelescopio e interfieren con su tensa audición de los cielos. Aunque, en principio, toda esa basura de radio de la actividad humana se puede tamizar y clasificar, la gran cantidad que podría oscurecer cualquier señal alienígena verdadera significa que las probabilidades están realmente en nuestra contra. Especialmente a medida que entramos en la era de la astronomía de ‘Big Data’.
Se está convirtiendo menos en un trabajo para un humano y más en un trabajo para una máquina.
Un nuevo algoritmo de aprendizaje automático, escrito por un estudiante universitario de la Universidad de Toronto, Peter Ma, ha cortado el ruido terrestre para descubrir ocho señales de radio actualmente inexplicables.
Ma primero alimentó su algoritmo con señales simuladas, entrenándolo para reconocer cómo creemos que podría verse una señal de radio alienígena, una que exhibe una deriva Doppler incurrida por la rotación del transmisor y el receptor en planetas giratorios, y que también muestra un patrón claro de encendido y apagado cuando el telescopio se aleja de la estrella objetivo. Si una señal realmente es solo interferencia terrestre, entonces no debería exhibir deriva Doppler y, en principio, debería desaparecer cuando el telescopio se aleje del objetivo.
Luego, lo desató en 480 horas de datos recopilados de 820 sistemas estelares por el radiotelescopio de 100 metros Green Bank de Virginia Occidental. Esto ascendió a millones de señales de radio, en su mayoría falsas, pero una vez que el algoritmo descartó la interferencia de radiofrecuencia terrestre (RFI) y el ruido astrofísico, quedaron ocho señales candidatas. Estos parecen provenir de cinco sistemas estelares, todos entre 30 y 90 años luz de la Tierra.
Entrenamiento del algoritmo
A pesar de ser señalado por el algoritmo de aprendizaje automático, el dinero inteligente todavía está en estas ocho señales siendo RFI terrestre que se deslizó a través de la red. Al igual que BLC-1, la señal anómala detectada por Breakthrough Listen, que se cree que se originó en Proxima Centauri, pero en realidad fue de la electrónica construida por humanos, es casi seguro que tendrán un origen mundano.
Lo importante es que el algoritmo fue capaz de tamizar a través de los torrentes de RFI más obvios para encontrar las ocho señales inusuales rápidamente. Más pertinentemente, cuando los mismos datos se alimentaron a través de la canalización de búsqueda tradicional, se perdieron las ocho señales. En otras palabras, el algoritmo de aprendizaje automático de Ma está detectando señales interesantes que de otro modo no se habrían detectado.
“Los ocho principales candidatos [fueron] detectados provenientes de partes ruidosas del espectro, en el rango de 1.4-1.6GHz”, dice Ma a Supercluster. “El algoritmo parece funcionar mejor en ciertos aspectos, ya que descubrió señales más interesantes que el algoritmo tradicional no pudo detectar”.
El algoritmo logra un equilibrio entre el aprendizaje automático supervisado y no supervisado. Imagina que estuvieras entrenando el algoritmo para reconocer imágenes de gatos y perros, dice el astrónomo Steve Croft de Breakthrough Listen en la Universidad de California, Berkeley. En el aprendizaje automático supervisado, etiqueta las imágenes como “gato” o “perro” para ayudar al algoritmo. En el aprendizaje no supervisado, las imágenes no están etiquetadas, y la IA tiene que averiguar cuáles son gatos y cuáles son perros por sí sola.
“Luego hay enfoques intermedios como lo que Peter está haciendo”, dijó Croft. “Está simulando algunas señales y luego entrenando un codificador automático para reproducir la entrada, y luego la está alimentando en un clasificador de bosque aleatorio que realmente hace la determinación de qué son las cosas”.
Dado lo omnipresente que se está volviendo la IA en nuestras vidas, todos tenemos que aprender el nuevo lenguaje de la inteligencia artificial, solo que en este caso ha adquirido un dialecto claramente arbóreo. Un “clasificador de bosque aleatorio” es una colección de “árboles de decisión”, que son un medio para permitir que un algoritmo ordene los datos tomando decisiones de acuerdo con un modelo similar a un árbol, con las ramas siendo diferentes resultados, como, ¿es este animal un gato o un perro?
Aunque suena complicado, en realidad es solo reconocimiento de patrones, y en el contexto de SETI se convierte en una especie de ‘¿Dónde está Wally?’ cósmico.
“El objetivo final es un detector universal de anomalías, donde descubra cómo se ve toda la interferencia humana y luego diga, aquí hay algo que se ve diferente”, dice Croft.