Las imágenes de satélite pueden ser una fantástica herramienta de ingeniería civil, al menos cuando las nubes no se interponen en el camino. Los investigadores de la Universidad de Osaka han demostrado cómo utilizar el aprendizaje profundo acelerado por GPU para eliminar estas nubes. En el futuro, los investigadores podrían utilizar la técnica para detectar otros objetos, como carreteras y ríos en fotografías aéreas.
Científicos de la División de Energía Sostenible e Ingeniería Ambiental de la universidad de Osaka utilizaron una “red generativa adversarial” o GAN, entrenaron los modelos en un PC con el sistema operativo de código abierto Ubuntu y una GPU GeForce GTX 1060. El método permitirá detectar edificios en zonas sin datos de entrenamiento etiquetados.
“Al entrenar la red generativa para ‘engañar’ a la red discriminativa para que piense que una imagen es real, obtenemos imágenes reconstruidas que son más autoconsistentes”, dijo el primer autor Kazunosuke Ikeno en un comunicado de NVIDIA.
En el comunicado, el estudiante de doctorado en la Universidad de Montreal, indicó que las GAN se basan en un par de redes que compiten entre sí para crear imágenes realistas. Estas redes competitivas permiten a los desarrolladores entrenar a las IAs con menos datos.
“Se pueden eliminar las imágenes de las nubes a mano, pero eso lleva mucho tiempo. Las técnicas de aprendizaje automático, en cambio, requieren un gran número de imágenes de entrenamiento para funcionar, y eso no siempre es práctico” resaltó.
Así que los investigadores de la Universidad de Osaka recurrieron a las GAN, que se basan en dos algoritmos. El primero, conocido como “red generativa”, reconstruye las imágenes sin nubes. El segundo, una “red discriminativa”, utiliza una red neuronal convolucional para elegir entre las imágenes creadas por la primera red y las fotos reales para armar la imagen final a utilizar.
Las dos redes que compiten entre sí se mejoran mutuamente sin necesidad de tantos datos: el resultado son imágenes muy realistas sin nubes. El uso de los datos resultantes como texturas para modelos 3D permite generar automáticamente conjuntos de datos más precisos de máscaras de imágenes de edificios. Utilizando imágenes de 400 por 400 píxeles, los investigadores entrenaron los modelos en un PC con el sistema operativo de código abierto Ubuntu y una GPU con soporte de una GeForce GTX 1060.
Comments