La red social de Facebook presentó su más reciente innovación: DINO. Es un algoritmo que permite la detección de objetos en imágenes y videos. Se basa en tecnología de Inteligencia Artificial independiente, es decir, que no requiere de un humano para aprender. Esta tecnología se ha desarrollado en colaboración con India.
DINO funciona a través de un sistema de aprendizaje automático, es entrenado a través de imágenes para que mejore constantemente. La inteligencia artificial se capacita para la detección y segmentación de distintos elementos dentro de una imagen o video.
Por estas razones, el aprendizaje de DINO no es supervisado, pues trabaja de forma independiente, sin necesidad del ingreso de datos o etiquetas para ayudar a la inteligencia artificial a identificar y segmentar información.
Para lograr esto, se utilizan transformadores, los cuales son modelos más efectivos para detectar y clasificar elementos dentro de las imágenes. Este sistema usa capas para la detección automática y genera representación de cada ubicación, en base a las otras ubicaciones en cada punto.
Así, este modelo de inteligencia artificial obtiene una visión de todo el conjunto en un contexto que le permite entender claramente cuáles son los elementos que se le están presentando en la imagen o video.
En la siguiente imagen se puede apreciar cómo DINO diferencia los objetos centrales del fondo:
Tabla de contenidos
¿De qué es capaz DINO?
El algoritmo es capaz de vincular las diferentes categorías de los diferentes elementos visuales, incluso si están relacionados. De hecho, Facebook ha señalado que la IA es capaz de distinguir entre imágenes reales y copiadas, por lo que DINO podría ser utilizado en el futuro para identificar plagios o infracciones por derechos de autor.
Este tipo de procedimientos de segmentación de objetos es habitual en herramientas de diseño gráfico y aplicaciones que eliminan o cambian el fondo de las imágenes automáticamente.
Por otra parte, DINO se complementa con PAWS. Este es otro algoritmo de IA para imágenes que mejora la efectividad de la clasificación de los objetos dentro de una imagen que requiere hasta 12 veces menos capacitación, lo que podría ser utilizado en medicina, donde es habitual perder mucho tiempo limpiando y organizando datos.
Adaptado de Trecebits.