¿cuáles son las principales dificultades en el momento de la clasificación de objetos?

¿cuáles son las principales dificultades en el momento de la clasificación de objetos?

141

Clasificar objetos y materiales como sólidos, líquidos y gases en función de algunas características observables

Para proyectos serios, recomendamos utilizar los dos flujos de trabajo, Clasificación de Píxeles y Clasificación de Objetos, por separado, utilizando el resultado generado del primero como entrada adicional en el segundo.

Este applet encuentra los componentes conectados (objetos) en la imagen de segmentación binaria proporcionada y calcula las características definidas por el usuario para cada objeto. Si desea inspeccionar los componentes conectados, active la capa «Objetos (componentes conectados)». Si selecciona cualquier característica del objeto, el análisis de los componentes conectados se realizará automáticamente.

En ese caso, la vecindad del objeto (especificada por el usuario en la parte inferior del cuadro de diálogo) se encuentra mediante una transformada de distancia y la característica se calcula para el propio objeto y para la vecindad que incluye y excluye el objeto.

Una vez que el usuario haya seleccionado las características que desee, el applet procederá a calcularlas. En el caso de grandes conjuntos de datos 3D, este paso puede llevar bastante tiempo. Sin embargo, tenga en cuenta que la mayoría de las veces la selección de más características en este paso no es más cara computacionalmente. Por lo tanto, le recomendamos que seleccione todas las características que crea que puede probar para la clasificación y luego elija un subconjunto de estas características en el siguiente applet.

Problemas con la clasificación de la taxonomía

En estadística, la clasificación es el problema de identificar a cuál de un conjunto de categorías (subpoblaciones) pertenece una observación (u observaciones). Algunos ejemplos son la asignación de un correo electrónico determinado a la clase «spam» o «no spam», y la asignación de un diagnóstico a un paciente determinado en función de las características observadas del mismo (sexo, presión arterial, presencia o ausencia de determinados síntomas, etc.).

A menudo, las observaciones individuales se analizan en un conjunto de propiedades cuantificables, conocidas como variables explicativas o características. Estas propiedades pueden ser categóricas (por ejemplo, «A», «B», «AB» u «O», para el grupo sanguíneo), ordinales (por ejemplo, «grande», «mediano» o «pequeño»), de valor entero (por ejemplo, el número de apariciones de una palabra concreta en un correo electrónico) o de valor real (por ejemplo, una medición de la presión arterial). Otros clasificadores funcionan comparando las observaciones con las anteriores mediante una función de similitud o distancia.

Un algoritmo que implementa la clasificación, especialmente en una implementación concreta, se conoce como clasificador. El término «clasificador» a veces también se refiere a la función matemática, implementada por un clasificador

Problemas interesantes de clasificación de imágenes

No faltan problemas interesantes en la visión por ordenador, desde la simple clasificación de imágenes hasta la estimación de la posición en 3D. Uno de los problemas que más nos interesan y en el que hemos trabajado mucho es la detección de objetos. Al igual que muchos otros problemas de visión por ordenador, todavía no hay una manera obvia o incluso «mejor» de abordar el problema, lo que significa que todavía hay mucho margen de mejora. Antes de entrar en la detección de objetos, hagamos un rápido repaso de los problemas más comunes en este campo.

Probablemente el problema más conocido en visión por ordenador. Consiste en clasificar una imagen en una de muchas categorías diferentes. Uno de los conjuntos de datos más populares utilizados en el mundo académico es ImageNet, compuesto por millones de imágenes clasificadas, utilizado (parcialmente) en la competición anual ImageNet Large Scale Visual Recognition Challenge (ILSVRC). En los últimos años, los modelos de clasificación han superado el rendimiento humano y se considera prácticamente resuelto. Aunque hay muchos retos en la clasificación de imágenes, también hay muchos escritos sobre cómo se suele resolver y cuáles son los retos pendientes.

Problemas de procesamiento de imágenes y soluciones

El aprendizaje profundo se está convirtiendo rápidamente en un instrumento clave en las aplicaciones de inteligencia artificial (LeCun et al. 2015). Por ejemplo, en áreas como la visión por ordenador, el procesamiento del lenguaje natural y el reconocimiento del habla, el aprendizaje profundo ha estado produciendo resultados notables. Por lo tanto, hay un interés creciente en el aprendizaje profundo.

Uno de los problemas en los que destaca el aprendizaje profundo es la clasificación de imágenes (Rawat y Wang 2017). El objetivo en la clasificación de imágenes es clasificar una imagen específica de acuerdo con un conjunto de posibles categorías. Un ejemplo clásico de clasificación de imágenes es la identificación de gatos y perros en un conjunto de imágenes (por ejemplo, la competición Kaggle Perros vs. Gatos).

Desde la perspectiva del aprendizaje profundo, el problema de la clasificación de imágenes puede resolverse mediante el aprendizaje de transferencia. De hecho, varios resultados del estado del arte en la clasificación de imágenes se basan en soluciones de aprendizaje de transferencia (Krizhevsky et al. 2012, Simonyan & Zisserman 2014, He et al. 2016). Pan y Yang (2010) ofrecen una revisión exhaustiva del aprendizaje de transferencia.



Redactor independiente con experiencia en varios medios digitales de LATAM. Te explico paso a paso tramites e información del día a día en este blog de Ecuador.