Visión por computadora: ¿Cómo puedo construir un sistema de detección de volante en tiempo real?

Lo siento, pero creo que lo estás haciendo de la manera incorrecta. ¿Escribió código con todos estos algoritmos, y solo ahora está pensando en los datos reales a los que va a aplicar su código?

Debe comenzar configurando una base de datos de validación con al menos un par de videos reales. Luego, cree datos de verdad sobre el terreno definiendo manualmente la ubicación del volante en estos videos. Finalmente, sería bueno definir una métrica y una forma de ejecutar automáticamente el algoritmo en su base de datos de validación y obtener una puntuación.

OK, ahora tienes datos reales y una forma de probar tu trabajo. Este trabajo también es útil porque te ha obligado a mirar cuidadosamente los datos. Cuando buscaste manualmente el volante, ¿cómo procediste? ¿Miraste la imagen completa o solo cerca del campo de juego?

Con todo lo dicho, ¿consideró el movimiento de objetos? El suttlecock es una de las pocas cosas que se mueve en la imagen. Eso debería ser muy valioso al intentar detectarlo.

Además de analizar el movimiento de modelado que otros sugirieron, también puede intentar modelar los distractores explícitamente. ¿Te estás perdiendo el transbordador porque lo estás confundiendo con los jugadores? ¿Por qué no tener un detector de personas y agregar la respuesta como una señal adicional en su inferencia? Además, si está considerando una cancha fija, puede intentar restringir su búsqueda del transbordador a las regiones donde puede existir: es decir, tiene un modelo explícito para el área de juego y solo busca en el cuboide que se encuentra sobre él. Se ha demostrado que este tipo de razonamiento holístico en 3D también aumenta mucho el rendimiento de detección.

Estoy de acuerdo con los demás, la resolución actual no parece suficiente a menos que pueda podar el espacio de búsqueda o estructurar mejor la luz. ¿Se puede cambiar el color del volante, como amarillo? (¿Haciéndolo así menos parecido al fondo?). ¿Puede colorearlo con pintura fluorescente y luego filtrar todos los colores no fluorescentes de la imagen?). ¿Se puede agregar iluminación, especialmente apuntando hacia arriba? ¿Puedes enmascarar a la audiencia, especialmente aquellos de blanco? ¿Puede cambiar las cámaras, a una con una resolución más alta, o agregar profundidad (RGB-D)? ¿Puede colocar las dos cámaras estéreo más separadas, o tal vez agregar una tercera cámara para capturar mejor la posición 3D?

¿Necesita modelar toda la cancha, o solo las líneas laterales y la línea de fondo? (¿Al árbitro si el pájaro aterriza dentro o fuera de los límites)? Si solo son las líneas, considere usar múltiples cámaras, cada una monitoreando solo una línea. O use dos cámaras, donde cada una controla la mitad de la cancha (lo que aumenta la resolución efectiva).

Los volantes se mueven de una manera bastante predecible. Si bien varios procedimientos podrían funcionar analizando cada cuadro individual, algo como el flujo óptico debería permitirle rechazar falsos positivos si no se comportan de acuerdo con la física de cuadro a cuadro. Me haré eco de lo que dijo Joel Schaerer; tener un conjunto de verdad fundamental será crucial para poder entrenar un clasificador o elaborar una trayectoria. Analice sus datos primero antes de decidirse por un algoritmo, pero al analizar los datos considere las secuencias y los marcos.

Intentar detectarlo a través de la visión por computadora sería hacerlo de la manera más difícil. Considera considerar adoptar una técnica similar a la que hizo la NHL para el disco de hockey: FoxTrax al menos si tienes la capacidad de agregar un circuito al volante (y no estoy seguro de cómo eso afectaría su vuelo)