Proyecto de Detección de Objetos con Computer Vision

Descripción

Este proyecto tiene como objetivo entrenar un modelo de detección de objetos que pueda identificar logos de marcas en imágenes y videos. La aplicación principal es analizar la presencia de logos en videos publicitarios para medir el tiempo que aparecen en pantalla, proporcionando métricas clave para la toma de decisiones de marketing.

Objetivos del Proyecto

Nivel Esencial (Completado):

Entrenar un modelo que detecte una nueva categoría (marca) y localice su posición dentro de un bounding box en imágenes.

Nivel Medio (Completado):

Extender la funcionalidad del modelo para procesar videos.
Mostrar debajo de cada detección el nombre de la marca detectada.

Nivel Avanzado (Completado):

Añadir el porcentaje de confianza en las detecciones.
Almacenar las detecciones en una base de datos con información relevante (nombre del video, bounding boxes, etc.).
Crear una interfaz web para cargar videos y visualizar resultados.

Niveles Futuros (Planeado):

Nivel Experto:
- Detectar múltiples marcas en el mismo video.
- Implementar un servicio en la nube con una API para acceder al modelo.

Tecnologías Utilizadas

El proyecto emplea las siguientes tecnologías:

Modelos de Detección de Objetos: YOLOv8n.
Frameworks de Deep Learning: streamlit, TensorFlow, PyTorch, TensorFlow/Keras.
Librerías Complementarias: OpenCV, scikit-image, Pillow.

Metodología de Trabajo

Se ha implementado la metodología de Pair Programming, donde:

Un desarrollador actúa como el "Piloto" escribiendo el código.
El otro actúa como "Copiloto", supervisando y aportando ideas en tiempo real.
Los roles se alternan regularmente.

Proceso de Desarrollo

Obtención y Etiquetado de Datos:
- Recopilación de imágenes de logos de marcas.
- Etiquetado manual utilizando herramientas como Roboflow.
Entrenamiento del Modelo:
- Entrenamiento inicial para una marca específica con imágenes estáticas (nivel esencial).
Extensión a Videos:
- Adaptación del modelo para analizar videos.
- Adición de superposiciones que incluyan el nombre de la marca detectada.
Pruebas y Evaluación:
- Evaluación del modelo en videos reales.
- Ajustes en base a métricas de precisión y recall.

Estructura del Proyecto

proyecto-cv-deteccion-objetos/
├── data/                # Datos de entrenamiento y validación
├── models/              # Modelos entrenados
├── scripts/             # Scripts para entrenamiento, inferencia y análisis
├── results/             # Resultados de las detecciones
├── docs/                # Documentación del proyecto
└── README.md            # Archivo README

Instrucciones para Ejecutar el Proyecto

Clona este repositorio:

git clone https://github.com/AI-School-F5-P3/Logos.git

Instala las dependencias:
```
pip install -r requirements.txt
```

Entrena el modelo:

python scripts/train.py --config configs/train_config.yaml

Realiza predicciones en imágenes:

python scripts/predict.py --image_path data/test_image.jpg

Analiza videos:

python scripts/streamlit run app_video.py

Contribuciones

Las contribuciones al proyecto son bienvenidas. Sigue estos pasos:

Crea un fork del repositorio.

Crea una nueva rama para tu feature:

git checkout -b feature/nueva_funcionalidad

Realiza tus cambios y haz un commit:

git commit -m "Añade nueva funcionalidad"

Envía un pull request.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Proyecto de Detección de Objetos con Computer Vision

Descripción

Objetivos del Proyecto

Nivel Esencial (Completado):

Nivel Medio (Completado):

Nivel Avanzado (Completado):

Niveles Futuros (Planeado):

Tecnologías Utilizadas

Metodología de Trabajo

Proceso de Desarrollo

Estructura del Proyecto

Instrucciones para Ejecutar el Proyecto

Contribuciones

About

Releases

Packages

Contributors 2

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
data		data
docs		docs
models		models
results		results
scripts		scripts
.gitignore		.gitignore
README.md		README.md
app.py		app.py
app_video.py		app_video.py
requirements.txt		requirements.txt

AI-School-F5-P3/Logos

Folders and files

Latest commit

History

Repository files navigation

Proyecto de Detección de Objetos con Computer Vision

Descripción

Objetivos del Proyecto

Nivel Esencial (Completado):

Nivel Medio (Completado):

Nivel Avanzado (Completado):

Niveles Futuros (Planeado):

Tecnologías Utilizadas

Metodología de Trabajo

Proceso de Desarrollo

Estructura del Proyecto

Instrucciones para Ejecutar el Proyecto

Contribuciones

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages