Skip to content

Duplicate file finder

Latest
Compare
Choose a tag to compare
@edwynG edwynG released this 26 Jan 22:18
· 14 commits to main since this release

Buscador de archivos duplicados

El Buscador de archivos duplicados es una herramienta de línea de comandos (CLI) diseñada para ayudar a los usuarios a identificar y gestionar archivos que contienen los mismos datos en su sistema. Esta herramienta permite optimizar el rendimiento del análisis mediante el uso de múltiples hilos, acelerando así el proceso de búsqueda.

Nota
Esta version del programa solo es compatible con sistemas operativos tipo unix debido a las librerías de semáforos, hilos y directorios que utiliza.

Características

  • Identificación de Duplicados: Utiliza la función hash MD5 para generar un resumen único para cada archivo, facilitando la comparación de contenidos de manera eficiente.
  • Optimización de Rendimiento: Permite especificar el número de hilos para realizar múltiples tareas simultáneamente.
  • Modos de Hash: Ofrece dos modos de hash para elegir, lo que proporciona flexibilidad en su uso.

Instalación

Puedes descargar el ejecutable . Alternativamente, si prefieres, puedes clonar el repositorio y compilar el programa utilizando el makefile.

Uso

Para utilizar el buscador de archivos duplicados, ejecuta el siguiente comando en la terminal:

./duplicados -t <número de threads> -d <directorio de inicio> -m <e | l>

Opciones

  • t <número de threads>: Especifica el número de hilos que deseas utilizar para optimizar el rendimiento del análisis.
  • d : Indica el directorio desde el cual comenzará la búsqueda de archivos duplicados.
  • m <e | l>: Permite elegir entre dos modos de hash:
    • e: Utiliza un ejecutable para el cálculo del hash.
    • l: Emplea una biblioteca para el cálculo del hash.

Contribuciones

Las contribuciones son bienvenidas. Si deseas mejorar el programa o corregir errores, por favor abre un issue o envía un pull request.