Búsqueda difusa

Seguro que estás acostumbrado a usar criterios de búsquedas y a aplicar filtros a un conjunto de datos. Cada vez que usas un búscador como Google o DuckDuckGo lo haces. Habitualmente los criterios de búsqueda son aplicados usando algoritmos muy rígidos, que devuelven resultados donde las coincidencias de los datos con dichos criterios son exactas. Deja que te hable ahora sobre la búsqueda difusa (Fuzzy search), donde los algoritmos aplicados son más indulgentes, consiguiendo así que podamos lograr resultados a los que no accederíamos con los métodos expuestos anteriormente.

Te escribo un sencillo ejemplo usando el criterio de búsqueda termino. Si aplicáramos los métodos habituales de búsqueda a un texto, para localizar las líneas que contienen dicho criterio podríamos obtener resultados tal que así:

Si termino más rápido de lo previsto te aviso para que pases antes a recogerme.

Aplicando una búsqueda difusa, obtendríamos líneas donde el criterio de búsqueda está en plural, con distintos acéntos gráficos, escrito erróneamente, etc.

Si termino más rápido de lo previsto te aviso para que pases antes a recogerme.

En el examen olvidé un término bastante importate, seguro que me ha bajado la nota.

El chico que terminó justo antes que yo tropezó cuando iba a entregar el examen.

y como nadie conocía los términos en los que se había pactado su salida, resultó

, y aunque te resulte confuso, mindolo detenidamente seguro que es

La búsqueda difusa es útil, por tanto, cuando es importante conseguir resultados donde la relevancia no está determinada por la exactitud con la que estos se ajustan al criterio de búsqueda. En su lugar, el usuario tiende a buscar una idea general, no una etiqueta técnica, espera recibir más resultados y ser él quien decida la relevancia de estos. La búsqueda en archivos académicos, textos traducidos con posibles errores o sistemas de archivos son algunos casos de uso donde aplica perfectamete la búsqueda difusa.