jueves, 8 de febrero de 2018

¡ ARANGE ! ¿Qué haces? (numpy, python, matlab)

Si hay algo que me saca de mis casillas y a la vez me encanta, es encontrar un comportamiento anómalo en algo y no saber - a priori- porque sucede.

Me saca de mis casillas, porque muchas veces necesitas hacer algo rápido y lo último que quieres son problemas, complicaciones y pérdidas de tiempo. Pero a la vez me encanta, porque todo el proceso de búsqueda, investigación y depuración que implica dar con la solución, es apasionante y enriquecedor, siempre se aprenden cosas nuevas o rememoran otras olvidadas.

Voy al grano. Resulta que necesitaba generar unas gráficas sobre una operación de muestreo de señales FSK con el fin de analizar el comportamiento de unos filtros digitales. Y como de costumbre, termino utilizando alguno de los paquetes "matemáticos" al uso, ya sea tipo Matlab o bien, con algún lenguaje de programación.

En este caso, decidí utilizar python y su paquete científico y para generar el espacio de tiempo necesario para representar las gráficas, pues decidí utilizar ARANGE del paquete Numpy, en lugar de utilizar por ejemplo LINSPACE.

Hasta aquí aparentemente es todo correcto, y creedme que al final todo resultó ser una auténtica chorrada por culpa de un detalle que olvidé, pero amigo, cuando no lo ves, no lo ves.

Pues bien, voy todo decidido y creo un primer array:

Como podemos apreciar, se genera un array compuesto de 20 valores que en este caso tienen un paso de 0.05 exacto. Pero cual es el problema, pues que a la hora de generar la gráfica, resulta que no se incluía la última muestra. Si os fijáis, el rango indicado en la función va desde '0' hasta '1', sin embargo el array generado contiene valores comprendidos entre '0' y '0.95'. No se incluye el valor máximo del rango, es decir, el '1'

Resulta que en la documentación de la función 'arange' se indica claramente que esta función no genera el último valor, o valor de Stop, pero si el valor inicial o Start. Sin embargo, esto tampoco es del todo cierto, puesto que el último valor, si que puede llegar a incluirse, como podemos ver en este otro ejemplo, con una pequeña "trampa":



Si nos fijamos en la imagen superior, ahora si que se incluye el último valor correspondiente al '1' y en este caso, el array contiene 21 valores. Pero, ¿Qué ha sucedido? Bueno, se ve claramente, que el valor máximo del rango o valor de 'stop' que he pasado a la función np.arange(), ahora no es '1', sino que le estoy pasando '1.000000000000001'. Muchos pensarían que con esa cantidad de ceros a la derecha del punto decimal, poco podría afectar al resultado, pero no es así exactamente.

Si miramos nuevamente la imagen, justo debajo de los valores del array, aparece una suma de dos valores en decimales o en coma flotante. Estos son el 1.000000000000001 y 0.05. Para cualquiera, lo lógico sería pensar que el resultado de sumar 1.000000000000001 + 0.05 debería ser 1.050000000000001. Resulta que como se ve en la imagen, para python 1.000000000000001  + 0.05 es igual a 1.0500000000000012 Ojo! y no solo para python, para otros lenguajes de programación y calculadoras también, aunque muchos de ellos "truquen" los resultados o las representaciones en pantalla para "camuflar" esa "imprecisión" de cálculo, que por otro lado es algo inherente al propio sistema utilizado para procesar los valores en coma flotante y en un entorno binario.

En definitiva, en cuanto hice esa comprobación, enseguida me di cuenta de que es lo que tenía entre manos y la razón por la cual estaba obteniendo muestras de la señal incompletas, es decir, sin la última muestra. Os dejo una última imagen, donde se ve claramente la diferencia entre las dos gráficas, la de la izquierda incompleta, es decir, sin la última muestra y, la de la derecha completa.



Ya en el pasado, el famoso problema de "imprecisión en coma flotante" que es como se le conoce a este problema, me hizo dar alguna que otra vuelta a la cabeza.

No obstante, para aquellos a los que os interese este tema, escribiré un post al respecto, dando algunos detalles más técnicos de porque sucede esto.

Hasta entonces, ¡un saludo a todos los lectores!



No hay comentarios:

Publicar un comentario