Regresión lineal

En esta página, se describe el procedimiento de ajuste de los datos experimentales a una línea recta denominado regresión lineal, que se usa en el laboratorio en varias situaciones:

El programa interactivo al final de esta página, está diseñado para que sea usado, en el Laboratorio de Física para cualquier experiencia que lo requiera. Nos proporciona los valores de:

Descripción

Supongamos que estamos midiendo la posición de un móvil en función del tiempo en un movimiento rectilíneo. Si el móvil está libre de fuerzas, esperamos que la relación entre la posición del móvil y el tiempo sea lineal x=x0+vt. Donde x0 es la posición del móvil en el instante t=0.

Si medimos las posiciones del móvil x1 y x2 en los instantes t1 y t2, obtenemos un sistema de dos ecuaciones con dos incógnitas de las que podemos determinar las cantidades desconocidas x0 y v. Ahora bien, esta afirmación solamente es cierta en un experimento ideal libre de errores.

Si efectuamos n medidas de la posición del móvil, el aspecto de la representación gráfica de nuestras medidas puede ser parecido al de la figura más abajo, los puntos de color azul representan los datos experimentales. La relación entre las ordenadas y y las abscisas x de dichos puntos es solamente aproximada, debido a los errores de cada una de las medidas.

Si tomamos únicamente dos puntos para definir la recta el resultado tendría un importante error. Para una mejor estimación de la recta y por tanto, de las magnitudes buscadas, se deberán utilizar las n medidas tomadas.

Supongamos una magnitud física y, relacionada con otra x, mediante la función y=ax+b. Una recta de pendiente a cuya ordenada en el origen es b. Las desviaciones ε de los valores de y, véase la figura, serán

Sea E(a,b) la suma de los cuadrados de todas estas desviaciones

E(a,b)=(y1-ax1-b)2+(y2-ax2-b)2+...(yi-axi-b)2+...+(yn-axn-b)2

E(a,b)= 1 n ( y i a x i b) 2

Los valores que minimizan a E(a,b) son aquellos para los que

E a =0 E b =0

Se obtiene así, un sistema de dos ecuaciones con dos incógnitas a y b cuya solución es

a= n 1 n x i y i ( 1 n x i )( 1 n y i ) n 1 n x i 2 ( 1 n x i ) 2 b= 1 n y i a 1 n x i n

Expresiones más elaboradas nos permiten determinar el error de a, Δa y el error de b,  Δb

Δa= n σ n 1 n x i 2 ( 1 n x i ) 2 σ= 1 n ( y i a x i b ) 2 n2 Δb=Δa 1 n x i 2 n

La pendiente de la recta se escribirá a±Δa, y la ordenada en el origen b±Δb. Véase las reglas para expresar una medida y su error de una magnitud.

El coeficiente de correlación es otro parámetro para el estudio de una distribución bidimensional, que nos indica el grado de dependencia entre las variables X e Y. El coeficiente de correlación r es un número que se obtiene mediante la fórmula.

r= 1 n ( x i <x>)( y i <y>) 1 n ( x i <x>) 2 1 n ( y i <y>) 2

El coeficiente de correlación puede valer cualquier número comprendido entre -1 y +1.

Ejemplo

Un vehículo que se mueve supuestamente con velocidad constante. Los datos de las medidas del tiempo en cuatro posiciones separadas 900 m  son las siguientes

Tiempo t (s) Posición x (m)
17.6 0
40.4 900
67.7 1800
90.1 2700

Ajustar los datos a la línea recta

x=x0+vt

y estimar el mejor valor de la velocidad v aplicando el procedimiento de mínimos cuadrados

Introduciendo los datos en el programa interactivo, la pendiente es a=36.71 y el error de la pendiente Δa=1.001. La velocidad se escribe (véase la página Errores en las medidas)

v=37±1 m/s

stokesApplet aparecerá en un explorador compatible con JDK 1.1.