Variáveis Aleatórias

Damos o nome de variável aleatória (VA) a qualquer função X:ΩRnX: \Omega \to \R^n que verifique uma condição de mensurabilidade.
Uma VA diz-se unidimensional se n=1n = 1, bidimensional se n=2n=2 e multidimensional se n>2n>2.
O conjunto X(Ω)RnX(\Omega) \subset \R^n é normalmente representado por RX\R_X.
Dizemos que uma VA é:

  • discreta se RX\R_X for contável;
  • contínua se RX\R_X não for contável;

Essencialmente, uma VA deve ser entendida como uma função que, para uma EA, traduz os resultados dessa EA. Vamos ver alguns exemplos:

Exemplo 1

Considere-se a experiência aleatória correspondente a lançar um dado ao ar. O espaço de resultados desta EA é o seguinte:

Ω={Saiu 1,Saiu 2,Saiu 3,Saiu 4,Saiu 5,Saiu 6}\Omega = \{ \text{Saiu 1}, \text{Saiu 2}, \text{Saiu 3}, \text{Saiu 4}, \text{Saiu 5}, \text{Saiu 6} \}

Uma variável aleatória que fará sentido é a função X:ΩRX: \Omega \to \R tal que:

X(Saiu 1)=1X(Saiu 2)=2X(Saiu 6)=6X(\text{Saiu 1}) = 1 \\ X(\text{Saiu 2}) = 2 \\ \cdots \\ X(\text{Saiu 6}) = 6

Agora já temos uma tradução da nossa experiência em números, pelo que podemos fazer continhas!!!

Exemplo 2

Considere-se a experiência aleatória que consiste em lançar um objeto ao ar e medir quantos tempo ele demora a cair no chão. O espaço de resultados desta EA é

Ω={O objeto demorou x a cair:xR+}\Omega = \{ \text{O objeto demorou } x \text{ a cair}: x \in \R^+ \}

Uma variável aleatória que fará sentido definir é a função X:ΩRX: \Omega \to \R tal que:

X(O objeto demorou x a cair)=xX(\text{O objeto demorou } x \text{ a cair}) = x
Exemplo 3

Considere-se a EA que consiste em lançar uma moeda ao ar. O espaço de resultados é:

Ω={Sai Cara,Sai Coroa}\Omega = \{ \text{Sai Cara}, \text{Sai Coroa} \}

Uma VA que podemos definir é a função X:ΩRX: \Omega \to \R tal que:

X(Sai Cara)=0X(Sai Coroa)=1X( \text{Sai Cara} ) = 0 \\ X( \text{Sai Coroa} ) = 1

Nota

Em todos os exemplos podíamos ter definido qualquer outra VA que nos apetecesse.
Nos primeiros dois exemplos não fazia sentido definir qualquer VA que não as que foram definidas - estas são as que nos fazem mais sentido. De facto, nesses casos as variáveis aleatórias são tão pouco "originais" que é fácil confundir o input (o evento) com o output (um valor numérico).
No entanto, no terceiro exemplo já é mais notável qual o objetivo da VA. Na verdade, a VA não passa exatamente de um formalismo que transforma eventos em valores numéricos. Desta forma, podemos definir qualquer VA desde que consigamos trabalhar com ela.

Wait... O que raio é uma condição de mensurabilidade???

Mais uma vez, perceber o que é uma condição de mensurabilidade não é necessário para trabalhos/exame/projeto. É um conceito abstrato e difícil de interiorizar, pelo que quem tiver dificuldades com ele está melhor a saltar à frente.
De qualquer forma, para quem tiver interesse, fica a definição - note-se que este conceito pode ser relevante em oral!

Condição de mensurabilidade

Dizemos que uma VA XX unidimensional tem uma condição de mensurabilidade se qualquer conjunto da forma ],x]]-\infty, x] (xRx \in \R) tiver imagem inversa segundo XX. Isto é, para qualquer conjunto xRx \in \R, existe um evento AΣA \in \Sigma tal que X(A)=],x]X(A) = ]-\infty, x].

Para analisar probabilidades, atribuímos a VA's XX uma função de probabilidade P:Ω[0,1]P: \Omega \to [0,1] definida por

P(X=x)=P({ωΩ:X(ω)=x})P(X = x) = P( \{ \omega \in \Omega : X(\omega) = x \} )

Em relação a VA's, é também comum definir a função de distribuição (fd) como a função FX(x):R[0,1]F_X(x): \R \to [0,1] tal que

FX(x)=P(Xx)F_X(x) = P(X \leq x)

Dependendo se a VA é discreta ou contínua, esta função tem restrições e propriedades diferentes (apesar de análogas). Nomeadamente, para VA's discretas é possível usar somatórios, já que Ω\Omega é contável. Para VA's contínuas, por contraste, teremos de trabalhar com integrais.
Está então na altura de analisar cada caso em separado.

Nota

A relevância da função de distribuição é proveniente da forma como a condição de mensurabilidade está definida.

Variáveis Aleatórias Discretas

A funçao de probabilidade de uma VA discreta deve ser tal que:

  • P(X=x)>0,xRXP(X = x) > 0, \forall_{x \in \R_X}
  • xRXP(X=x)=1\sum_{x \in \R_X} P(X = x) = 1

Para VA's contínuas é evidente que a função de distribuição pode ser dada por

FX(x)=P(Xx)=yRX,yxP(X=y)F_X(x) = P(X \leq x) = \sum_{y \in \R_X, y \leq x} P(X = y)

As VA's discretas satisfazem as seguintes propriedades:

  • FXF_X é monótona crescente, contínua à direita e tem #RX\#\R_X pontos de descontinuidade. Consequentemente, o gráfica da fd de uma VA discreta é algo parecido a:

Gráfico da fd de um VA dicsreta

  • FX()=limxFX(x)=0F_X(-\infty) = \lim_{x \to -\infty} F_X(x) = 0;
  • FX(+)=limx+FX(x)=1F_X(+\infty) = \lim_{x \to +\infty} F_X(x) = 1;
  • P(X<x)=P(Xx)P(X=x)=FX(x)P(X=x)P(X < x) = P(X \leq x) - P(X = x) = F_X(x) - P(X = x);
  • P(X>x)=1P(Xx)=1FX(x)P(X > x) = 1 - P(X \leq x) = 1 - F_X(x);
  • P(a<Xb)=FX(b)FX(a)P(a < X \leq b) = F_X(b) - F_X(a);
  • P(a<X<b)=FX(b)FX(a)P(X=b)P(a < X < b) = F_X(b) - F_X(a) - P(X = b);
  • P(aXb)=FX(b)FX(a)+P(X=a)P(a \leq X \leq b) = F_X(b) - F_X(a) + P(X = a);
  • P(aX<b)=FX(b)FX(a)+P(X=a)P(X=b)P(a \leq X < b) = F_X(b) - F_X(a) + P(X = a) - P(X = b);

Variáveis Aleatórias Contínuas

Para VA's contínuas temos que qualquer evento elementar é impossível. Isto é:

P(X=x)=0,xRP(X = x) = 0, \forall_{x \in \R}

Então, a melhor forma de caracterizar VA's contínuas é através da sua função de distribuição.
Dizemos entao que uma VA XX é contínua se e só se:

  • Possuir uma função distribuição FX(x)F_X(x) contínua e crescente (em sentido lato) em R\R;
  • Existir uma função fX(x):RR0+f_X(x): \R \to \R_0^+ tal que
    FX(x)=xfX(t)dtF_X(x) = \int_{-\infty}^x f_X(t) \, dt
    A esta função dá-se o nome de função de densidade de probabilidade (fdp).

As VA's contínuas têm as seguintes propriedades:

  • Um gráfico vagamente semelhante ao representado abaixo, devido à continuidade e monotonicidade lata:

Gráfico da fd de um VA contínua

  • fX(x)=δFX(x)δxf_X(x) = \frac{\delta F_X(x)}{\delta x}
  • FX()=0F_X(-\infty) = 0, FX(+)=1F_X(+\infty) = 1 e, consequentemente, 0FX(x)10 \leq F_X(x) \leq 1 para qualquer xRx \in \R;
  • Para qualquer a,bRa,b \in \R:
    P(a<X<b)=P(aX<b)=P(a<Xb)=P(aXb)=FX(b)FX(a)=abfX(x)dxP(a < X < b) = P(a \leq X < b) = P(a < X \leq b) = P(a \leq X \leq b) = \\ F_X(b) - F_X(a) = \int_a^b f_X(x) \, dx

Valor Esperado e Variância

Por vezes é relevante condensar informação sobre uma VA num só número. As funções mais que relevantes que nos dão informação sobre VA's são:

  • Valor Esperado: E(X)E(X), μ\mu ou μx\mu_x
    É dado por:

    Para VA’s discretasPara VA’s contıˊnuasE(X)=xRXxP(X=x)E(X)=xfX(x)dxse esta seˊrie convergirse este integral convergir\begin{matrix} \text{Para VA's discretas} & & \text{Para VA's contínuas} \\ E(X) = \sum_{x \in \R_X} x P(X = x) & & E(X) = \int_{-\infty}^{\infty} x f_X(x) \, dx \\ \text{se esta série convergir} & & \text{se este integral convergir} \end{matrix}

    Definimos ainda o valor esperado de uma função hh sobre XX como:

    E(h(X))=xRXh(x)P(X=x)E(h(X))=h(x)P(X=x)para X discretaPara X contıˊnua\begin{matrix} E(h(X)) = \sum_{x \in \R_X} h(x) P(X = x) & & E(h(X)) = \int_{-\infty}^\infty h(x) P(X = x) \\ \text{para } X \text{ discreta} & & \text{Para } X \text{ contínua} \end{matrix}

    Nomeadamente, se h(x)=ax+bh(x) = ax + b, para a,bRa, b \in \R, verificamos que

    E(aX+b)=aE(X)+bE(aX+b) = aE(X) + b

    Esta função é a medida de centralidade principal de uma VA.

  • Variância: Var(X)Var(X), V(X)V(X), σ2\sigma^2 ou σx2\sigma^2_x
    É definido como

    V(X)=E((XE(X))2)=E(X2)E(X)2V(X) = E\left( (X - E(X))^2 \right) = E(X^2) - E(X)^2

    A variância tem as seguintes propriedades:

    • V(X)0V(X) \geq 0;
    • V(X)=0XV(X) = 0 \Leftrightarrow X constante;
    • V(aX+b)=a2V(x)V(aX+b) = a^2V(x), para a,bRa,b \in \R.

    Esta função dá-nos uma medida de divergência em relação ao valor esperado (ao centro).

  • Desvio Padrão: DP(X)DP(X), σ\sigma ou σX\sigma_X
    É definido por

    DP(X)=V(X)DP(X) = \sqrt{V(X)}

    Esta função tem a propriedade DP(aX+b)=aDP(X)DP(aX+b) = aDP(X).

    Esta função é usada principalmente quando se quer uma medida de desvio que funcione bem com multiplicações por escalares em XX.