{"id":95,"date":"2020-01-31T17:02:32","date_gmt":"2020-01-31T19:02:32","guid":{"rendered":"http:\/\/meantrix.com\/blog\/?p=95"},"modified":"2020-02-21T21:00:18","modified_gmt":"2020-02-22T00:00:18","slug":"matematica-para-ciencia-de-dados-2-probabilidade","status":"publish","type":"post","link":"https:\/\/meantrix.com\/blog\/2020\/01\/31\/matematica-para-ciencia-de-dados-2-probabilidade\/","title":{"rendered":"Matem\u00e1tica para Ci\u00eancia de Dados 2 : Probabilidade"},"content":{"rendered":"<p><span class=\"latex_section\">1.&#x00A0;Probabilidade<a id=\"sec:1\"><\/a><\/span>\n<\/p>\n<p>A Teoria da Probabilidade desenvolve modelos para tratar de experimentos<br \/>\nque quando s\u00e3o repetidos, geralmente, produzem resultados diferentes.<br \/>\nEsses s\u00e3o chamados de <span class=\"latex_em\">experimentos aleat\u00f3rios<\/span> ou <span class=\"latex_em\">fen\u00f4menos aleat\u00f3rios<\/span>.<\/p>\n<p>Dado um experimento aleat\u00f3rio, diz-se que seu <span class=\"latex_em\">espa\u00e7o amostral<\/span><br \/>\n$\\Omega$ \u00e9 o conjunto formado por todos os resultados poss\u00edveis do<br \/>\nexperimento aleat\u00f3rio. Em uma defini\u00e7\u00e3o menos formal dada por Jer\u00f4nimo<br \/>\nCardano (1501-1576), a probabilidade \u00e9 definida como o quociente do<br \/>\n&#8216;n\u00famero de casos favor\u00e1veis&#8217; sobre o &#8216;n\u00famero de casos poss\u00edveis&#8217;:<\/p>\n<p>\\begin{equation}<br \/>\nP=\\frac{\\#\\quad casos\\quad favor\\acute{a}veis}{\\#\\quad casos\\quad poss\\acute{\\imath}veis}<br \/>\n\\end{equation}<\/p>\n<p>Cada elemento do <span class=\"latex_em\">espa\u00e7o amostral<\/span> \u00e9 chamado de<span class=\"latex_em\">evento<br \/>\nelementar<\/span> e, os subconjuntos de $\\Omega$ s\u00e3o chamados de <span class=\"latex_em\">eventos<\/span>.<br \/>\nAssim, uma no\u00e7\u00e3o mais geral de probabilidade \u00e9 dada pela seguinte<br \/>\ndefini\u00e7\u00e3o:<\/p>\n<p>Uma fun\u00e7\u00e3o $P$ cujo seu dom\u00ednio \u00e9 o espa\u00e7o amostral $\\varOmega$<br \/>\ndefinida sobre todos os eventos de $\\varOmega$(subconjuntos $A$)<br \/>\n\u00e9 chamada de probabilidade se:<br \/>\n<ol><li>$1\\leq P(A)\\leq1$, $\\forall A\\subset\\varOmega$ ;<\/li><li>$P(\\oslash)=0$ (pois $\\#\\oslash=0$), $P(\\varOmega)=1$;<\/li><li>Se $A$ e $B$ s\u00e3o eventos disjuntos$(A\\cap B=\\oslash)$, ent\u00e3o $P(A\\cup B)=P(A)+P(B)$.<\/li><\/ol>V\u00e1rias consequ\u00eancias \u00fateis seguem da defini\u00e7\u00e3o anterior, das quais<br \/>\ndestacamos algumas <span class=\"latex_em\">proposi\u00e7\u00f5es<\/span>:<br \/>\n<ol><li>Probabilidade Complementar: $P(A^{c})=1-P(A)$;<\/li><li>Se $A\\subset B$ ent\u00e3o $P(A)=P(B)-P(B-A)$;<\/li><li>Se $A\\cap B\\neq\\oslash$, ent\u00e3o, $P(A\\cup B)=P(A)+P(B)-P(A\\cap B)$;<\/li><\/ol>Para ilustrar a aplica\u00e7\u00e3o das defini\u00e7\u00f5es e proposi\u00e7\u00f5es listadas segue<br \/>\no exemplo: Um n\u00famero entre 1 a 50 \u00e9 escolhido aleatoriamente. Qual<br \/>\na probabilidade que ele seja divis\u00edvel por 5 ou par.<\/p>\n<p>Portanto,<\/p>\n<p>$P(div5)=$$\\frac{10}{50}=\\frac{1}{5}$;$P(par)=\\frac{25}{50}=\\frac{1}{2}$<br \/>\n; $P(div5\\cap par)=\\frac{5}{50}=\\frac{1}{10}$. Utilizando a proposi\u00e7\u00e3o<br \/>\n$(P3)$ temos,<\/p>\n<p>$P(div5\\cup par)=P(div5)+P(par)-P(div5\\cap par)=\\frac{1}{5}+\\frac{1}{2}-\\frac{1}{10}=\\frac{2+5-1}{10}=\\frac{6}{10}=0,6$.<\/p>\n<p><span class=\"latex_section\">2.&#x00A0;Vari\u00e1vel aleat\u00f3ria discreta<a id=\"sec:2\"><\/a><\/span>\n<\/p>\n<p>Quando o espa\u00e7o amostral $\\varOmega$ de um experimento n\u00e3o \u00e9 constitu\u00eddo<br \/>\npor n\u00famero reais, como por exemplo, o lan\u00e7amento de uma moeda $\\varOmega=\\{CARA,COROA\\}$,<br \/>\nas t\u00e9cnicas da Estat\u00edstica Descritiva n\u00e3o podem ser aplicadas diretamente.<br \/>\nPara que essas ferramentas possam ser utilizadas \u00e9 necess\u00e1rio estabelecer<br \/>\numa fun\u00e7\u00e3o que transforme o espa\u00e7o amostral n\u00e3o num\u00e9rico em um espa\u00e7o<br \/>\namostral num\u00e9rico. Este \u00e9 o objetivo de se definir uma <span class=\"latex_em\">vari\u00e1vel<br \/>\naleat\u00f3ria(VA).<\/span> Ainda no caso do lan\u00e7amento da moeda, se denotarmos<br \/>\na vari\u00e1vel aleat\u00f3ria $x$ como sendo $1$ para o resultado do lan\u00e7amento<br \/>\nCARA e $0$ para o caso que a face da moeda observada ap\u00f3s o lan\u00e7amento<br \/>\nseja COROA, nota-se que a vari\u00e1vel aleat\u00f3ria $x$ transformou o espa\u00e7o<br \/>\namostral $\\{CARA,COROA\\}$ para $\\{0,1\\}$.<\/p>\n<p>Uma outra forma de analisar a situa\u00e7\u00e3o segue da defini\u00e7\u00e3o: Associa-se<br \/>\num conjunto de valores para uma caracter\u00edstica (observ\u00e1vel) de uma<br \/>\ncole\u00e7\u00e3o de indiv\u00edduos (popula\u00e7\u00e3o) de interesse . Como consequ\u00eancia,<br \/>\nsegue de $(1)$ que $P(x=1)=P(x=0)=1\/2$. Onde $P(x)$ \u00e9 a fun\u00e7\u00e3o<br \/>\nde probabilidade associada a vari\u00e1vel aleat\u00f3ria $x$.<\/p>\n<p>Para se estudar a distribui\u00e7\u00e3o de frequ\u00eancias $f_{i}$ de uma sequ\u00eancia<br \/>\nde VA&#8217;s $x_{1},x_{2},x_{3},&#8230;,x_{n}$ independentes (ex. v\u00e1rios lan\u00e7amentos<br \/>\nde uma moeda), ou seja, a estat\u00edstica da amostra $x_{1},x_{2},x_{3},&#8230;,x_{n}$,<br \/>\nprocura-se caracterizar algumas medidas da distribui\u00e7\u00e3o.<\/p>\n<p>Grandezas \u00fateis :<\/p>\n<p>(i) Valor Esperado:<\/p>\n<p>\\begin{equation}<br \/>\nE(x)=\\sum x_{i}P(x_{i})<br \/>\n\\end{equation}<\/p>\n<p>(ii) M\u00e9dia:<\/p>\n<p>\\begin{equation}<br \/>\n&lt;x&gt; = \\frac{1}{n}(x_{1}+x_{2}+x_{3}+&#8230;,+x_{n})=\\frac{\\sum x_{i}f_{i}}{\\sum f_{i}}=\\frac{\\sum x_{i}f_{i}}{n}<br \/>\n\\end{equation}<\/p>\n<p>A vari\u00e2ncia pode ser calculada de modo mais r\u00e1pido pela simplifica\u00e7\u00e3o:<\/p>\n<p>\\begin{equation}<br \/>\n\\sigma^{2}(x)=E(x^{2})-[E(x)]^{2}<br \/>\n\\end{equation}<\/p>\n<p>(iv) Desvio Padr\u00e3o:<\/p>\n<p>\\begin{equation}<br \/>\nd(x)=\\sqrt{\\sigma^{2}(x)}<br \/>\n\\end{equation}<\/p>\n<p>(v) Erro Padr\u00e3o:<\/p>\n<p>\\begin{equation}<br \/>\nSE=\\frac{d(x)}{\\sqrt{n}}<br \/>\n\\end{equation}<\/p>\n<p>~<\/p>\n<p>a. Qual a diferen\u00e7a entre valor esperado e m\u00e9dia ?<\/p>\n<p>b. No lan\u00e7amento de dois dados de quatro lados que possuem valores<br \/>\nde 1 a 4 em suas faces, a vari\u00e1vel aleat\u00f3ria $x$ anota a soma dos<br \/>\npontos da face superior. Determine a m\u00e9dia, a vari\u00e2ncia e o desvio-padr\u00e3o<br \/>\nda vari\u00e1vel aleat\u00f3ria $x$. Esboce o gr\u00e1fico de $P(x)$.<\/p>\n<p><span class=\"latex_section\">3.&#x00A0;Vari\u00e1vel aleat\u00f3ria cont\u00ednua:<a id=\"sec:3\"><\/a><\/span>\n<\/p>\n<p>Grandezas \u00fateis :<\/p>\n<p>(i) Densidade de probabilidade:<\/p>\n<p>$\\rho(x)\\geq0$ e $\\int_{-\\infty}^{\\infty}\\rho(x)dx=1$.<\/p>\n<p>(ii) M\u00e9dia:<\/p>\n<p>$&lt;x&gt;=\\int x\\rho(x)dx$<\/p>\n<p>(iii) Distribui\u00e7\u00e3o acumulada:<\/p>\n<p>$F(x)=\\int_{-\\infty}^{x}\\rho(y)dy$<\/p>\n<p>(iv) Distribui\u00e7\u00e3o acumulada complementar: probabilidade de um valor<br \/>\nser maior ou igual a $x$.<\/p>\n<p>$F'(x)=\\int_{x}^{\\infty}\\rho(y)dy$<\/p>\n<p>~<\/p>\n<p>c. Dada a vari\u00e1vel aleat\u00f3ria $x$ com densidade de probabilidade constante<br \/>\n$\\frac{1}{b-a}$ onde $x\\epsilon[a,b].$ Se $y=K+x$, calcule $$<br \/>\npara $K$ constante.<\/p>\n<p>d. Alguns modelos em econof\u00edsica prop\u00f5e que distribui\u00e7\u00e3o de renda<br \/>\n$m$ de uma dada popula\u00e7\u00e3o seja dividida em duas classes: os mais<br \/>\nricos seguiriam uma distribui\u00e7\u00e3o do tipo Pareto e, o resto da popula\u00e7\u00e3o<br \/>\numa distribui\u00e7\u00e3o do tipo Gibbs-Boltzmann como pode ser visto na figura<br \/>\na seguir:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-medium wp-image-104\" src=\"http:\/\/meantrix.com\/blog\/wp-content\/uploads\/2020\/01\/siciliani19-300x158.png\" alt=\"\" width=\"300\" height=\"158\" srcset=\"https:\/\/meantrix.com\/blog\/wp-content\/uploads\/2020\/01\/siciliani19-300x158.png 300w, https:\/\/meantrix.com\/blog\/wp-content\/uploads\/2020\/01\/siciliani19-768x405.png 768w, https:\/\/meantrix.com\/blog\/wp-content\/uploads\/2020\/01\/siciliani19.png 823w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/p>\n<p>De forma geral escrevemos:<\/p>\n<p>$P(m)=\\frac{1}{T}\\theta(m_{l}-m)\\exp(-m\/T)+\\frac{A\\theta(m-m_{l})}{m^{(1+\\alpha)}}$<\/p>\n<p>onde $T$ representa a renda m\u00e9dia $,$ $m_{l}$ o valor de corte<br \/>\nentre as distribu\u00e7\u00f5es, $\\alpha$ \u00e9 conhecido como expoente de Pareto<br \/>\ne $A$ \u00e9 simplesmente uma constante.<\/p>\n<p>d.1. Reconhecendo que na grande maioria dos casos $\\alpha\\sim1.5$<br \/>\ne que $\\frac{m_{l}}{T}\\gg1$, obtenha a express\u00e3o para distribui\u00e7\u00e3o<br \/>\nacumulada complementar da vari\u00e1vel aleat\u00f3ria $m$ e interprete seu<br \/>\nresultado.<\/p>\n<p>d.2. Se 5% da popula\u00e7\u00e3o segue a distribui\u00e7\u00e3o de Pareto (mais ricos)<br \/>\ne a renda m\u00e9dia da popula\u00e7\u00e3o \u00e9 de $1650R\\$$ obtenha para essa situa\u00e7\u00e3o<br \/>\no valor de $m_{l}$.<\/p>\n<p><span class=\"latex_section\">4.&#x00A0;Momentos de uma distribui\u00e7\u00e3o:<a id=\"sec:4\"><\/a><\/span>\n<\/p>\n<p>$\\mu_{n}=&lt;x^{n}&gt;=\\int x^{n}\\rho(x)dx$&lt;\/x^{n}&gt;<\/p>\n<p>onde:<\/p>\n<p>$\\mu_{1}=$ e $\\mu_{2}-\\mu_{1}^{2}=$$\\sigma^{2}(x)$.<\/p>\n<p>~<\/p>\n<p>e. Derive para a distribui\u00e7\u00e3o Gaussiana uma regra geral para seus<br \/>\nmomentos.<\/p>\n<p><span class=\"latex_section\">5.&#x00A0;Fun\u00e7\u00e3o caracter\u00edstica:<a id=\"sec:5\"><\/a><\/span>\n<\/p>\n<p>Calculada a partir da transformada de Fourier (discreta\/ cont\u00ednua)<br \/>\nda vari\u00e1vel aleat\u00f3ria $x$.<\/p>\n<p>$G(k)=\\int\\rho(x)exp(ikx)dx=&lt;exp(ikx)&gt;$<\/p>\n<p>~<\/p>\n<p>f. Derive a aproxima\u00e7\u00e3o $g(k)=1+\\sum_{n=1}^{\\infty}$$\\frac{(ik)^{n}}{n!}\\mu_{n}$<br \/>\n( Se $g(k)$ n\u00e3o possu\u00ed desenvolvimento em s\u00e9rie de Taylor, ent\u00e3o,<br \/>\n$\\rho(x)$ n\u00e3o possu\u00ed momentos).<\/p>\n<p>g. Tome o logaritmo da express\u00e3o anterior redefinindo $ln(g(k))=\\sum\\frac{(ik)^{n}}{n!}\\kappa_{n}$,<br \/>\nonde $\\kappa_{n}$ s\u00e3o os cumulantes da distribui\u00e7\u00e3o. Ap\u00f3s, encontre<br \/>\nas rela\u00e7\u00f5es entre os cumulantes e momentos para $n=1,2$.<\/p>\n<p>h. Calcule a fun\u00e7\u00e3o caracter\u00edstica para a distribui\u00e7\u00e3o de probabilidade<br \/>\nLorentziana.<\/p>\n<p><span class=\"latex_section\">6.&#x00A0;Mudan\u00e7a de Vari\u00e1vel:<a id=\"sec:6\"><\/a><\/span>\n<\/p>\n<p>Se $x$ e $y$ s\u00e3o vari\u00e1veis aleat\u00f3rias onde $y=f(x)$ e $\\rho(x)$<br \/>\n\u00e9 a densidade de probabilidade associada a $x$, ent\u00e3o:<\/p>\n<p>$\\varrho(y)=\\int\\delta(y-f(x))\\rho(x)dx$<\/p>\n<p>e para intervalos infinitesimais:<\/p>\n<p>$\\varrho(y)=\\sum_{n}\\rho(x^{n})\\shortmid\\frac{dx^{n}}{dy}\\shortmid$<br \/>\n, onde $n$ representa o n\u00famero de intervalos infinitesimais da VA<br \/>\n$x$ que se mapeiam no intervalo $\\triangle y$ de interesse.<\/p>\n<p>i. Se $y=x^{2}-1$ e $\\rho(x)=\\lambda exp(-\\lambda x)$ obtenha a<br \/>\ndensidade de probabilidade $\\rho(y)$ verificando a equival\u00eancia entre<br \/>\nas 2 maneiras propostas para a realiza\u00e7\u00e3o da mudan\u00e7a de vari\u00e1vel.<\/p>\n<p><span class=\"latex_section\">7.&#x00A0;Distribui\u00e7\u00e3o conjunta:<a id=\"sec:7\"><\/a><\/span>\n<\/p>\n<p>a densidade conjunta deve respeitar as seguintes condi\u00e7\u00f5es:<\/p>\n<p>$\\int\\rho(x,y)dxdy=1$ e $\\rho(x,y)\\geq0$<\/p>\n<p>a partir delas pode-se obter as densidades marginais:<\/p>\n<p>$\\rho_{1}(x)=\\int\\rho(x,y)dy$; $\\rho_{2}(y)=\\int\\rho(x,y)dx$;<\/p>\n<p>Se $\\rho(x,y)=\\rho_{1}(x)\\rho_{2}(y)$ ent\u00e3o $=$ o que<br \/>\nsignifica dizer que n\u00e3o h\u00e1 correla\u00e7\u00e3o entre as vari\u00e1veis.<\/p>\n<p>~<\/p>\n<p>j. Dada a distribui\u00e7\u00e3o de velocidades de Maxwell $\\rho(x,y,z)=(\\frac{\\beta m}{2\\pi})^{3\/2}exp(-\\beta m(v_{x}^{2}+v_{y}^{2}+v_{z}^{2})\/2)$<br \/>\na partir da rela\u00e7\u00e3o $\\rho_{e}(E)dE=\\rho_{v}(v)dv$ calcule $\\rho_{e}(E)$.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>1.&#x00A0;Probabilidade A Teoria da Probabilidade desenvolve modelos para tratar de experimentos que quando s\u00e3o repetidos, geralmente, produzem resultados diferentes. Esses s\u00e3o chamados de experimentos aleat\u00f3rios ou fen\u00f4menos aleat\u00f3rios. Dado um experimento aleat\u00f3rio, diz-se que seu espa\u00e7o amostral $\\Omega$ \u00e9 o conjunto formado por todos os resultados poss\u00edveis do experimento aleat\u00f3rio. Em uma defini\u00e7\u00e3o menos formal [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":56,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[5],"tags":[18,7,17],"class_list":["post-95","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-estatistica","tag-distribuicao","tag-probabilidade","tag-variavel-aleatoria"],"_links":{"self":[{"href":"https:\/\/meantrix.com\/blog\/wp-json\/wp\/v2\/posts\/95"}],"collection":[{"href":"https:\/\/meantrix.com\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/meantrix.com\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/meantrix.com\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/meantrix.com\/blog\/wp-json\/wp\/v2\/comments?post=95"}],"version-history":[{"count":22,"href":"https:\/\/meantrix.com\/blog\/wp-json\/wp\/v2\/posts\/95\/revisions"}],"predecessor-version":[{"id":172,"href":"https:\/\/meantrix.com\/blog\/wp-json\/wp\/v2\/posts\/95\/revisions\/172"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/meantrix.com\/blog\/wp-json\/wp\/v2\/media\/56"}],"wp:attachment":[{"href":"https:\/\/meantrix.com\/blog\/wp-json\/wp\/v2\/media?parent=95"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/meantrix.com\/blog\/wp-json\/wp\/v2\/categories?post=95"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/meantrix.com\/blog\/wp-json\/wp\/v2\/tags?post=95"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}