

{"id":22,"date":"2020-01-10T16:38:49","date_gmt":"2020-01-10T18:38:49","guid":{"rendered":"http:\/\/meantrix.com\/blog\/?p=22"},"modified":"2020-02-21T20:58:57","modified_gmt":"2020-02-21T23:58:57","slug":"matematica-para-ciencia-de-dados","status":"publish","type":"post","link":"https:\/\/meantrix.com\/blog\/2020\/01\/10\/matematica-para-ciencia-de-dados\/","title":{"rendered":"Matem\u00e1tica para Ci\u00eancia de Dados"},"content":{"rendered":"<p style=\"text-align: left;\">A Ci\u00eancia de Dados pode ser entendida como &#8220;Arte&#8221; de se extrair informa\u00e7\u00f5es relevantes de um conjunto de dados. Nesse processo de extra\u00e7\u00e3o das informa\u00e7\u00f5es, uma classe muito importante de t\u00e9cnicas, al\u00e9m de visualiza\u00e7\u00f5es e explora\u00e7\u00e3o, \u00e9 a matem\u00e1tica. <!--more--> Conhecer o significado dos conceitos matem\u00e1ticos empregados nos modelos de Aprendizagem de M\u00e1quina e n\u00e3o encar\u00e1-los como meras caixas-pretas, potencializa de maneira significativa o trabalho de um cientista de dados. Quando em um projeto n\u00e3o houverem &#8220;receitas prontas&#8221; para a sua solu\u00e7\u00e3o, adapta\u00e7\u00f5es ou at\u00e9 mesmo reformula\u00e7\u00f5es nas metodologias usuais ser\u00e3o necess\u00e1rias. Para isso, como primeiro passo \u00e9 preciso entender que todos os modelos est\u00e3o fundamentados em conceitos matem\u00e1ticos e at\u00e9 mesmo f\u00edsicos (<a href=\"https:\/\/link.springer.com\/article\/10.1007\/s10955-017-1836-5\">artigo interessante<\/a>). Uma vez aceita essa, talvez para muitos, penosa verdade, estudar matem\u00e1tica para um cientista de dados passa a ser t\u00e3o importante quanto dominar as linguagens de programa\u00e7\u00e3o.<\/p>\n<p style=\"text-align: left;\">Assim, daremos in\u00edcio a um conjunto de posts relacionados aos princ\u00edpios b\u00e1sicos da Estat\u00edstica. Esse material representa um conjunto de resumos produzidos para alunos em disciplinas formais, ent\u00e3o, sinta-se a vontade para sugerir melhorias ou corre\u00e7\u00f5es.<\/p>\n<p style=\"text-align: left;\"><span class=\"latex_subsection\">0.1.&#x00A0;Princ\u00edpios de Contagem<a id=\"sec:0.1\"><\/a><\/span>\n<\/p>\n<p style=\"text-align: left;\">T\u00e9cnicas de contagem buscam determinar o n\u00famero de elementos de um conjunto qualquer $A$. Para isso, destacam-se os princ\u00edpios da adi\u00e7\u00e3o e multiplica\u00e7\u00e3o.<br><ul><br><li>Principio da Adi\u00e7\u00e3o: Se $A$ \u00e9 um conjunto com $p$ elementos e $B$ \u00e9 um conjunto com com $q$ elementos, onde $A\\cap B$=$\\oslash$. O conjunto $A\\cup B$ possu\u00ed $p+q$ elementos.<br><\/li><li>Principio da Multiplica\u00e7\u00e3o: Se uma decis\u00e3o $D1$ pode ser tomada de $x$ maneiras diferentes e uma vez tomada, outra decis\u00e3o $D2$ pode ser feita de $y$ maneiras diferentes. Ent\u00e3o, o n\u00famero de maneiras de se tomar $D1$e $D2$ decis\u00f5es \u00e9 $xy$.<br><\/li><\/ul>\n<p style=\"text-align: left;\"><span class=\"latex_subsubsection\">0.1.1.&#x00A0;Permuta\u00e7\u00e3o<a id=\"sec:0.1.1\"><\/a><\/span><\/p>\n<p style=\"text-align: left;\">Permutar significa trocar. Num sentido mais simples dizemos que todos os elementos do conjunto $A=\\{a_{0},a_{1},&#8230;,a_{n}\\}$ devem ser utilizados em todas as trocas poss\u00edveis. Assim, uma \\textbf{ permuta\u00e7\u00e3o simples} representa o n\u00famero de maneiras poss\u00edveis de se <span class=\"latex_em\">ordenar<\/span> $n$ objetos de um conjunto $\\{a_{0},a_{1},&#8230;,a_{n}\\}$ com elementos distingu\u00edveis.<\/p>\n<p style=\"text-align: left;\">\\begin{equation}<br>P_{n}=n!<br>\\end{equation}<\/p>\n<p style=\"text-align: left;\">quando h\u00e1\\textbf{ repeti\u00e7\u00e3o} de objetos, isto implica que alguns elementos ser\u00e3o id\u00eanticos e portanto indistingu\u00edveis.<\/p>\n<p style=\"text-align: left;\">\\begin{equation}<br>P_{n}^{b_{0},b_{1},&#8230;}=\\frac{n!}{b_{0}!b_{1}!&#8230;}<br>\\end{equation}<\/p>\n<p style=\"text-align: left;\">onde $b_{n}$ representa o n\u00famero de vezes que o elemento $a_{n}$ se repete .<\/p>\n<p style=\"text-align: left;\">Exemplo: Quantos anagramas podem ser formados com a palavra BANANA?<br>$P_{6}^{3,2}=\\frac{6!}{3!2!}=60$.<\/p>\n<p style=\"text-align: left;\">Um outro tipo de permuta\u00e7\u00e3o \u00e9 a \\textbf{permuta\u00e7\u00e3o c\u00edclica }onde $n$ objetos distintos s\u00e3o ordenados em uma sequ\u00eancia c\u00edclica de $n$ lugares. Nesse caso, os agrupamentos ser\u00e3o distintos somente se houver altera\u00e7\u00e3o na posi\u00e7\u00e3o relativa dos elementos entre si. Para ilustrar, com 4 crian\u00e7as poder\u00edamos formar $3!=6$ rodas de ciranda. Uma vez que h\u00e1 1 modo de colocar a 1$^{a}$ crian\u00e7a na roda (\u00fanico objeto no ciclo), 1 modo tamb\u00e9m de se colocar a 2$^{a}$ crian\u00e7a (o que importa \u00e9 a posi\u00e7\u00e3o relativa entre os objetos,i.e., $1-2\\leftrightarrow2-1$) , 2 modos de se colocar a 3$^{a}$ crian\u00e7a na roda (1-3-2 ou 3-1-2$\\leftrightarrow$1-2-3) e 3 modos de se colocar a 4$^{a}$ crian\u00e7a na roda ($1-2-3-4\\leftrightarrow4-1-2-3,1-4-2-3,1-2 4-2$).<br>Ent\u00e3o h\u00e1 $n-1$ maneiras de se colocar o <span class=\"latex_em\">n-\u00e9simo<\/span> objeto na sequ\u00eancia c\u00edclica.<\/p>\n<p style=\"text-align: left;\">\\begin{equation}<br>(PC)_{n}=(n-1)!<br>\\end{equation}<\/p>\n<p style=\"text-align: left;\"><span class=\"latex_subsubsection\">0.1.2.&#x00A0;Combina\u00e7\u00e3o <a id=\"sec:0.1.2\"><\/a><\/span><\/p>\n<p style=\"text-align: left;\">Enquanto que na permuta\u00e7\u00e3o a ordena\u00e7\u00e3o dos elementos caracteriza-se como o principal aspecto, na combina\u00e7\u00e3o a ordem dos elementos distintos que formar\u00e3o os agrupamentos n\u00e3o importa. Isto posto, em uma \\textbf{combina\u00e7\u00e3o simples} descobrir o n\u00famero de maneiras que podemos escolher $p$ elementos distintos entre $n$ poss\u00edveis \u00e9 o mesmo que descobrir quantos subconjuntos podemos formar contendo $p$ elementos a partir do conjunto $\\{a_{0},a_{1},&#8230;,a_{n}\\}$ que contem $n$. elementos.<\/p>\n<p style=\"text-align: left;\">\\begin{equation}<br>C_{n}^{p}=\\frac{n!}{p!(n-p)!}<br>\\end{equation}<\/p>\n<p style=\"text-align: left;\"><span class=\"latex_section\">1.&#x00A0;N\u00fameros Binomiais, Probabilidade e Passeio Aleat\u00f3rio<a id=\"sec:1\"><\/a><\/span>\n<\/p>\n<p style=\"text-align: left;\"><span class=\"latex_subsection\">1.1.&#x00A0;O Tri\u00e2ngulo de Pascal<a id=\"sec:1.1\"><\/a><\/span>\n<\/p>\n<p style=\"text-align: left;\">O tri\u00e2ngulo de Pascal \u00e9 um tri\u00e2ngulo infinito formado pelo conjunto de coeficientes binomiais $C_{n}^{p}$ , ou equivalentemente, \\begin{pmatrix}n\\\\p\\end{pmatrix}<span style=\"font-size: inherit;\">&nbsp;,<\/span>dados pela equa\u00e7\u00e3o $(4)$ onde cada elemento \u00e9 disposto na linha $n$ e coluna $p$ com $n&gt;p:$<\/p>\n<p style=\"text-align: left;\">\n<\/p><p style=\"text-align: left;\">$\\begin{array}{ccccc}<br>C_{0}^{0}\\\\<br>C_{1}^{0} &amp; C_{1}^{1}\\\\<br>C_{2}^{0} &amp; C_{2}^{1} &amp; C_{2}^{2}\\\\<br>C_{3}^{0} &amp; C_{3}^{1} &amp; C_{3}^{2} &amp; C_{3}^{3}\\\\<br>C_{4}^{0} &amp; C_{4}^{1} &amp; C_{4}^{2} &amp; C_{4}^{3} &amp; C_{4}^{4}<br>\\end{array}$$\\longleftrightarrow\\begin{array}{ccccc}<br>1\\\\<br>1 &amp; 1\\\\<br>1 &amp; 2 &amp; 1\\\\<br>1 &amp; 3 &amp; 3 &amp; 1\\\\<br>1 &amp; 4 &amp; 6 &amp; 4 &amp; 1<br>\\end{array}$<\/p>\n<p style=\"text-align: left;\">\n<\/p><p style=\"text-align: left;\">H\u00e1 algumas propriedades importantes dos n\u00fameros binomais que permitem a constru\u00e7\u00e3o do tri\u00e2ngulo de Pascal sem que todas as combinat\u00f3rias sejam calculadas<span class=\"latex_em\">: <\/span><br><ol><br><li>Rela\u00e7\u00e3o de Stifel:<br>\\begin{equation}<br>C_{n+1}^{p+1}=C_{n}^{p}+C_{n}^{p+1}<br>\\end{equation}<br><\/li><li>Rela\u00e7\u00e3o das Combina\u00e7\u00f5es Complementares:<br>\\begin{equation}<br>C_{n}^{p}=C_{n}^{n-p}<br>\\end{equation}<br>para $n$ inteiro e n\u00e3o-negativo.<br><\/li><li>Teorema das Linhas:<\/p>\n<p style=\"text-align: left;\">\\begin{equation}<br>C_{n}^{0}+C_{n}^{1}+C_{n}^{2}+&#8230;+C_{n}^{n}=2^{n}<br>\\end{equation}<\/p>\n<p style=\"text-align: left;\"><\/li><li>Teorema das Colunas<br>\\begin{equation}<br>C_{p}^{p}+C_{p+1}^{p}+C_{p+2}^{p}+&#8230;=C_{n+p}^{p}=C_{p+n+1}^{p+1}<br>\\end{equation}<br><\/li><\/ol>\n<p style=\"text-align: left;\"><span class=\"latex_subsubsection\">1.1.1.&#x00A0;Aplica\u00e7\u00f5es <a id=\"sec:1.1.1\"><\/a><\/span><\/p>\n<p style=\"text-align: left;\">Uma utilidade dos teoremas acima listados est\u00e1 relacionada a sua aplica\u00e7\u00e3o na an\u00e1lise da converg\u00eancia de somas que envolvam coeficientes binomiais.<\/p>\n<p style=\"text-align: left;\">Exemplo: Calcule a soma $S=\\sum_{k=1}^{n}2.1^{2}+5.2^{2}+&#8230;+(3n-1).n^{2}$<\/p>\n<p style=\"text-align: left;\">$3k^{3}-k^{2}=Ak(k+1)(k+2)+Bk(k+1)+Ck+D$<\/p>\n<p style=\"text-align: left;\">$S=\\frac{(n+1)n(9n^{2}+5n-2)}{12}$<\/p>\n<p style=\"text-align: left;\"><span class=\"latex_subsection\">1.2.&#x00A0;O bin\u00f4mio de Newton<a id=\"sec:1.2\"><\/a><\/span>\n<\/p>\n<p style=\"text-align: left;\">Pela simples regra dos produtos not\u00e1veis podemos escrever $(a+b)^{2}=a^{2}+2ab+b^{2}$,<br>ou ainda, $(a+b)^{3}=a^{3}+3a^{2}b+3ab^{2}+b^{3}$. Como generaliza\u00e7\u00e3o, para o desenvolvimento dos bin\u00f4mios $(a+b)^{n}$ utilizamos o m\u00e9todo do bin\u00f4mio de Newton:<\/p>\n<p style=\"text-align: left;\">\\begin{equation}<br>(x+a)^{n}=\\sum_{k=0}^{n}(\\begin{array}{c}<br>n\\\\<br>k<br>\\end{array})a^{k}x^{n-k}<br>\\end{equation}<\/p>\n<p style=\"text-align: left;\">onde facilmente verifica-se para $n=2$:<\/p>\n<p style=\"text-align: left;\">$\\begin{array}{c}<br>(x+a)^{2}=(\\begin{array}{c}<br>2\\\\<br>0<br>\\end{array})a^{0}x^{2-0}+(\\begin{array}{c}<br>2\\\\<br>1<br>\\end{array})a^{1}x^{2-1}+(\\begin{array}{c}<br>2\\\\<br>2<br>\\end{array})a^{2}x^{2-2}=\\\\<br>=1x^{2}+2ax+a^{2}<br>\\end{array}$<\/p>\n<p style=\"text-align: left;\">Doutro modo, observe que:<br><ol><br><li>O desenvolvimento de $(x+a)^{n}$ possui $n+1$ termos.<br><\/li><li>Os coeficientes do desenvolvimento de $(x+a)^{n}$ s\u00e3o os elementos da linha $n$ do Tri\u00e2ngulo de Pascal.<br><\/li><li>Em ordem decrescente segundo as pot\u00eancias de $x$ o termo geral de ordem $k+1$ (posi\u00e7\u00e3o) \u00e9 :<br><\/li><\/ol><br>\\begin{equation}<br>T_{k+1}=(\\begin{array}{c}<br>n\\\\<br>k<br>\\end{array})a^{k}x^{n-k}<br>\\end{equation}<\/p>\n<p style=\"text-align: left;\">Como exemplo, para a express\u00e3o $(x+1)^{10}$ o termo em $x^{4}$ ser\u00e1 obtido a partir de $(10)$ da seguinte maneira:<\/p>\n<p style=\"text-align: left;\">$T_{k+1}=(\\begin{array}{c}<br>10\\\\<br>k<br>\\end{array})1^{k}x^{10-k}$ e para obtermos $x^{4}\\rightarrow k=6$, e ent\u00e3o:<\/p>\n<p style=\"text-align: left;\">$T_{7}=(\\begin{array}{c}<br>10\\\\<br>6<br>\\end{array})1^{6}x^{4}=210x^{4}$.<\/p>\n<p style=\"text-align: left;\"><span class=\"latex_subsection\">1.3.&#x00A0;Refer\u00eancias<a id=\"sec:1.3\"><\/a><\/span>\n<\/p>\n<p style=\"text-align: left;\">MORGADO, A.C.O. et. al. &#8212; An\u00e1lise Combinat\u00f3ria e Probabilidade.<br>SBM, 2016.<\/p>\n<p style=\"text-align: left;\">SALINAS,S.R.A. &#8212; Introdu\u00e7\u00e3o \u00e0 F\u00edsica Estat\u00edstica. EDUSP, 2013.<\/p>\n<p style=\"text-align: left;\"><\/p>\n\n\n \n","protected":false},"excerpt":{"rendered":"<p>A Ci\u00eancia de Dados pode ser entendida como &#8220;Arte&#8221; de se extrair informa\u00e7\u00f5es relevantes de um conjunto de dados. Nesse processo de extra\u00e7\u00e3o das informa\u00e7\u00f5es, uma classe muito importante de t\u00e9cnicas, al\u00e9m de visualiza\u00e7\u00f5es e explora\u00e7\u00e3o, \u00e9 a matem\u00e1tica.<\/p>\n","protected":false},"author":2,"featured_media":56,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[5],"tags":[14,16,12,11,15,13],"class_list":["post-22","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-estatistica","tag-combinacao","tag-contagem","tag-estatistica","tag-matematica","tag-pascal","tag-permutacao"],"_links":{"self":[{"href":"https:\/\/meantrix.com\/blog\/wp-json\/wp\/v2\/posts\/22"}],"collection":[{"href":"https:\/\/meantrix.com\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/meantrix.com\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/meantrix.com\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/meantrix.com\/blog\/wp-json\/wp\/v2\/comments?post=22"}],"version-history":[{"count":30,"href":"https:\/\/meantrix.com\/blog\/wp-json\/wp\/v2\/posts\/22\/revisions"}],"predecessor-version":[{"id":171,"href":"https:\/\/meantrix.com\/blog\/wp-json\/wp\/v2\/posts\/22\/revisions\/171"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/meantrix.com\/blog\/wp-json\/wp\/v2\/media\/56"}],"wp:attachment":[{"href":"https:\/\/meantrix.com\/blog\/wp-json\/wp\/v2\/media?parent=22"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/meantrix.com\/blog\/wp-json\/wp\/v2\/categories?post=22"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/meantrix.com\/blog\/wp-json\/wp\/v2\/tags?post=22"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}