ESTATISTICA 1

45 Pages • 9,128 Words • PDF • 274.3 KB
Uploaded at 2021-09-24 12:01

This document was submitted by our user and they confirm that they have the consent to share it. Assuming that you are writer or own the copyright of this document, report to us by using this DMCA report button.


Estatística Autor: Prof. Alan Rodrigo Navia Colaboradores: Profa. Silmara Maria Machado Prof. Nonato Assis de Miranda Profa. Ana Carolina Bueno Borges

Professor conteudista: Alan Rodrigo Navia Alan Rodrigo Navia é natural de São Paulo e morador de Taboão da Serra. É graduado em Materiais, Processos e Componentes Eletrônicos pela Fatec-SP. Possui mestrado em Engenharia Eletrônica pela Poli-USP, na área de Circuitos Integrados. Exerceu as seguintes funções no mercado de trabalho: pesquisador em Engenharia na Swiss Group, analista estatístico na Amcham, especialista em sistemas pleno no Carrefour e atualmente é coordenador de sistemas no Grupo Renac. Academicamente, lecionou na Fundação Santo André no curso de Engenharia, foi auxiliar docente do curso de Engenharia Eletrônica na Poli-USP e leciona há quase dez anos na Unip. Principais disciplinas de atuação: Estatística, Banco de Dados, Programação de Computadores e Matemática, para diversos cursos de graduação. Este material foi escrito com base nos vários anos de docência em Estatística, para cursos que não são da área de Exatas.

Dados Internacionais de Catalogação na Publicação (CIP) F325e

Navia, Alan Rodrigo Estatística / Alan Rodrigo Navia. – São Paulo: Editora Sol, 2013. 80 p., il. Notas: este volume está publicado nos Cadernos de Estudos e Pesquisas da UNIP, Série Didática, ano XVII, n. 2-045/13, ISSN 1517-9230 1. Estatística. 2. Pedagogia. 3. Serviço Social. I. Título. CDU 519.2 A - XIX

© Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ou quaisquer meios (eletrônico, incluindo fotocópia e gravação) ou arquivada em qualquer sistema ou banco de dados sem permissão escrita da Universidade Paulista.

Prof. Dr. João Carlos Di Genio Reitor

Prof. Fábio Romeu de Carvalho Vice-Reitor de Planejamento, Administração e Finanças

Profa. Melânia Dalla Torre Vice-Reitora de Unidades Universitárias

Prof. Dr. Yugo Okida Vice-Reitor de Pós-Graduação e Pesquisa

Profa. Dra. Marília Ancona-Lopez Vice-Reitora de Graduação

Unip Interativa – EaD Profa. Elisabete Brihy Prof. Marcelo Souza Prof. Dr. Luiz Felipe Scabar Prof. Ivan Daliberto Frugoli



Material Didático – EaD

Comissão editorial: Dra. Angélica L. Carlini (UNIP) Dra. Divane Alves da Silva (UNIP) Dr. Ivan Dias da Motta (CESUMAR) Dra. Kátia Mosorov Alonso (UFMT) Dra. Valéria de Carvalho (UNIP) Apoio: Profa. Cláudia Regina Baptista – EaD Profa. Betisa Malaman – Comissão de Qualificação e Avaliação de Cursos Projeto gráfico: Prof. Alexandre Ponzetto Revisão: Juliana Maria Mendes Amanda Casale

Sumário Estatística APRESENTAÇÃO.......................................................................................................................................................7 INTRODUÇÃO............................................................................................................................................................7 Unidade I

1 CONCEITOS FUNDAMENTAIS..........................................................................................................................9 1.1 Conceitos iniciais......................................................................................................................................9 1.2 Dados.......................................................................................................................................................... 10 1.3 População x amostra.............................................................................................................................11 1.4 Amostragem ............................................................................................................................................11 2 DISTRIBUIÇÃO DE FREQUÊNCIAS.............................................................................................................. 14 2.1 Conceitos básicos.................................................................................................................................. 14 2.2 Elementos de uma distribuição de frequência.......................................................................... 18 2.2.1 Classe (i)....................................................................................................................................................... 18 2.2.2 Limites de classe (li e Li)........................................................................................................................ 18 2.2.3 Amplitude de classe (hi)........................................................................................................................ 18 2.2.4 Amplitude amostral (AA)...................................................................................................................... 18 2.2.5 Ponto médio de classe (xi).................................................................................................................... 19

2.3 Tipos de frequências............................................................................................................................. 19 2.3.1 Frequência absoluta ou simples (fi).................................................................................................. 19 2.3.2 Frequência relativa (fri)......................................................................................................................... 19 2.3.3 Frequência acumulada (Fi)................................................................................................................... 20

2.4 Construção de distribuições de frequências.............................................................................. 21 2.4.1 Distribuição sem intervalo................................................................................................................... 21 2.4.2 Distribuição com intervalo................................................................................................................... 21

2.5 Representações gráficas..................................................................................................................... 24 2.5.1 Histograma (gráfico de colunas) ...................................................................................................... 24 2.5.2 Polígono de frequências (gráfico cartesiano) ............................................................................. 24

3 MEDIDAS DE TENDÊNCIA CENTRAL.......................................................................................................... 25 3.1 Média (x)................................................................................................................................................... 25 3.1.1 Dados não agrupados............................................................................................................................ 25 3.1.2 Distribuição de frequências sem intervalo.................................................................................... 26 3.1.3 Distribuição de frequências com intervalo................................................................................... 26

3.2 Moda (Mo)................................................................................................................................................ 28 3.2.1 Dados não agrupados............................................................................................................................ 28 3.2.2 Distribuição de frequências sem intervalo.................................................................................... 29 3.2.3 Distribuição de frequências com intervalo................................................................................... 29

3.3 Mediana (Md).......................................................................................................................................... 30 3.3.1 Dados não agrupados............................................................................................................................ 31 3.3.2 Distribuição de frequências sem intervalo.................................................................................... 31 3.3.3 Distribuição de frequências com intervalo................................................................................... 32

4 MEDIDAS DE DISPERSÃO.............................................................................................................................. 34 4.1 Introdução................................................................................................................................................ 34 4.2 Variância (s2)............................................................................................................................................ 35 4.2.1 Dados não agrupados............................................................................................................................ 35 4.2.2 Distribuição de frequências sem intervalo.................................................................................... 36 4.2.3 Distribuição de frequências com intervalo................................................................................... 37

4.3 Desvio-padrão (s).................................................................................................................................. 38 4.3.1 Dados não agrupados............................................................................................................................ 39 4.3.2 Distribuição de frequências sem intervalo.................................................................................... 39 4.3.3 Distribuição de frequências com intervalo................................................................................... 40

4.4 Coeficiente de variação (CV)............................................................................................................. 40 Unidade II

5 CONCEITOS BÁSICOS DE PROBABILIDADE............................................................................................. 46 5.1 Conceitos fundamentais.................................................................................................................... 46 5.2 Eventos complementares .................................................................................................................. 50 5.3 Eventos independentes....................................................................................................................... 51 5.4 Eventos mutuamente exclusivos.................................................................................................... 52 5.4.1 Exercício resolvido................................................................................................................................... 54

6 DISTRIBUIÇÃO NORMAL DE PROBABILIDADES.................................................................................... 56 6.1 Conceitos fundamentais.................................................................................................................... 56 6.1.1 Exercícios resolvidos............................................................................................................................... 61

7 CORRELAÇÃO LINEAR..................................................................................................................................... 66 7.1 Conceitos e diagrama de dispersão............................................................................................... 66 8 COEFICIENTE DE PEARSON........................................................................................................................... 68

APRESENTAÇÃO

Este livro-texto contempla os temas fundamentais para um curso de Introdução à Estatística, que na maioria das instituições de ensino superior ou técnico tem duração semestral. A grande quantidade de exercícios de fixação e a preocupação em explicar os métodos de cálculo, passo a passo, sem excesso de texto, são os pontos marcantes deste material, que tem como objetivo ensinar os conceitos básicos de Estatística para um público que não lida diariamente e/ou tem pouca desenvoltura com a Matemática. O pré-requisito para acompanhar esta obra é somente a Matemática do primeiro grau, atualmente chamado de Ensino Fundamental, o que atende principalmente aos cursos que não são de Exatas, pois nestes a Matemática é exercitada a todo o momento, nas mais diversas disciplinas, tais como Física, Cálculo, Programação de Computadores etc. Espero que esta obra ajude o leitor a compreender os conceitos básicos de Estatística de maneira mais leve, porém bastante consistente. INTRODUÇÃO

Este livro-texto aborda os assuntos fundamentais da Estatística, desde o estudo de uma variável até a introdução ao estudo do comportamento mútuo de duas variáveis. A Unidade I cobre os conceitos introdutórios, porém importantíssimos para o entendimento do restante do material, a organização de dados em tabelas de frequência, a obtenção de medidas de tendência e posição e a determinação de medidas de dispersão e variabilidade. Esses tópicos fazem parte da Estatística Descritiva (responsável por organizar e descrever os dados coletados). A Unidade II cobre os conceitos de probabilidade simples (que também são abordados na disciplina Matemática), distribuição normal de probabilidades e a determinação da correlação entre duas variáveis, por meio do diagrama de dispersão e do coeficiente de Pearson. Cada unidade pode ser ministrada em um bimestre, se o curso introdutório de Estatística for de duas horas-aula semanais. Vale lembrar que o material tem como leitor-alvo o aluno de graduação dos cursos da área de Humanas e Ciências Sociais Aplicadas. Espero que este livro auxilie o aluno com pouca desenvoltura em Matemática a entender e aplicar os conceitos básicos de Estatística, além de servir como guia para qualquer aluno relembrar Estatística rapidamente.

7

ESTATÍSTICA

Unidade I 1 CONCEITOS FUNDAMENTAIS 1.1 Conceitos iniciais

A palavra estatística tem origem do vocábulo latino status, que significa estado, e foi utilizada para o levantamento de dados por parte do Estado, visando à tomada de decisões. Atualmente a Estatística é parte da Matemática Aplicada que se dedica ao estudo e à interpretação de fenômenos coletivos e deles extrai conclusões. A Estatística fornece métodos para: • coleta de dados, feita normalmente por meio de um questionário ou da observação direta do fenômeno estudado; • organização e descrição dos dados; • análise e interpretação dos dados visando à tomada de decisões. A Estatística pode ser aplicada às mais diversas áreas do conhecimento, tais como Economia, Física, Medicina, Psicologia, Engenharia, Pedagogia e Serviço Social, para tabular e interpretar os resultados de um experimento, e, mais recentemente, para a geração e a interpretação de indicadores. Esses indicadores são largamente utilizados na gestão dos mais diversos segmentos do conhecimento. Para um aluno de qualquer curso superior, a Estatística é muito importante para: • organizar e analisar os dados de um experimento científico/observação de um fenômeno em qualquer área do conhecimento; • servir de embasamento para entender, analisar e até criar indicadores relevantes em seu trabalho (entendendo que, muitas vezes, o egresso de um curso superior pode assumir um cargo de gerência no seu segmento de formação). Podemos citar como exemplos de indicadores: o índice de desenvolvimento humano (IDH) de uma determinada localidade, a taxa de evasão de clientes de uma empresa de telefonia e os vários indicadores de aprendizado utilizados na educação.

9

Unidade I A Estatística pode ser classificada em: • descritiva: responsável pela coleta, organização e descrição dos dados; • indutiva: responsável pela análise e interpretação dos dados. 1.2 Dados

Dados são informações obtidas a partir de medições, resultados de pesquisas, contagens e levantamentos em geral. Alguns exemplos de dados são: o número de alunos de uma classe, o número de eleitores que votaram em um determinado candidato em uma eleição, o número de leitos ocupados em um hospital e as notas dos candidatos de um determinado concurso público. Em Estatística, os dados podem ser classificados como: • Qualitativos: são dados compostos de qualquer informação não numérica. Exemplos: estado civil (solteiro, casado); cor dos olhos (pretos, castanhos, verdes); time do coração (Corinthians, Palmeiras, São Paulo, Santos); religião praticada (católica, protestante, budista); tipo sanguíneo (A, B, O) etc. • Quantitativos: são dados compostos de informações numéricas e podem ser subdivididos em: — Discretos: são compostos somente por números inteiros e enumeráveis (na maioria das vezes, são oriundos de uma contagem). Exemplos: número de filhos, população de um município, número de escolas particulares em um determinado local, número de visitas em um determinado site na internet etc. — Contínuos: são compostos por números inteiros ou fracionários (na maioria das vezes, são obtidos por meio de uma medição). Exemplos: altura, peso, preço de um determinado produto, área de um terreno, renda mensal de uma família, o tempo gasto em uma viagem nacional, a distância entre dois bairros etc. Dados

Qualitativos

Quantitativos

Discretos

Contínuos Figura 1 – Classificação dos dados em Estatística

10

ESTATÍSTICA

Observação A classificação da variável depende do contexto. Por exemplo: para fins cadastrais, a variável idade poderia ser quantitativa discreta; na Pediatria, porém, é contínua, pois a parte fracionária também é considerada. 1.3 População x amostra

População é o conjunto de entes portadores de, no mínimo, uma característica comum; também chamada de universo estatístico. Um exemplo são os estudantes de uma instituição de ensino, pois a característica comum é o fato de estudarem na mesma instituição. Os eleitores de um estado da federação também são um exemplo. Na maioria das vezes, podemos concluir que é inviável ter acesso a toda a população para a coleta de dados (por limitações monetárias, de tempo etc.). Logo, normalmente é feita a coleta em uma parte, que deve ser muito representativa dessa população. Tal parcela é denominada amostra. Amostra corresponde ao subconjunto finito e representativo de uma população. Para obtermos uma boa amostra, utilizamos a técnica da amostragem. 1.4 Amostragem

Há diversos tipos de amostragem. Na amostragem simples (ou aleatória), todos os itens da população têm igual chance de pertencer à amostra (normalmente feita por sorteio).

Sorteio

Amostra População Figura 2 – Amostragem simples

Já na amostragem sistemática, os itens encontram-se ordenados e enumerados, e a coleta dos elementos da amostra é feita periodicamente. 8 7 6 5 4 3 2 1 População

7 4 1 Amostra

Figura 3 – Amostragem sistemática

11

Unidade I Observação: período de três (elementos coletados, iniciando do primeiro e em seguida coletando de três em três). Na amostragem estratificada, a população encontra-se dividida em vários estratos, e as amostras são coletadas aleatoriamente de cada estrato.

Amostra População Figura 4 – Amostragem estratificada

Saiba mais Após a leitura e a compreensão deste material, você pode aprofundar os estudos em amostragem (para compreender assuntos como tamanho e nível de confiança de amostra), lendo o livro a seguir: BRUNI, A. L. Estatística aplicada à gestão empresarial. São Paulo: Atlas, 2007. Exemplos de Aplicação

1. Cite pelo menos dez aplicações da Estatística (pesquise em jornais e sites da internet). ______________________________________________________________________________ ______________________________________________________________________________ ______________________________________________________________________________ ______________________________________________________________________________ ________________________________________________________________________________ 2. Defina os termos amostra e população. ______________________________________________________________________________ ______________________________________________________________________________ ______________________________________________________________________________ ______________________________________________________________________________ ________________________________________________________________________________ 12

ESTATÍSTICA 3. O que são dados qualitativos? ______________________________________________________________________________ ______________________________________________________________________________ ______________________________________________________________________________ ______________________________________________________________________________ ________________________________________________________________________________ 4. O que são dados quantitativos discretos e quantitativos contínuos? ______________________________________________________________________________ ______________________________________________________________________________ ______________________________________________________________________________ ______________________________________________________________________________ ________________________________________________________________________________ 5. Dê pelo menos oito exemplos para cada tipo de dado: a) Qualitativo __________________________________________________________________________________ ______________________________________________________________________________ ______________________________________________________________________________ b) Quantitativo discreto __________________________________________________________________________________ ______________________________________________________________________________ ______________________________________________________________________________ c) Quantitativo contínuo __________________________________________________________________________________ ______________________________________________________________________________ ______________________________________________________________________________ 6. Pesquise um exemplo prático para cada tipo de amostragem. ______________________________________________________________________________ ______________________________________________________________________________ ______________________________________________________________________________ ______________________________________________________________________________ ________________________________________________________________________________

13

Unidade I 2 DISTRIBUIÇÃO DE FREQUÊNCIAS 2.1 Conceitos básicos

Para compreender todos os conceitos, será utilizada uma amostra como exemplo. A amostra é de quarenta alunos de uma escola qualquer, e a variável a ser estudada é a estatura deles em centímetros. Segue a tabela dos valores de estaturas (em cm) coletados: Tabela 1 – Tabela primitiva das estaturas dos alunos 166

161

162

165

164

162

168

156

160

164

155

163

155

169

170

154

156

153

156

158

160

150

160

167

160

161

163

173

155

168

152

160

155

151

164

161

172

157

158

161

Essa tabela com os dados coletados (dados brutos), sem nenhuma organização, é chamada de tabela primitiva. Analisando os dados na tabela primitiva, para determinar a maior e a menor estatura, será necessário examinar item a item, o que tende a ser ineficiente, principalmente se o tamanho da amostra for grande. Logo, se os dados da tabela forem organizados em ordem crescente ou decrescente, será obtida uma nova tabela chamada de rol. Tabela 2 – Rol das estaturas dos alunos 150

155

160

162

166

151

156

160

162

167

152

156

160

163

168

153

156

160

163

168

154

157

161

164

169

155

158

161

164

170

155

158

161

164

172

155

160

161

165

173

Examinando o rol, fica fácil determinar a maior e a menor estatura (173 e 150 cm, respectivamente), o que permite concluir que a faixa de estaturas é de 150 a 173 cm. Outros questionamentos, como: “Qual é a estatura com o maior número de alunos?” (160 cm) e “Qual(is) é(são) a(s) estatura(s) inexistente(s) no 14

ESTATÍSTICA intervalo de 150 a 173 cm?” (159 e 171 cm), podem ser respondidos, porém com uma observação mais cuidadosa do rol. Para responder ao questionamento anterior com mais agilidade, o rol será alocado em uma tabela, em que cada estatura terá um número correspondente de ocorrências (vindo da contagem do rol). Tabela 3 – Tabela de ocorrências das estaturas dos alunos Estatura (cm)

Número de ocorrências

150

1

151

1

152

1

153

1

154

1

155

4

156

3

157

1

158

2

159

0

160

5

161

4

162

2

163

2

164

3

165

1

166

1

167

1

168

2

169

1

170

1

171

0

172

1

173

1

Esta tabela de ocorrências para todos os valores das estaturas é chamada de distribuição de frequências. Nesse caso, como foram exibidos todos os valores de estatura, esta distribuição é classificada como sem intervalo.

15

Unidade I Tabela 4 – Distribuição de frequências sem intervalo para as estaturas dos alunos Estatura (cm)

Fi

150

1

151

1

152

1

153

1

154

1

155

4

156

3

157

1

158

2

159

-

160

5

161

4

162

2

163

2

164

3

165

1

166

1

167

1

168

2

169

1

170

1

171

-

172

1

173

1

∑fi

40

Onde: fi = frequência (número de ocorrências para cada valor de estatura) ∑fi = n ∑fi = soma das frequências n = número de elementos da amostra (n = 40) A amostra das estaturas tem a faixa de estaturas de 23 cm (basta subtrair a maior da menor estatura), que resulta numa tabela com muitas linhas. Se a faixa de estaturas fosse maior, a tabela teria ainda mais linhas, o que prejudicaria a análise rápida dos dados. Para gerar uma tabela mais enxuta e de fácil análise, é possível agrupar as estaturas em intervalos. No exemplo, as estaturas serão agrupadas de quatro em quatro, gerando intervalos de 4 cm (no momento, 16

ESTATÍSTICA não há a necessidade de preocupar-se com a razão de o agrupamento ser de quatro em quatro, pois adiante será explicado o critério de cálculo utilizado). Essa tabela é chamada de distribuição de frequências com intervalo. Tabela 5 – Distribuição de frequências com intervalo para as estaturas dos alunos Estaturas (cm)

fi

150├ 154

4

154├ 158

9

158├ 162

11

162├ 166

8

166├ 170

5

170├ 174

3

∑fi

40

Onde: é o operador de intervalo.

Inclui o valor

Não inclui o valor (utiliza-se o anterior) Figura 5

Exemplo: O quinto intervalo da tabela anterior que mostra 166├ 170 é para as estaturas de 166 a 169 cm (note que o valor 170 cm é considerado no sexto). Os valores do rol que atendem a esse intervalo são: 166, 167, 168, 168 e 169. Estes cinco valores resultam na frequência igual a 5 para o quinto intervalo. A etapa da contagem dos valores do rol para a tabela de frequências deve ser feita com o máximo de cuidado, pois um erro na contagem ocasiona análises equivocadas e valores errados de todas as medidas estatísticas feitas a partir dessa tabela.

Saiba mais O modelo de distribuição estudado é o mais utilizado pelos autores, porém existem outros modelos, com outros tipos de intervalo além do ├. Matematicamente um intervalo pode ser representado de diversas maneiras, como (┤,├,├┤ e ─). Para mais informações sobre esse assunto, leia:

MORETTIN, L. G. Estatística básica. São Paulo: Makron Books, 1999. 17

Unidade I 2.2 Elementos de uma distribuição de frequência

Todos os conceitos a seguir serão explicados com base na distribuição de frequências já explicada anteriormente (Tabela 5). 2.2.1 Classe (i) É cada intervalo, ou cada linha para uma tabela de frequências. O total de classes de uma tabela de frequências é denominado k. Exemplo: i = 3 (terceira classe: 158├ 162)

k=6

2.2.2 Limites de classe (li e Li) São os extremos de cada classe. Onde li é o limite inferior (extremo a esquerda) e Li é o limite superior (extremo a direita) da classe. O índice i apenas indica qual é a classe abordada. Exemplo: l2 = limite inferior da segunda classe = 154

L5 = limite superior da quinta classe = 170

2.2.3 Amplitude de classe (hi) É a medida do intervalo de classe. hi = Li - li Exemplo: h3 = amplitude da terceira classe h3 = L3 -l3 = 162 - 158 = 4cm Observação Uma distribuição com intervalos sempre terá a mesma amplitude para todas as classes. Note que para todos os intervalos o h é 4. 2.2.4 Amplitude amostral (AA) É a diferença entre o valor máximo e o valor mínimo da amostra. É obtido por meio do rol (nesse caso, a Tabela 2). AA = Xmax - xmin 18

ESTATÍSTICA Exemplo: Amplitude amostral para as estaturas dos alunos AA = 173 - 150 = 23cm 2.2.5 Ponto médio de classe (xi) É o ponto que divide a classe em duas partes iguais. Será muito utilizado a partir deste ponto. xi 

li  Li 2

Exemplo: Ponto médio da segunda classe. x2 

154  158  156 cm 2

2.3 Tipos de frequências

2.3.1 Frequência absoluta ou simples (fi) É o número de ocorrências para cada uma das classes, obtida por meio da contagem no rol. Exemplo: f3 = 11 2.3.2 Frequência relativa (fri) É a razão (divisão) da frequência simples com a soma das frequências da classe. Fornece a participação percentual de cada classe em relação à amostra. ri 

i  i

Lembrete ∑fi = n (a soma das frequências é igual ao número de elementos do rol). e ∑fri = 1 (a soma das frequências relativas deve ser sempre igual a 1, que indica 100%).

19

Unidade I Exemplo: r2 

2 9   0, 225  i 40

Isso significa que 22,5% das estaturas estão na segunda classe, pois 0,225 x 100 = 22,5%. 2.3.3 Frequência acumulada (Fi) É a soma das frequências até a classe indicada. Exemplo: F2 = frequência acumulada da segunda classe = soma das frequências simples até a segunda classe. F2 = 4 + 9 = 13 Finalmente temos a distribuição com as frequências e os pontos médios calculados. Tabela 6 – Distribuição de frequências com intervalo para as estaturas dos alunos, com as frequências calculadas I

Estaturas (cm)

fi

xi

fri

Fi

1

150├ 154

4

152

0,100

4

2

154├ 158

9

156

0,225

13

3

158├ 162

11

160

0,275

24

4

162├ 166

8

164

0,200

32

5

166├ 170

5

168

0,125

37

6

170├ 174

3

172

0,075

40



40

1,000

• Para a coluna fi, contar cuidadosamente os elementos do rol, lembrando-se da notação de intervalo e considerando as repetições. • Para facilitar a determinação da coluna xi, basta calcular o ponto médio, a primeira classe (152) e somar a amplitude de classe (4), intervalo por intervalo. • Não é obrigatório, mas é altamente recomendável utilizar duas ou três casas após a vírgula para os valores de fri, visando sempre a um percentual preciso por classe. • Note que o último valor de Fi é sempre a soma das frequências (∑fi). 20

ESTATÍSTICA 2.4 Construção de distribuições de frequências

2.4.1 Distribuição sem intervalo Dado o rol de uma pesquisa referente ao número de carros por residência em um determinado bairro de SP (n = 20). Tabela 7 – Rol do número de carros por residência 0

1

1

2

3

0

1

1

2

3

1

1

1

2

4

1

1

2

2

4

Análise: este rol apresenta poucas possibilidades de valores para a variável, mais precisamente de 0 a 4 carros, e isso permite concluir que a distribuição sem intervalos é a mais indicada. Logo, para construir a distribuição de frequências sem intervalos, não existe nenhum cálculo. A partir do rol, basta colocar em cada classe um dos valores da variável e contar o número de ocorrências para cada classe. Tabela 8 – Distribuição de frequências sem intervalo para o rol do número de carros por residência Nº de carros

Fi

0

2

1

9

2

5

3

2

4

2



20

2.4.2 Distribuição com intervalo Com base no rol das estaturas dos alunos (n = 40), já mostrado e repetido a seguir para fins didáticos. Tabela 9 – Repetição do rol das estaturas dos alunos 150

155

160

162

166

151

156

160

162

167

152

156

160

163

168

153

156

160

163

168

154

157

161

164

169

155

158

161

164

170

155

158

161

164

172

155

160

161

165

173

21

Unidade I Análise: este rol apresenta muitas possibilidades de valores para a variável, mais precisamente de 150 a 173 cm (o que resultaria em uma distribuição sem intervalo com muitas linhas), e isso permite concluir que a distribuição com intervalos é a mais indicada. Logo, para construir a distribuição de frequências com intervalos, é necessário determinar: • o número de classes da distribuição (k) k= n Onde o valor de K deve ser sempre arredondado para inteiro. Para o rol anterior: = K = 40 6, 32 , arredondando temos 6; logo k = 6 (a distribuição deverá ter 6 classes). • a amplitude de classe (h) h=

AA k

Em que o valor de h sempre será arredondado para cima. Para o rol do exemplo: 173  150 23   3, 83 , arredondando para cima temos 4; 6 6 logo h = 4 (cada uma das classes terá amplitude de 4cm). h

De posse das duas informações necessárias para montar uma tabela com intervalo (k = 6 e h = 4), realizamos o seguinte procedimento: Passo 1: colocar o menor valor do rol no limite inferior da primeira classe. Passo 2: somar o valor de h calculado e colocar no limite superior da primeira classe. Colocar o sinal de intervalo entre os limites. Tabela 10 – Início da construção de uma distribuição sem intervalo

22

I

Estaturas (cm)

1

150├ 154

ESTATÍSTICA Passo 3: repetir o limite superior da classe em foco na classe abaixo. Tabela 11 – Andamento da construção de uma distribuição sem intervalo I

Estaturas (cm)

1

150├ 154

2

154

Passo 4: somar o valor de h (h = 4) calculado e colocar no limite superior desta classe. Colocar o sinal de intervalo entre os limites. Tabela 12 – Andamento da construção de uma distribuição sem intervalo I

Estaturas (cm)

1

150├ 154

2

154├ 158

Passo 5: repetir os passos 3 e 4 até completar o total de intervalos k calculado (k = 6). Passo 6: determinar as frequências simples (pela contagem no rol) para todas as classes da distribuição. Finalmente, somar as frequências, lembrando que ∑fi deve ser igual a n. Tabela 13 – Distribuição sem intervalo finalizada

k=6

I

Estaturas (cm)

fi

1

150├ 154

4

2

154├ 158

9

3

158├ 162

11

4

162├ 166

8

5

166├ 170

5

6

170├ 174

3



40

h=4

Observação Esse é um dos critérios existentes para se construir uma distribuição de frequências com intervalo de classe. Existe também o critério de Sturges, que também é bem conhecido. A principal diferença está no cálculo de k, pois nesse caso k é dado por: K =1+3,3 log n 23

Unidade I 2.5 Representações gráficas

Para a distribuição com intervalo, podemos representar os dados utilizando dois tipos de gráfico: o histograma e o polígono de frequências. 2.5.1 Histograma (gráfico de colunas) • Composição: — no eixo x (horizontal): os limites das classes da variável em estudo; — no eixo y (vertical): as frequências para cada uma das classes; — a altura da barra será proporcional à frequência de cada uma das classes. f 12 9 6 3 0

150

154

158

162

166

170

174

estaturas (cm)

Figura 6 – Histograma para uma distribuição com intervalo (Tabela 13)

2.5.2 Polígono de frequências (gráfico cartesiano) • Composição: — no eixo x (horizontal): os pontos médios das classes da variável em estudo; — no eixo y (vertical): as frequências para cada uma das classes; — ligar os pontos (no cruzamento das coordenadas dos eixos x e y); para fechar o polígono, devese: - subtrair a amplitude de classe (no exemplo, h = 4) do ponto médio da primeira classe (l1) para fechar o polígono pela esquerda (no eixo x); - somar a amplitude de classe (h = 4) no ponto médio da última classe da distribuição para fechar o polígono pela direita. 24

ESTATÍSTICA f 12 9 6 3 0

150

154

158

162

166

170

174

Estaturas (cm)

Figura 7 – Polígono de frequências para uma distribuição com intervalo (Tabela 13)

3 MEDIDAS DE TENDÊNCIA CENTRAL

Para analisar um conjunto de dados, muitas vezes é necessário obter um único valor que represente toda a amostra em estudo. Esse valor é usualmente obtido pelas medidas de tendência central. As medidas de tendência central abordadas serão: • a média (x); • a moda (Mo); • a mediana (Md). O cálculo de cada uma das medidas de tendência central será explicado em três abordagens: • dados não agrupados (não alocados em tabelas de frequência); • distribuição de frequência sem intervalo; • distribuição de frequência com intervalo. 3.1 Média (x)

A média de um conjunto de dados é a soma dos dados dividida pelo número de elementos do conjunto. 3.1.1 Dados não agrupados x

 xi n

Onde: ∑xi é a soma dos valores do conjunto de dados.

n é o número de elementos do conjunto de dados. 25

Unidade I Exemplo: as notas de um aluno em uma determinada disciplina durante o ano foram: 3,5; 5,0; 6,5 e 9,0. A nota média do aluno na disciplina pode ser calculada por: x

3, 5  5, 0  6, 5  9, 0 24   6, 0 4 4

3.1.2 Distribuição de frequências sem intervalo x

 xi.fi n

Onde: xi.fi é a multiplicação dos valores das classes com as respectivas frequências, classe por classe. n é o número de elementos do conjunto de dados que, nesse caso, é determinado pela soma das frequências. Exemplo: dada a distribuição sem intervalo da Tabela 8, determine o número médio de veículos por residência em um determinado bairro. Para armazenar os valores de xi.fi, uma coluna é criada. Em seguida, os valores da coluna são somados, gerando ∑xi.fi. Tabela 14 – Cálculo da média para uma distribuição sem intervalo

= x

Nº de carros

fi

xi.fi

0

2

0x2=0

1

9

1x9=9

2

5

2 x 5 = 10

3

2

3x2=6

4

2

4x2=8



20

∑xi.fi = 33

33 = 165 , 20

Logo, no bairro citado há em média 1,65 carros por residência (para efeito de interpretação, aproximadamente 2 carros por residência). 3.1.3 Distribuição de frequências com intervalo x

26

 xi.fi n

Onde: xi.fi é a multiplicação dos pontos médios das classes com as respectivas frequências, classe por classe.

ESTATÍSTICA Lembrando que: xi 

li  Li 2

n é o número de elementos do conjunto de dados que, nesse caso, é determinado pela soma das frequências. Exemplo: dada a distribuição com intervalo da Tabela 13, determine a estatura média dos alunos que compõem a amostra. O procedimento é similar ao da distribuição sem intervalo, apenas com o detalhe de xi, que para uma distribuição com intervalo é o ponto médio da classe. Tabela 15 – Cálculo da média para uma distribuição com intervalo

= x

I

Estaturas (cm)

fi

xi

xi.fi

1

150├ 154

4

(150 + 154)/2 = 152

152 x 4 = 608

2

154├ 158

9

(154 + 158)/2 = 156

156 x 9 = 1404

3

158├ 162

11

(158 + 162)/2 = 160

160 x 11 =1760

4

162├ 166

8

(162 + 166)/2 = 164

164 x 8 = 1312

5

166├ 170

5

(166 + 170)/2 = 168

168 x 5 = 840

6

170├ 174

3

(170 + 174)/2 = 172



40

172 x 3 = 516 ∑xi.fi = 6440

6440 = 161 cm 40

Logo, a estatura média para a amostra de alunos é de 161 cm. Observação Uma análise muito simples é comparar os dados com a média. No exemplo anterior, temos estaturas acima e abaixo da média. Logo, a média pode ser um interessante indicador de classificação. Exemplos de Aplicação

Compare as vendas mensais com uma média histórica, para indicar o desempenho de cada vendedor.

27

Unidade I

Observação Além da média que estudamos, muito utilizada como indicador de tendência, existem outros tipos, como: a média ponderada, que também indica tendência, mas considera os valores da variável com pesos diferentes, e a média móvel em um determinado número de valores (tipicamente de 3 a 12), largamente utilizada no cálculo de previsão. 3.2 Moda (Mo)

A moda é o valor que ocorre com maior frequência em um conjunto de dados. Serve para indicar as regiões das máximas frequências. 3.2.1 Dados não agrupados Dados os conjuntos a seguir, a moda será determinada analisando-se as maiores frequências. Exemplo 1: conjunto 1 20 30

40

80

10

20 30 20

10

O valor 20 se repete mais vezes que os outros (possui maior frequência). Mo = 20 Exemplo 2: conjunto 2 10 20 30 30 30 40 50 50 50 60 Os valores 30 e 50 se repetem mais vezes que os outros valores do conjunto; logo, existem duas modas (30 e 50). Mo = 30 e Mo = 50 (conjunto bimodal) Exemplo 3: conjunto 3 100

110

124

145

101

200

500

Nenhum valor se repete mais vezes que os outros valores do conjunto; logo, não existe valor modal (conjunto amodal).

28

ESTATÍSTICA 3.2.2 Distribuição de frequências sem intervalo Para determinar a moda em uma distribuição sem intervalo, basta identificar a classe com maior frequência simples (classe modal). A moda será o valor da variável da classe modal. Exemplo: dada a distribuição sem intervalo da Tabela 8, determine o valor modal dos veículos por residência em um determinado bairro. Tabela 16 – Obtenção da moda para uma distribuição sem intervalo Nº de carros

fi

0

2

1

9

2

5

3

2

4

2



20

Maior fi na segunda classe (classe modal) O valor da variável para a classe modal é igual a 1; logo, Mo = 1. 3.2.3 Distribuição de frequências com intervalo Para determinar a moda em uma distribuição com intervalo, inicialmente é necessária a classe modal (da mesma forma que na distribuição sem intervalo). Nesse caso, a moda será obtida aplicando-se a fórmula a seguir na classe modal: Mo  l * 

d1  h* d1  d2

Onde: l* é o limite inferior da classe modal h* é a amplitude da classe modal

d1 = f* - fant d2 = f* - fpost f* é a frequência simples da classe modal fant é a frequência simples anterior (acima) à classe modal. fpost é a frequência simples posterior (acima) à classe modal.

Existem vários modelos para cálculo da moda. O modelo aqui apresentado é o mais utilizado e chama-se Moda de Czuber. 29

Unidade I Exemplo: dada a distribuição com intervalo da Tabela 13, determine a estatura modal dos alunos que compõem a amostra. Tabela 17 – Obtenção da moda para uma distribuição com intervalo I

Estaturas (cm)

fi

1

150├ 154

4

2

154├ 158

9

3

158├ 162

11

4

162├ 166

8

5

166├ 170

5

6

170├ 174

3



40

Maior fi na terceira classe (classe modal) l* = 158 h* = 4 d1 = 11 - 9 = 2 d2 = 11 - 8 = 3 Logo: 2 4 23 8 Mo  158   158  1, 6 5 Mo  159, 6 cm Mo  158 

Observação Assim como nos dados não agrupados, uma distribuição pode ser bimodal, desde que existam duas maiores frequências. Nesse caso basta calcular as modas para as duas classes modais. Isso vale para mais de duas modas em uma distribuição, ainda que essa ocorrência não seja tão comum. 3.3 Mediana (Md)

A mediana é o valor que caracteriza o centro de uma distribuição de frequências. Divide um conjunto ordenado de dados em duas partes iguais de 50% (daí o fato de a mediana ser considerada também uma medida de posição). 30

ESTATÍSTICA 3.3.1 Dados não agrupados Dados os conjuntos a seguir, antes de determinar a mediana, é necessário ordenar os dados da amostra. Exemplo 1: conjunto ordenado 1 20

30

50

80

190

210

300

Esta é uma amostra ímpar, pois possui 7 elementos (n = 7). Para amostras ímpares, a mediana é o elemento central da série de dados. 20

30

50

80

190

210

300

Logo, Md = 80. Exemplo 2: conjunto ordenado 2 100 230

300

500

600

800

Esta é uma amostra par, pois possui 6 elementos (n = 6) Para amostras pares, existem dois elementos centrais na série de dados, então a mediana é a média de ambos. 100 230 Logo,

300 500 600 Md = (300+500) / 2 Md = 800 / 2 Md = 400

800

3.3.2 Distribuição de frequências sem intervalo Para determinar a mediana em uma distribuição sem intervalo é necessário: Passo 1: determinar as frequências acumuladas (Fi) de todas as classes da distribuição. Passo 2: identificar a classe mediana. Para isso, é necessário calcular uma referência.  i 2 Passo 3: comparar o valor da referência com cada uma das frequências acumuladas. Se houver um Fi igual à referência, a classe deste Fi será a classe mediana. Caso contrário, deverá ser escolhido o Fi superior mais próximo da referência para obter a classe mediana. 31

Unidade I Passo 4: a mediana é o valor da variável da classe encontrada (classe mediana). Exemplo: dada a distribuição sem intervalo da Tabela 18, determine o valor da mediana.  i 20   10 (referência) 2 2 Tabela 18 – Obtenção da mediana para uma distribuição sem intervalo Nº de carros

fi

Fi

0

2

2

1

9

11

2

5

16

3

2

18

4

2

20



20

Valor de Fi (11) superior mais próximo da referência (10). Esta é a classe mediana (segunda classe). O valor da variável para a classe mediana é igual a 1; logo, Md =1 3.3.3 Distribuição de frequências com intervalo Para determinar a mediana em uma distribuição com intervalo, inicialmente é necessária a classe mediana (da mesma forma que na distribuição sem intervalo, isto é, seguindo os passos 1, 2 e 3). Nesse caso, a mediana será obtida aplicando-se a fórmula a seguir na classe mediana:   i  Fant   2  Md  l *   h * * Onde: l* é o limite inferior da classe mediana ∑fi/2 é a referência, já calculada anteriormente para a escolha da classe mediana. Fant é a frequência acumulada anterior (acima) à classe mediana. f* é a frequência simples da classe mediana. h* é a amplitude da classe mediana. Exemplo: dada a distribuição com intervalo da Tabela 13, determine a estatura mediana dos alunos que compõem a amostra.  i 40   20 (referência) 2 2 32

ESTATÍSTICA Tabela 19 – Obtenção da mediana para uma distribuição com intervalo I

Estaturas (cm)

fi

Fi

1

150├ 154

4

4

2

154├ 158

9

13

3

158├ 162

11

24

4

162├ 166

8

32

5

166├ 170

5

37

6

170├ 174

3

40



40

Valor de Fi (24) superior mais próximo da referência (20). Esta é a classe mediana (terceira classe). l* = 158 ∑fi/2 = 20 Fant = 17 = 13 + 4 f* = 11 h* = 4 Logo: Md  158 

20  17  4 11

3 4 11 12 Md  158  11 Md  158  1, 09 Md  159, 09 cm Md  158 

Concluindo: a estatura que divide os 50% mais altos dos 50% mais baixos é de 159,09 cm. Observação Além da mediana, uma medida tanto de tendência quanto de posição, existem outras também importantes, como o quartil, o decil e o percentil. O método de obtenção é muito parecido com o da mediana, que tem o dois como referência nos cálculos. O quartil, o decil e o percentil, por sua vez, dividem uma série em quatro, dez ou cem partes iguais. 33

Unidade I 4 MEDIDAS DE DISPERSÃO 4.1 Introdução

As medidas de dispersão têm como finalidade indicar o quanto os dados apresentam-se dispersos em torno de uma região central, isto é, mostram o grau de variação em uma amostra. As medidas de dispersão abordadas serão: • a variância (s2); • o desvio-padrão (s); • o coeficiente de variação (CV). Observação Além das medidas de dispersão estudadas, existem modelos mais simplificados, como a amplitude e o desvio médio, que têm sua importância, porém não são tão utilizados como o desvio-padrão. O cálculo de cada uma das medidas será explicado utilizando-se as três abordagens citadas anteriormente. Porém, antes de serem apresentadas as fórmulas e os métodos para o cálculo, é interessante acompanhar, por meio de um exemplo, o significado e a importância do cálculo da dispersão. Exemplo: existem três grupos de pessoas (cada um com oito elementos). A variável em estudo é a idade dessas pessoas. Grupo 1: 20

20

20

20

20

20

20

20

19

20

20

21

22

22

10

13

20

25

35

50

Grupo 2: 18

18

Grupo 3: 2

5

Desejamos tirar algumas conclusões sobre os três grupos analisando a principal medida de tendência, a média. 34

ESTATÍSTICA 20  20  20  20  20  20  20  20 160   20 8 8 18  18  19  20  20  21  22  22 160   20 x do grupo 2  8 8 2  5  10  13  20  25  35  50 160 x do grupo 3    20 8 8 x do grupo 1 

Os valores das médias para os três grupos foram iguais, mas percebemos que os grupos são totalmente distintos quanto às idades. • No grupo 1, todos os valores coincidem com a média, pois não existem diferenças em relação a esta, logo não existe dispersão. É um grupo formado somente por pessoas de 20 anos de idade. • No grupo 2, os valores não coincidem exatamente com a média, mas também não se afastam muito desta, logo existe uma pequena dispersão. É um grupo formado por pessoas com idades próximas de 20 anos. • No grupo 3, a maioria dos valores está bem afastada de média, logo existe uma considerável dispersão. É um grupo formado pelas mais diversas idades. Conclusão: apenas utilizando a média, os três grupos apresentavam um perfil de idades igual. No entanto, considerando também a dispersão das idades (afastamento dos valores em relação à média), podemos indicar as diferenças existentes entre os três grupos. 4.2 Variância (s2)

É a média dos quadrados das diferenças dos valores em relação a sua média. 4.2.1 Dados não agrupados ( xi  x )2 s  n 2

Onde: xi são os valores da variável x é a média do conjunto de valores n é o número de elementos do conjunto de valores Exemplo: as notas que um aluno tirou em um determinada disciplina durante o ano foram:3,5; 5,0; 6,5; e 9,0. A variância das notas do aluno na disciplina pode ser calculada por: • Obtenção da média. x

3, 5  5, 0  6, 5  9, 0 24   6, 0 4 4 35

Unidade I • Obtenção da variância utilizando uma tabela para organizar os cálculos. Tabela 20 – Tabela para auxiliar na obtenção da variância de dados não agrupados xi

xi - x

(xi - x)2

3,5

3,5 - 6 = -2,5

(-2,5)2 = 6,25

5,0

5 - 6 = -1

(-1)2 = 1

6,5

6,5 – 6 = 0,5

(0,5)2 = 0,25

9,0

9-6=3

(3)2 = 9

24

∑(xi - x)2 = 16,5

16, 5 = 4,13 4

= s2

Lembrete O número elevado ao quadrado é o produto do número por ele mesmo. Para os cálculos deste livro, uma calculadora com operações básicas (+, -, x e /) e raiz quadrada é mais que suficiente. 4.2.2 Distribuição de frequências sem intervalo s2 

( xi  x )2  i n

Onde: xi são os valores da variável para cada classe x é a média dos valores da distribuição fi é a frequência simples de cada classe n é o número de elementos do conjunto de valores Exemplo: dada a distribuição sem intervalo da Tabela 8, determine a variância de veículos por residência em um determinado bairro. • Obtenção da média (já vista no item 3.1.2). = x

36

33 = 165 , carros 20

ESTATÍSTICA Tabela 21 – Cálculo da variância para uma distribuição sem intervalo Nº de carros (xi)

fi

xi.fi

xi - x

(xi - x)2

(xi - x)2.fi

0

2

0x2=0

0 - 1,65 = -1,65

(-1,65)2 = 2,72

2,72 x 2 = 5,44

1

9

1x9=9

1 - 1,65 =- 0,65

(-0,65)2 = 0,42

0,42 x 9 = 3,78

2

5

2 x 5 = 10

2 - 1,65 = 0,35

(0,35) = 0,12

0,12 x 5 = 0,60

3

2

3x2=6

3 - 1,65 = 1.35

(1,35) = 1,82

1,82 x 2 = 3,64

4

2

4x2=8

4 - 1,65 = 2,35

(2,35) = 5,52

5,52 x 2 = 11,04



20

∑xi.fi = 33

2 2 2

∑(xi - x)2.fi = 24,5

Logo: = s2

24, 5 = 1, 23 carros2 20 Observação Um dos problemas do uso direto da variância é que a unidade e o valor estarão elevados ao quadrado.

4.2.3 Distribuição de frequências com intervalo Considere: s2 

( xi  x )2  i n

Onde: xi é o ponto médio para cada classe Lembrando que: xi 

li  Li 2

Onde: x é a média dos valores da distribuição fi é a frequência simples de cada classe n é o número de elementos do conjunto de valores Exemplo: dada a distribuição com intervalo da Tabela 13, determine a variância das estaturas dos alunos que compõem a amostra. 37

Unidade I O procedimento é similar ao da distribuição sem intervalo, apenas com o detalhe de xi, que para uma distribuição com intervalo é o ponto médio da classe. Tabela 22a-b – Cálculo da variância para uma distribuição com intervalo a)

= x

I

Estaturas (cm)

fi

Xi

xi.fi

1

150├ 154

4

(150 + 154)/2 = 152

152 x 4 = 608

2

154├ 158

9

(154 + 158)/2 = 156

156 x 9 = 1404

3

158├ 162

11

(158 + 162)/2 = 160

160 x 11 =1760

4

162├ 166

8

(162 + 166)/2 = 164

164 x 8 = 1312

5

166├ 170

5

(166 + 170)/2 = 168

168 x 5 = 840

6

170├ 174

3

(170 + 174)/2 = 172

172 x 3 = 516



40

∑xi.fi = 6440

6440 = 161 cm 40

b) xi - x

(xi - x)2

(xi - x)2.fi

152 - 161 = -9

(-9)2 = 81

81 x 4 = 324

156 - 161 = -5

(-5) = 25

25 x 9 = 225

160 -161 = -1

(-1)2 = 1

1 x 11 = 11

164 -161 = 3

(3)2 = 9

9 x 8 = 72

168 -161 = 7

(7)2 = 49

49 x 5 = 245

172 - 161 = 11

(11)2 = 121

121 x 3 = 363

2

∑(xi - x)2.fi = 1240

Logo: = s2

1240 = 31 cm2 40

4.3 Desvio-padrão (s)

É a raiz quadrada da variância. É a medida de dispersão mais utilizada, por ter a mesma unidade que a média, possibilitando uma melhor avaliação da dispersão da amostra. 38

ESTATÍSTICA 4.3.1 Dados não agrupados Considere: ( xi  x )2 n

s

Onde: xi são os valores da variável x é a média do conjunto de valores n é o número de elementos do conjunto de valores Utilizando o mesmo exemplo do item 4.2.1: = s2

16, 5 = 4,13 4

Logo: = s

= 4,13 2, 03

4.3.2 Distribuição de frequências sem intervalo Considere: ( xi  x )2  i n

s2 

Onde: xi são os valores da variável para cada classe x é a média dos valores da distribuição fi é a frequência simples de cada classe n é o número de elementos do conjunto de valores Utilizando o mesmo exemplo do item 4.2.2: = s2

24, 5 = 1, 23 carros2 20

Logo: = s

= 123 , 111 , carros

39

Unidade I 4.3.3 Distribuição de frequências com intervalo Considere: ( xi  x )2  i n

s

Onde: xi é o ponto médio para cada classe Lembrando que: xi 

li  Li 2

x é a média dos valores da distribuição fi é a frequência simples de cada classe n é o número de elementos do conjunto de valores Utilizando o mesmo exemplo do item 4.2.3: = s2

1240 = 31 cm2 40

Logo: = s

= 31 5, 57 cm

4.4 Coeficiente de variação (CV)

É o quociente entre o desvio-padrão e a média. É a medida de dispersão relativa, que indica a variabilidade percentual da amostra em relação à média. O coeficiente de variação é útil para comparação de variabilidade de dois conjuntos de dados com unidades de medidas diferentes. Por exemplo, quando precisamos comparar altura e peso, idade e número de filhos. Quanto menor este valor, mais homogêneo será o conjunto de dados. s CV  100 x A unidade do coeficiente de variação é uma porcentagem (%). A fórmula e o método de cálculo são exatamente os mesmos para as três abordagens apresentadas. Vale ressaltar que quanto maior o CV, maior será a variabilidade dos dados do conjunto, em relação a sua média. 40

ESTATÍSTICA Exemplo: calcular o coeficiente de variação do exemplo abordado no item 4.3.3 (estaturas dos alunos). Como: x = 161 cm s = 5,57 cm Logo: CV 

5, 57 557 100   3, 46% 161 161

As estaturas têm uma variabilidade de 3,46% em relação à média. É importante dizer que o coeficiente de variação é usado para comparar dois conjuntos de dados com unidades diferentes. Exemplo: “Útil para comparação de variabilidade de dois conjuntos de dados com unidades de medida diferentes. Quanto menor esse valor, mais homogêneo será o conjunto de dados”. Resumo Nesta Unidade abordamos inicialmente os principais conceitos teóricos para o estudo dos métodos estatísticos. Foi apresentada a definição de Estatística bem como a sua divisão em Estatística Descritiva e Indutiva. Neste livro-texto abordaremos a maior parte da Estatística Descritiva e o início da Indutiva. Conceitos como os tipos de dados, que podem ser quantitativos (subdivididos em discretos e contínuos) e qualitativos, foram abordados com uma quantidade significativa de exemplos para a perfeita compreensão. Vimos ainda as definições de população e amostra, e foi feita uma breve explicação introdutória de amostragem, em que foram exibidos seus principais tipos (aleatória, sistemática e estratificada). Estudamos as formas de se armazenar dados quantitativos, que anteriormente estavam sob a forma de uma tabela primitiva ou um rol, em distribuições de frequências. Aprendemos que existem dois tipos de distribuições de frequências: sem intervalo de classe e com intervalo de classe. Abordamos as diferenças e os métodos para a construção de uma tabela de frequências, com ou sem intervalo. 41

Unidade I Ressaltamos que erros, tanto na montagem da tabela quanto na contagem dos valores do rol, resultam em análise e medidas/indicadores errados. Na sequência, apresentamos os principais tipos de frequências existentes (simples, relativa e acumulada) e as suas respectivas finalidades. Mostramos também a montagem de gráficos (histograma e polígono de frequências) para distribuições de frequências com intervalo (por serem as mais utilizadas na prática). Além disso, estudamos as três principais medidas de tendência central: a média, a moda e a mediana. As medidas foram analisadas sob três abordagens distintas (dados não agrupados, distribuição de frequência sem intervalo e distribuição de frequência com intervalo), pois os métodos de obtenção das medidas apresentam significativas diferenças para cada abordagem. Vimos que a média de dados não agrupados é a média aritmética, muito utilizada academicamente para verificar o aproveitamento do aluno em uma disciplina. Aprendemos ainda que para a obtenção da média para distribuição de frequência, devemos levar em conta tanto a frequência quanto o valor da variável. Abordamos a moda, que indica a(s) maior(es) frequências em uma série de dados. Foram apresentadas as três abordagens para a obtenção. A mediana, posição que indica o centro de uma série de dados (divide a série em duas partes de 50%) também foi apresentada das três maneiras. No que se refere às medidas de dispersão, estudamos três das principais, novamente nas três abordagens (dados não agrupados, distribuição sem intervalo e distribuição com intervalo). Aprendemos que a variância, definida pela média dos quadrados das diferenças dos valores em relação a sua média, é importante, porém não muito utilizada, pelo fato de a unidade da grandeza envolvida no cálculo estar elevada ao quadrado. Vimos, entretanto, que o desvio‑padrão, cuja definição é a raiz quadrada da variância, é muitíssimo utilizado em várias áreas do conhecimento, para quantificar a dispersão de uma série de dados. Para termos uma noção percentual da dispersão em relação à média, foi apresentado o coeficiente de variação, que é uma medida de dispersão derivada do desvio-padrão e da média dos dados analisados. 42

ESTATÍSTICA

Exercícios Questão 1. Foi realizada uma pesquisa sobre a faixa etária das crianças participantes de um acampamento. O gráfico a seguir mostra os resultados: 8 7 6 Freq

5 4 3 2 1 0 5

7

9

Idade

11

13

15

Figura 8

Com base no gráfico, julgue as afirmações a seguir: I. O conjunto de dados possui 6 classes e a amplitude de cada classe é 2. II. O limite inferior da primeira classe é 5 e o limite superior é 7. III. Os valores 5, 7, 9, 11, 13 e 15 são os pontos médios de cada classe. IV. A moda é 11. V. O polígono de frequência é construído a partir do limite inferior de cada classe. São corretas apenas as afirmativas: A) I, II, IV. B) I, II, V. C) II, III, V. D) I e III. E) III e IV. Resposta correta: alternativa D. 43

Unidade I Análise das afirmativas I – Afirmativa correta. Justificativa: no histograma, cada coluna corresponde ao número de classes da tabela de frequências. No gráfico anterior há seis colunas que correspondem às seis classes da tabela de frequências. II – Afirmativa incorreta. Justificativa: o limite inferior da primeira classe é o extremo inferior 4, sendo esse o valor em que começa a coluna correspondente à primeira classe. O limite superior da primeira classe é o extremo superior 6, sendo esse o valor em que termina a coluna correspondente da primeira classe. III – Afirmativa correta. Justificativa: os pontos médios de cada classe são os pontos que dividem as classes em duas partes iguais, e os valores dos pontos médios do histograma anterior são 5, 7, 9, 11, 13 e 15. IV – Afirmativa incorreta. Justificativa: a moda é uma medida de tendência central que indica o valor que ocorre com maior frequência no conjunto de dados. No histograma podemos visualizar que há duas modas: 11 e 13. Este conjunto de dados é chamado de bimodal. V – Afirmativa incorreta. Justificativa: o polígono de frequências deve ser construído ligando-se os pontos de cruzamentos do eixo x (os pontos médios de cada classe) com o eixo y (a frequência em cada uma das classes). Questão 2. (Oficial de Fazenda-SEFAZ 2011) Com base no resultado final do concurso para o cargo de Especialista em Políticas Públicas e Gestão Governamental da SEPLAG, prova realizada pelo CEPERJ em 01.08.2010, as frequências para o número de acertos obtidos nas cinco questões de Estatística pelos 1.535 candidatos que realizaram a prova estão mostradas no quadro a seguir: Quadro 1

44

Nenhum acerto →

393 candidatos

1 acerto →

627 candidatos

2 acertos →

417 candidatos

3 acertos →

81 candidatos

4 acertos →

12 candidatos

5 acertos →

5 candidatos

TOTAL

1.535 candidatos

ESTATÍSTICA O gráfico a seguir mostra a frequência relativa dos acertos. Estatística - Prova para EPPGG 45,0%

40,8%

40,0% 35,0% 30,0%

27,2%

25,6%

25,0% 20,0% 15,0% 10,0%

5,3%

5,0% 0,0% 1

2

3 4 Número de acertos

0,8%

0,3%

5

6

Figura 9

Com base na tabela e no gráfico, julgue as afirmativas a seguir: I. A moda e a mediana da distribuição são iguais. II. A amplitude interquartílica é igual a 2. III. A média da distribuição é igual a 2. IV. A probabilidade de um candidato, escolhido ao acaso entre os 1.535, ter acertado no máximo duas questões é igual a 66,4%. São corretas apenas as afirmativas: A) I e II. B) I e III. C) I, III e IV. D) II, III e IV. E) II e IV. Resolução desta questão na plataforma. 45
ESTATISTICA 1

Related documents

45 Pages • 9,128 Words • PDF • 274.3 KB

1 Pages • 401 Words • PDF • 51.6 KB

8 Pages • 1,739 Words • PDF • 120.8 KB

9 Pages • 2,564 Words • PDF • 299.9 KB

73 Pages • PDF • 15.6 MB

374 Pages • PDF • 141.3 MB

2 Pages • PDF • 3.3 MB

382 Pages • 91,510 Words • PDF • 1.4 MB

56 Pages • 8,625 Words • PDF • 539.8 KB

23 Pages • 5,725 Words • PDF • 379.8 KB

1 Pages • 273 Words • PDF • 126.8 KB