As meias na gaveta

Quem já elaborou provas para alunos de graduação sabe como é difícil escrever enunciados que todos os alunos entendam. Por mais que a gente tente fazer um texto bem claro, sempre aparece alguém com interpretação diferente da que tínhamos em mente. Às vezes, esta interpretação não faz sentido e pode ser desconsiderada; ás vezes, porém, mostra que o texto não estava claro, e a questão acaba tendo que ser anulada.

Do ponto de vista do aluno, parte de um problema é tentar entender o que o professor quis dizer. Suponhamos por exemplo este problema de Probabilidades:

Uma moeda é lançada duas vezes. Qual é a probabilidade de ela mostrar duas coroas?

Mesmo neste exemplo simples, o enunciado é vago, e os alunos têm que fazer várias pressuposições antes de começar a calcular. Primeiro, como não existem coroas nas faces das moedas brasileiras, têm que pressupor que coroa seja um termo genérico para indicar a face oposta à cara, independentemente do que esteja impresso na moeda. Segundo, têm que pressupor que “lançar” a moeda significa atirá-la para cima revolvendo em torno do diâmetro, de modo que as duas faces se alternem no lado superior; se lançarmos a moeda como um disco de frisbee (girando em torno de seu centro, com as faces paralelas ao solo), o problema não faz sentido. Terceiro, têm que pressupor que a moeda seja equilibrada, e P(cara) = P(coroa).

Como este é um problema padrão, e todos os alunos já viram algo parecido durante as aulas, estas pressuposições são feitas automaticamente, tanto pelos professores quanto pelos alunos. Se o problema tiver um enunciado um pouco diferente, porém, as coisas podem ser mais complicadas. Por exemplo, este problema:

Uma pessoa tem 10 pares de meias, que guarda misturadas numa gaveta. De amanhã, ao acordar, pega aleatoriamente duas delas e as calça. Qual é a probabilidade de que estas duas meias formem um par?

A resposta que primeiro vem à mente da maioria dos alunos é P = 1/19. A primeira meia pode ser qualquer uma das 20 que estão na gaveta, por isso sua probabilidade é 20/20. A segunda deve ser a que forma um par com a primeira – só há uma destas entre as 19 meias que ficaram na gaveta, portanto sua probabilidade é 1/19. A resposta do problema é dada pelo produto das duas probabilidades: P = 20/20 x 1/19 = 19.

Está certo isto? Sim… ou não. Se você parte do pressuposto de que os 10 pares de meias são diferentes entre si, está correto. Mas o enunciado não exige isto – o que acontece se todos os pares forem iguais; por exemplo se todos forem pretos? Neste caso, a segunda meia pode ser qualquer uma, sua probabilidade é 19/19, e a resposta do problema passa a ser P = 20/20×19/19 = 1.

meias L R2

Está certo isto? Sim… ou não. Se você parte do pressuposto de que em cada par de meias o pé direito e o pé esquerdo são idênticos, está certo. Mas o que acontece se todos os pares forem iguais, mas em cada par o pé direito for diferente do esquerdo, como acontece em algumas meias esportivas?

Agora, se a primeira meia foi um pé direito, a segunda meia pode ser qualquer um dos 10 pés esquerdos que ficaram na gaveta, e sua probabilidade é 10/19; a resposta do problema é P = 20/20×10/19 = 10/19.

Há portanto três respostas diferentes, dependendo do que foi pressuposto (mas não explicitado) sobre as meias na gaveta. Usei este problema em várias provas para alunos de graduação, sem nunca ter notado que poderia haver dúvidas na interpretação, e os alunos sempre responderam da primeira forma (P=1/19). Todos partiram do pressuposto de que os pares são sempre diferentes entre si.

A única dificuldade com o enunciado foi a de um aluno que me chamou de lado durante uma prova e me disse baixinho “Professor, não estou entendendo isto… Sei fazer o problema das meias, mas não entendi esta parte das ‘calça’ – o que tem ‘as calça’ a ver com ‘as meia’?”

(hshippert)

Caras e Coroas

No primeiro problema mostrado em seu Essai Philosophique sur les Probabilités, Laplace lança uma moeda duas vezes e calcula a probabilidade de aparecer pelo menos uma cara. Desde então, praticamente todos os livros seguem o exemplo de Laplace, e começam a ensinar probabilidades com problemas de cara ou coroa – este jogo se tornou uma ferramenta básica no ensino porque é simples, fácil de reproduzir na sala de aula e, principalmente, porque é razoável pressupormos, como fizeram Pascal, Fermat e Laplace, que a probabilidade da cara é igual à da coroa, e podemos começar a fazer as contas a partir daí.

A maioria dos estudantes já ouviram a expressão cara ou coroa, mas em geral não sabem exata-mente como surgiu, porque nunca viram uma coroa numa moeda. Coroas, é claro, aparecem nas moedas de países com regime monárquico, como eram no passado quase todos os países europeus. A Fig. 1 mostra um dobrão espanhol de 1798, que tem de um lado a cara do rei Dom Carlos IV, aparentemente muito satisfeito, e do outro seu brasão e coroa real.

A maioria dos estudantes já ouviram a expressão “cara ou coroa”, mas em geral não sabem como surgiu, porque nunca viram uma coroa numa moeda. Coroas, é claro, aparecem nas moedas de países com regime monárquico, como eram no passado quase todos os países europeus. A foto mostra um dobrão espanhol de 1798, que tem de um lado a cara do rei Dom Carlos IV, aparentemente muito satisfeito, e do outro o brasão e a coroa reais.

Algumas moedas de países cristãos tinham cruzes, no lugar das caras, como o dobrão português emitido por D. João V, em 1725 (bem conhecida pelos colecionadores, pois é considerado a moeda de maior valor intrínseco já cunhada).  Em seus livros, Laplace chama os dois lados da moeda de croix e pile (croix: cruz, pile: lado da moeda onde estão as armas do rei, ou o valor da moeda).

Algumas moedas de países cristãos tinham cruzes, no lugar das caras, como o dobrão português emitido por D. João V, em 1725 (bem conhecida pelos colecionadores, pois é a moeda de maior valor intrínseco já cunhada). Em seus livros, Laplace chama os dois lados da moeda de croix e pile (croix: cruz, pile: lado da moeda onde estão as armas do rei, ou o valor da moeda).

As últimas moedas brasileiras que tinham caras e coroas foram emitidas nos fins do Império, como esta de 2000 réis de 1886; de um lado, está a cara de Dom Pedro II, do outro o brasão e a coroa imperial. (Foto: en.numista.com)

As últimas moedas brasileiras que tinham caras e coroas foram emitidas nos fins do Império, como esta de 2000 réis de 1886; de um lado, está a cara de Dom Pedro II, do outro o brasão e a coroa imperial. (Foto: en.numista.com)

Atualmente, o Reino Unido é um dos poucos países de destaque na economia mundial que ainda usam moedas assim; a foto abaixo mostra a moeda de uma libra, que tem de uma lado a cara da rainha Elizabeth II, do outro a coroa real. Note que nestas moedas não há lugar para o número; o valor está escrito por extenso abaixo da coroa (one pound).Atualmente, o Reino Unido é um dos poucos países de destaque na economia mundial que ainda usam moedas assim; a foto abaixo mostra a moeda de uma libra, que tem de uma lado a cara da rainha Elizabeth II, do outro a coroa real. Note que nesta moeda não há lugar para o número; o valor está escrito por extenso abaixo da coroa (one pound).

É um fato curioso que cada uma das línguas mais faladas do mundo dê um nome diferente para o jogo, e no entanto nenhum deles seja tradução literal de cara ou coroa. Na França, o jogo é chamado atualmente de pile ou face. Na Espanha, de cara o cruz (mas os países da América Latina usam várias outras expressões diferentes veja a lista na Wikipedia); na Itália, de testa o croce (testa: cabeça; croce: cruz); na Hungria, de fej vagy írás (cabeça ou escrito). No Reino Unido, um dos poucos países cuja moeda realmente tem cara e coroa, usa-se uma expressão totalmente diferente, heads or tails (head: cabeça; tail: rabo ou cauda) – que parece um tanto desrespeitosa quando aplicada à Rainha…

O nome cara ou coroa ficou, mas as moedas brasileiras atuais já não têm coroas; às vezes, não têm nem mesmo caras, como algumas das moedas de cruzeiro que circularam nos anos 1980s. O mesmo acontece no resto do mundo; os nome ficam, mas as moedas mudam – em quase todas as línguas o que pode ser visto na moeda já não corresponde ao nome do jogo. A foto abaixo mostra algumas das moedas que circulam na Comunidade Européia. O lado que tem o valor (2 euros) é igual em toda a Comunidade (A); o que está do outro lado, porém, pode variar, dependendo do país onde a moeda foi cunhada.

A da Alemanha (B) mostra uma águia, símbolo do país. A da França (C) não tem nem cruz nem face, mas uma árvore estilizada e o lema da revolução francesa, Liberté, Égalité, Fraternité. A da Espanha (D) é curiosa: como o país é uma monarquia, a moeda mostra a cara do rei Dom Carlos e, ao seu lado, uma letra M, sobre a qual está colocada uma minúscula coroa. Esta moeda, portanto, tem cara e coroa do mesmo lado.

A expressão cara ou coroa é uma daquelas que permanecem na língua, mesmo quando já perderam seu sentido literal. Em toda língua sobrevivem estas expressões antiquadas; ainda falamos do nascer do sol, ou pôr do sol, mesmo sabendo que não é o Sol que sobe ou desce, mas sim a Terra que se move; ou falamos do fim do mundo, mesmo sabendo que na superfície de uma esfera não existe um fim. Estas expressões existem há séculos, e fazem parte do patrimônio da língua. As expressões que apareceram recentemente e se referem a tecnologias, no entanto, envelhecem muito rápido, perdem o sentido literal de uma geração para a outra e provavelmente acabam desaparecendo. A maioria dos alunos ainda entende o que significa queimar o filme, virar o disco, cair a ficha ou dar tilt na máquina; quantos deles porém seriam capazes de dizer o que significam literalmente estas expressões?

(hshippert)

A Estatística e os dicionários

Ler dicionários pode não ser um passatempo muito popular, mas certamente nos faz aprender algumas coisas interessantes. Por exemplo, dicionários nos mostram como o resto do mundo define a nossa profissão ou área de estudo. Todos sabem, mais ou menos, o que é Medicina, Matemática ou Direito. Mas quantos saberiam dizer o que é  Mecatrônica? Ou Sistemas de Informação? Ou Estatística?

Além disso, dicionários de diferentes épocas nos mostram como a profissão ou área mudou ao longo do tempo. Todos os dicionários incluem a Matemática, que é mais antiga do que qualquer dicionário, e as definições não variam muito; poucos incluem a Mecatrônica. Todos incluem a Estatística, mas as definições foram sendo modificadas com o passar do tempo, acompanhando a evolução ocorrida no último século.

O primeiro dicionário da língua portuguesa foi o de Moraes Silva; a primeira edição é de 1789 (disponível online), mas não tem a palavra ‘estatística’. A edição que tenho é a 9ª.; não está datada, mas parece ser de c. 1890.

Estatística: 1. Ciência que ensina a conhecer um estado com relação à sua extensão, povoação, agricultura, administração, instrução, marinha, indústria, comércio, etc. (…) 4. Estatística médica: relação, enumeração das mortes, nascimentos, doenças individuais, endêmicas ou epidêmicas num dado período. num dado país, cidade, etc.; demografia. [1]

Outro dicionário antigo importante é o de Caldas Aulete. Na edição de 1881, a Estatística é definida como:

Estatística. A sciencia dos factos sociaes expressos em termos numericos, a qual ensina a conhecer uma nação debaixo do ponto de vista da sua extensão, população, industria, agricultura, administracção, instrucção, força militar, marinha, commercio, etc., em um momento dado. [2]

Nestas duas definições, o que é chamado de “Estatística” é aquilo que hoje chamamos de Estatística Descritiva: um conjunto de técnicas para organizar e resumir grandes quantidades de dados; geralmente, para descrever um “estado” (um país, região, cidade, etc.). Se a Estatística se limitasse a isto, seria certamente útil para a geógrafos, demógrafos, administradores, médicos que trabalham em saúde pública, e pesquisadores em áreas voltadas para populações; mas provavelmente não iria interessar muito a biólogos, físicos, engenheiros, tecnólogos, etc.

No início do século XX, as coisas começaram a mudar. Galton, Pearson e Fisher lançaram nesta época as bases da Inferência, que um dicionário especializado define como “O processo de tirar conclusões sobre uma população com base em medidas ou observações feitas numa amostra de unidades desta população” [3]. Contudo, nem o Larousse (c. 1910), nem o dicionário da Academia espanhola (1939) ainda não iam além da Estatística Descritiva, e não usavam as palavras inferência, probabilidade ou amostras em suas definições:

Estatística: ciência que tem por objeto o agrupamento metódico dos fatos sociais que se prestam à avaliação numérica (impostos, recrutamento, condenações, produções industriais e agrícolas, população, religião, etc. [4]

Estatística: 1. Censo ou recontagem da população, recursos naturais e industriais, trânsito ou qualquer outra manifestação de estado, província, município, classe, etc. 2. Estudo dos fatos morais ou físicos do mundo que se prestam à numeração ou contagem e à comparação dos números que lhes dizem respeito. [5]

No final do século, as definições dadas pela Enciclopédia Britânica e dois dicionários americanos (anos 1970-1980s), tomadas em conjunto, definem bem o escopo da Inferência; contudo, as que usam a palavra inferência não usam probabilidade, e vice-versa, e só uma delas menciona amostras:

Estatística: na matemática, diz respeito a qualquer tipo de coleta de dados numéricos, e aos processos de analisar e fazer inferências a partir dos dados. [6]

Estatística: a ciência que lida com a coleta, classificação, análise e interpretação de fatos e dados numéricos, e que, usando a teoria das probabilidades, impõe ordem e regularidade a agregados de elementos mais ou menos disparatados. [7]

Estatística. A matemática da coleção, organização e interpretação de dados numéricos, especialmente a análise das características de populações por inferência a partir de amostragem. [8]

No Brasil, os dois dicionários mais importantes são provavelmente o Aurélio e o Houaiss. O verbete do Aurélio é longo, incluindo cinco itens. O primeiro é:

Estatística: 1. Parte da Matemática em que se investigam os processos de obtenção, organização e análise de dados sobre uma população ou sobre uma coleção de seres quaisquer, e os métodos de tirar conclusões e fazer ilações ou predições com base nesses dados. [9]

A definição é abrangente, porque sugere que a Estatística também inclui disciplinas para “obtenção … de dados” (como a Amostragem e o Planejamento de experimentos), além das técnicas para “organização e análise dos dados” (Estatística descritiva), e para “fazer ilações” (Inferência) com base nos dados; não menciona porém que os dados se originam de amostras, ou que estas ilações são baseadas em probabilidades. A definição do Houaiss é menos interessante:

Estatística. 1. Ramo da matemática que trata da coleta, da análise, da interpretação e da apresentação de massas de dados numéricos. 2. qualquer coleta de dados quantitativos. [10]

Se os dicionários convencionais não parecem acertar com uma definição adequada de Estatística, o que dizem os dicionários especializados, escritos por estatísticos? Este é o problema: geralmente não dizem nada. Dois dos dicionários técnicos mais conhecidos atualmente, o de Porkess [11] e o da Universidade de Cambridge [3], não têm um verbete “Estatística” (embora tenham o termo técnico “estatística”: uma função definida sobre os dados de uma amostra).

Que conclusão podemos tirar disto tudo – o que os leigos pensam que é a Estatística? Os verbetes citados acima sugerem que o conceito de Estatística descritiva é bem compreendido pelos leigos (que escrevem os dicionários), mas o conceito de Inferência não está claro para eles. Estes verbetes não enfatizam o que me parece o mais importante: o fato de que todas as conclusões estatísticas são baseadas na teoria de Probabilidades, e portanto são sempre incertas e sujeitas a erros.

O público em geral quer que haja certeza nos resultados obtidos por estatísticos e cientistas; no entanto, como Richard Feynman sempre enfatizou ao longo de sua carreira divulgando a Física (um capítulo de seus livros tem justamente o título de The Uncertainty of Science [12]), toda conclusão científica é incerta e provisória. Mostrar que a incerteza é inerente a todo o conhecimento humano, e que a Inferência é a ferramenta de que dispomos para lidar com ela, pode ser por isso a melhor maneira de despertar o interesse do público pela Estatística.

Textos originais [todas as traduções são minhas]:

Inference. The process of drawing conclusions about a population on the basis of measurements or observations made on a sample of units from the population. [3]

Statistique: science qui a pour objet le groupement méthodique des faits sociaux qui se prêtent à une évaluation numérique (impôts, recrutement, condamnations, productions industrielles et agricoles, population, religion, etc. [4]

Estadística. Censo o recuento de la población, de los recursos naturales e industriales, del tráfico o de cualquier otra manifestación de un estado, provincia, pueblo, clase, etc. | 2. Estudio de los hechos morales o físicos del mundo que se prestan a numeración o recuento y a comparación de las cifras a ellos referentes. [5]

Statistics. in mathematics, concern any kind of numerical data gathering and the processes of analyzing and of making inferences from the data. [6]

Statistics: the science that deals with the collection, classification, analysis and interpretation of numerical facts or data, and that, by use of mathematical theory of probability, imposes order and regularity on aggregates of more or less disparate elements. [7]

Statistics. The mathematics of the collection, organization, and interpretation of numerical data, esp. the analysis of population characteristics by inference from sampling. [8]

Referências

[1] Moraes Silva, Antônio de. Diccionario da Lingua Portugueza. 9a. ed. Lisboa. s/d (disponível online: https://digital.bbm.usp.br/handle/bbm/5413)

[2] Caldas Aulete, Diccionario Contemporaneo da Lingua Portugueza. Lisboa, 1881

[3] Everitt, B. S.; Skrondal, A. The Cambridge Dictionary of Statistics. 4th ed. Cambridge Univ. Press, 2010.

[4] Augé, Claude (ed.). Le larousse pour tous – nouveau dictionnaire encyclopédique, s/d

[5] Real Academia Española. Diccionario de la Lengua Española, 1939.

[6] Encyclopaedia Britannica, 15th ed., 1977.

[7] Webster´s Encyclopedic Unabridged Dictionary of the English Language. NY: Gramercy Books, 1989.

[8] The American Heritage Dictionary, 2nd College edition. Boston: Houghton Mifflin Co., 1982.

[9] Ferreira, Aurélio B. de H.. Novo Dicionário da Língua Portuguesa. 2ª ed., Rio: Nova Fronteira. 1986. 

[10] Houaiss, A. e Villar, M. S. Dicionário Houaiss da Língua Portuguesa. Rio: Objetiva, 2004

[11] Porkess, Roger. Collins Dictionary of Statistics,2nd edit. Collins, 2005.

[12] Feynman, R. P. The meaning of it all – thoughts of a citizen-scientist. NY: Basic Books, 1998.

(hshippert)