A Estatística e os dicionários

Ler dicionários pode não ser um passatempo muito popular, mas certamente nos faz aprender algumas coisas interessantes. Por exemplo, dicionários nos mostram como o resto do mundo define a nossa profissão ou área de estudo. Todos sabem, mais ou menos, o que é Medicina, Matemática ou Direito. Mas quantos saberiam dizer o que é  Mecatrônica? Ou Sistemas de Informação? Ou Estatística?

Além disso, dicionários de diferentes épocas nos mostram como a profissão ou área mudou ao longo do tempo. Todos os dicionários incluem a Matemática, que é mais antiga do que qualquer dicionário, e as definições não variam muito; poucos incluem a Mecatrônica. Todos incluem a Estatística, mas as definições foram sendo modificadas com o passar do tempo, acompanhando a evolução ocorrida no último século.

O primeiro dicionário da língua portuguesa foi o de Moraes Silva; a primeira edição é de 1789 (disponível online), mas não tem a palavra ‘estatística’. A edição que tenho é a 9ª.; não está datada, mas parece ser de c. 1890.

Estatística: 1. Ciência que ensina a conhecer um estado com relação à sua extensão, povoação, agricultura, administração, instrução, marinha, indústria, comércio, etc. (…) 4. Estatística médica: relação, enumeração das mortes, nascimentos, doenças individuais, endêmicas ou epidêmicas num dado período. num dado país, cidade, etc.; demografia. [1]

Outro dicionário antigo importante é o de Caldas Aulete. Na edição de 1881, a Estatística é definida como:

Estatística. A sciencia dos factos sociaes expressos em termos numericos, a qual ensina a conhecer uma nação debaixo do ponto de vista da sua extensão, população, industria, agricultura, administracção, instrucção, força militar, marinha, commercio, etc., em um momento dado. [2]

Nestas duas definições, o que é chamado de “Estatística” é aquilo que hoje chamamos de Estatística Descritiva: um conjunto de técnicas para organizar e resumir grandes quantidades de dados; geralmente, para descrever um “estado” (um país, região, cidade, etc.). Se a Estatística se limitasse a isto, seria certamente útil para a geógrafos, demógrafos, administradores, médicos que trabalham em saúde pública, e pesquisadores em áreas voltadas para populações; mas provavelmente não iria interessar muito a biólogos, físicos, engenheiros, tecnólogos, etc.

No início do século XX, as coisas começaram a mudar. Galton, Pearson e Fisher lançaram nesta época as bases da Inferência, que um dicionário especializado define como “O processo de tirar conclusões sobre uma população com base em medidas ou observações feitas numa amostra de unidades desta população” [3]. Contudo, nem o Larousse (c. 1910), nem o dicionário da Academia espanhola (1939) ainda não iam além da Estatística Descritiva, e não usavam as palavras inferência, probabilidade ou amostras em suas definições:

Estatística: ciência que tem por objeto o agrupamento metódico dos fatos sociais que se prestam à avaliação numérica (impostos, recrutamento, condenações, produções industriais e agrícolas, população, religião, etc. [4]

Estatística: 1. Censo ou recontagem da população, recursos naturais e industriais, trânsito ou qualquer outra manifestação de estado, província, município, classe, etc. 2. Estudo dos fatos morais ou físicos do mundo que se prestam à numeração ou contagem e à comparação dos números que lhes dizem respeito. [5]

No final do século, as definições dadas pela Enciclopédia Britânica e dois dicionários americanos (anos 1970-1980s), tomadas em conjunto, definem bem o escopo da Inferência; contudo, as que usam a palavra inferência não usam probabilidade, e vice-versa, e só uma delas menciona amostras:

Estatística: na matemática, diz respeito a qualquer tipo de coleta de dados numéricos, e aos processos de analisar e fazer inferências a partir dos dados. [6]

Estatística: a ciência que lida com a coleta, classificação, análise e interpretação de fatos e dados numéricos, e que, usando a teoria das probabilidades, impõe ordem e regularidade a agregados de elementos mais ou menos disparatados. [7]

Estatística. A matemática da coleção, organização e interpretação de dados numéricos, especialmente a análise das características de populações por inferência a partir de amostragem. [8]

No Brasil, os dois dicionários mais importantes são provavelmente o Aurélio e o Houaiss. O verbete do Aurélio é longo, incluindo cinco itens. O primeiro é:

Estatística: 1. Parte da Matemática em que se investigam os processos de obtenção, organização e análise de dados sobre uma população ou sobre uma coleção de seres quaisquer, e os métodos de tirar conclusões e fazer ilações ou predições com base nesses dados. [9]

A definição é abrangente, porque sugere que a Estatística também inclui disciplinas para “obtenção … de dados” (como a Amostragem e o Planejamento de experimentos), além das técnicas para “organização e análise dos dados” (Estatística descritiva), e para “fazer ilações” (Inferência) com base nos dados; não menciona porém que os dados se originam de amostras, ou que estas ilações são baseadas em probabilidades. A definição do Houaiss é menos interessante:

Estatística. 1. Ramo da matemática que trata da coleta, da análise, da interpretação e da apresentação de massas de dados numéricos. 2. qualquer coleta de dados quantitativos. [10]

Se os dicionários convencionais não parecem acertar com uma definição adequada de Estatística, o que dizem os dicionários especializados, escritos por estatísticos? Este é o problema: geralmente não dizem nada. Dois dos dicionários técnicos mais conhecidos atualmente, o de Porkess [11] e o da Universidade de Cambridge [3], não têm um verbete “Estatística” (embora tenham o termo técnico “estatística”: uma função definida sobre os dados de uma amostra).

Que conclusão podemos tirar disto tudo – o que os leigos pensam que é a Estatística? Os verbetes citados acima sugerem que o conceito de Estatística descritiva é bem compreendido pelos leigos (que escrevem os dicionários), mas o conceito de Inferência não está claro para eles. Estes verbetes não enfatizam o que me parece o mais importante: o fato de que todas as conclusões estatísticas são baseadas na teoria de Probabilidades, e portanto são sempre incertas e sujeitas a erros.

O público em geral quer que haja certeza nos resultados obtidos por estatísticos e cientistas; no entanto, como Richard Feynman sempre enfatizou ao longo de sua carreira divulgando a Física (um capítulo de seus livros tem justamente o título de The Uncertainty of Science [12]), toda conclusão científica é incerta e provisória. Mostrar que a incerteza é inerente a todo o conhecimento humano, e que a Inferência é a ferramenta de que dispomos para lidar com ela, pode ser por isso a melhor maneira de despertar o interesse do público pela Estatística.

Textos originais [todas as traduções são minhas]:

Inference. The process of drawing conclusions about a population on the basis of measurements or observations made on a sample of units from the population. [3]

Statistique: science qui a pour objet le groupement méthodique des faits sociaux qui se prêtent à une évaluation numérique (impôts, recrutement, condamnations, productions industrielles et agricoles, population, religion, etc. [4]

Estadística. Censo o recuento de la población, de los recursos naturales e industriales, del tráfico o de cualquier otra manifestación de un estado, provincia, pueblo, clase, etc. | 2. Estudio de los hechos morales o físicos del mundo que se prestan a numeración o recuento y a comparación de las cifras a ellos referentes. [5]

Statistics. in mathematics, concern any kind of numerical data gathering and the processes of analyzing and of making inferences from the data. [6]

Statistics: the science that deals with the collection, classification, analysis and interpretation of numerical facts or data, and that, by use of mathematical theory of probability, imposes order and regularity on aggregates of more or less disparate elements. [7]

Statistics. The mathematics of the collection, organization, and interpretation of numerical data, esp. the analysis of population characteristics by inference from sampling. [8]

Referências

[1] Moraes Silva, Antônio de. Diccionario da Lingua Portugueza. 9a. ed. Lisboa. s/d (disponível online: https://digital.bbm.usp.br/handle/bbm/5413)

[2] Caldas Aulete, Diccionario Contemporaneo da Lingua Portugueza. Lisboa, 1881

[3] Everitt, B. S.; Skrondal, A. The Cambridge Dictionary of Statistics. 4th ed. Cambridge Univ. Press, 2010.

[4] Augé, Claude (ed.). Le larousse pour tous – nouveau dictionnaire encyclopédique, s/d

[5] Real Academia Española. Diccionario de la Lengua Española, 1939.

[6] Encyclopaedia Britannica, 15th ed., 1977.

[7] Webster´s Encyclopedic Unabridged Dictionary of the English Language. NY: Gramercy Books, 1989.

[8] The American Heritage Dictionary, 2nd College edition. Boston: Houghton Mifflin Co., 1982.

[9] Ferreira, Aurélio B. de H.. Novo Dicionário da Língua Portuguesa. 2ª ed., Rio: Nova Fronteira. 1986. 

[10] Houaiss, A. e Villar, M. S. Dicionário Houaiss da Língua Portuguesa. Rio: Objetiva, 2004

[11] Porkess, Roger. Collins Dictionary of Statistics,2nd edit. Collins, 2005.

[12] Feynman, R. P. The meaning of it all – thoughts of a citizen-scientist. NY: Basic Books, 1998.

(hshippert)