ISSN 1982-1026

Boletim de História e Filosofia da Biologia

Volume 19, número 4
Dezembro de 2025

Publicado pela Associação Brasileira de Filosofia e História da Biologia (ABFHiB)

Artigo: “Uma análise quantitativa do léxico darwiniano: o que as ocorrências revelam?”

Heraldo Mauch
Graduando do Curso de Ciências Biológicas do Instituto de Biociências, USP
heraldomauch1@gmail.com

Sofia Scarinci Nestrovski
Doutoranda do Programa de Pós-Graduação do Departamento de Teoria Literária e Literatura Comparada, USP
s.nestrovski@gmail.com

Introdução

Uma análise quantitativa de aspectos linguísticos é capaz de revelar camadas de um texto que a análise qualitativa nem sempre esclarece. Mesmo no caso de um registro oral, feito em outro campo do saber, já houve descobertas relevantes. Em 1978, o pesquisador em psicanálise Hartvig Dahl gravou e transcreveu dez sessões de análise. A sintaxe da fala do analista e dos analisandos foi então decupada por sua equipe, de modo a tornar evidentes as variações de sintaxe, vocabulário e outros marcadores linguísticos associados a hesitação, ambiguidade ou complexidade. Uma das conclusões a que chegaram foi a de que a mudança que um analista fazia no uso dos verbos, passando da voz ativa à voz passiva, configurava uma tomada de posição frente ao analisando. O artigo de Dahl e colaboradores (1978) descreve como, durante uma sessão, o analista recorreu mais de uma vez à voz passiva, em construções como “[…] sempre foi apresentado […]” no lugar da afirmação mais direta “você já apresentou”,  desvinculando o analisando como sujeito da ação. O artigo conclui: “Em resumo, parece que descobrimos um assassinato psicológico por meio da sintaxe”. A conclusão se torna mais aprofundada quando comparada à versão que o próprio analista relatava de como havia sido a sessão. A minúcia quantitativa permitiu notar contradições entre o registro do tratamento daquele paciente e a interpretação que o analista fazia dele, e no qual se baseava para conduzir a análise.

De modo semelhante, e em um contexto mais próximo ao nosso, Bárbara Jiménez-Pazos contrapôs a maneira como Charles Darwin descreve a própria visão de mundo e o que uma pesquisa quantitativa do vocabulário de seus textos é capaz de revelar. Em “Darwin Puzzled? A Computer‑assisted Analysis of Language in the Origin of Species” (2022), a autora quantificou certos usos do vocabulário de Darwin e comparou as variações das seis edições de Origin of Species, revelando o aumento expressivo de certos termos relacionados à apreciação estética da natureza (como “beautiful”, “extraordinary” ou “wonderful”) e uma discreta variação dos termos relacionados ao sagrado (como “holy” ou “divine”)[1]. A pesquisadora contrastou esses dados à avaliação que Darwin faz de si mesmo em sua autobiografia, de que, com o passar do tempo, foi se tornando insensível (o termo usado por ele é “colour-blind”) à grandiosidade da natureza (Barlow, 1958, p. 91). Com base nesses textos, Jiménez-Pazos evidencia a contradição entre a maneira como Darwin representa a si mesmo e aquilo que sua sintaxe revela. A conclusão a que ela chega é de que Darwin teria, na verdade, encontrado uma forma de olhar o mundo natural que prescinde da ação divina, mas que, não obstante, atribui valor estético ao objeto de percepção; e é apenas a falta de um outro instrumental teórico ou vocabulário, devido às condições culturais e históricas em que estava inserido, que o faria crer ter perdido a capacidade de se maravilhar com a natureza.

A chegada da síntese moderna da evolução levou ao fim do chamado “eclipse do darwinismo” (Huxley, [1942], 1983; Bowler, 1983). Ao integrar a herança mendeliana à seleção natural, e usar evidências empíricas para romper com o “lamarckismo”[2], um Darwin atualizado ressurgiu (Huxley[1942], 1983). Contudo, o darwinismo idealizado da síntese moderna é uma redução de seu pensamento. Ao contrário da imagem construída posteriormente, para o próprio Darwin, nem tudo na evolução poderia ser explicado pela seleção natural. De fato, em sua extensa produção bibliográfica, pouco visitada, ele ressalta que as variedades de espécies se originam por diversos mecanismos secundários, incluindo o uso e desuso de caracteres adquiridos durante a vida. Esses outros mecanismos não substituem a seleção natural, mas poderiam complementá-la ou a ela se opor (Darwin, 1959; Gliboff, 2023). Com isso em mente, realizar uma exploração quantitativa do vocabulário de Darwin em seus livros científicos, a partir do On the origin of species by means of natural selection, or the preservation of favoured races in the struggle for life (1859), pode ajudar a revelar a evolução de seu pensamento sobre os diferentes mecanismos de transformação das espécies, e a ênfase que ele dava a cada um.

Esta pesquisa foi desenvolvida como trabalho de final de curso da disciplina “A origem das espécies, de Charles Darwin”, ministrada durante o 1º semestre de 2025, no Programa de Pós-Graduação Interunidades de Ensino de Ciências da USP e no Curso de Ciências Biológicas do Instituto de Biociências da USP. O objetivo geral do estudo foi o de mostrar, quantitativamente, como, de fato, a seleção natural é apenas um, não exclusivo, meio pelo qual Darwin explica a transformação das espécies em suas obras. Como objetivos específicos, buscou-se verificar se algum dos mecanismos têm prevalência em determinadas obras ou períodos da vida de Darwin, e, se sim, qual; e como a questão que fora chamada de “o mistério dos mistérios”, a origem das espécies e seus mecanismos, foi tratada por Darwin em suas investigações da natureza posteriores ao Origin. Além disso, para apontar caminhos para futuras análises lexicográficas de Darwin, procurou-se observar quais os padrões de pensamento e focos de suas investigações. Ao quantificar seu vocabulário, é possível entrever os temas que mais o ocuparam, e até mesmo servir como ponto de partida de análises da visão de mundo de Darwin.

Metodologia

Adotamos uma metodologia computacional de linguística de corpus, para realizar uma análise lexical comparativa, como a feita por Jiménez‑Pazos (2022). Baixamos cada um dos 11 títulos e respectivos 13 volumes de obras científicas publicadas por Darwin entre 1859 e 1881. Todos estão disponíveis gratuitamente no site darwin-online, com o título The Complete Work of Charles Darwin Online (Wyhe, 2002).

Lista das obras de Charles Darwin analisadas disponíveis em formato texto em Darwin-online:

  1. On the origin of species by means of natural selection, or the preservation of favoured races in the struggle for life. London: John Murray, 1859.
  2. On the various contrivances by which British and foreign orchids are fertilised by insects. London: John Murray, 1862.
  3. The variation of animals and plants under domestication. Vol. 1. London: John Murray, 1868.
  4. The variation of animals and plants under domestication. Vol. 2. London: John Murray, 1868.
  5. The descent of man, and selection in relation to sex. Vol. 1. London: John Murray, 1871.
  6. The descent of man, and selection in relation to sex. Vol. 2. London: John Murray, 1871.
  7. The expression of the emotions in man and animals. London: John Murray, 1872.
  8. Insectivorous plants. London: John Murray, 1875.
  9. The movements and habits of climbing plants. 2 ed. London: John Murray, 1875.
  10. The effects of cross and self fertilisation in the vegetable kingdom          . London: John Murray, 1876.
  11. The different forms of flowers on plants of the same species. London: John Murray, 1877.
  12. The power of movement in plants. London: John Murray, 1880.
  13. The formation of vegetable mould, through the action of worms, with observations on their habits. London: John Murray, 1881.

Os levantamentos de frequência foram realizados através do software TextSTAT 3 (disponível em: https://neon.niederlandistik.fu-berlin.de/en/textstat/) com os parâmetros “case insensitive”,whole words only”, “50 context left” e “50 context right”.

Primeiro, buscamos as 6 causas de variação listadas por Darwin no Prefácio à segunda edição do seu The descent of man, como indicado por Maria Elice Prestes (2023, pp. 168-169): “natural selection”, “use and disuse”, “conditions of life”, “reversion”, “correlation of growth” e “sexual selection”.  Realizamos a leitura dos trechos, e removemos manualmente aparatos da edição, como as propagandas que eram impressas ao final de cada livro, anunciando outros volumes. Por fim, analisamos como a frequência de uso dos termos variou ao longo do tempo nas obras selecionadas.

Por fim, por meio de levantamento das 20 palavras mais usadas por Darwin nas obras aqui analisadas, levantamos os termos mais frequentes no conjunto de obras, ignorando conjunções, preposições, artigos e verbos de ligação, como “the”, “as”, “with”, “is”.

Resultados

Os trechos levantados foram depositados em um banco de dados público, e estão disponíveis em: https://doi.org/10.5281/zenodo.18027162.

Das 2.039 ocorrências totais obtidas, o termo “natural selection” foi o mais frequente nas obras selecionadas de Darwin (642 vezes);  seguido de perto por “conditions of life” (637 vezes); depois por “reversion” (397 vezes); “sexual selection” (295 vezes); “correlation of growth” (36) e “use and disuse” que apresentou menos menções (32 vezes). A Tabela 1 detalha a contagem de cada um desses seis termos-chave nas obras.

Tabela 1: Contagem de aparições de conceitos ligados à variação nas obras de Charles Darwin publicadas entre 1859 e 1881.

natural selection sexual selection use and disuse reversion correlation of growth conditionof life
1. Origin of species (1859) 308 18 11 25 19 104
2. Orchids (18675 9 0 0 0 1 6
3. The variation… Vol.1 (1868) 28 0 5 61 14 49
4. The variation… Vol.2 (1868) 100 2 8 239 2 105
5. The descent of man Vol.1 (1871) 99 99 4 30 0 16
6. The descent of man Vol.2 (1871) 75 175 4 11 0 16
7. The expression of emotions (1872) 4 1 0 2 0 0
8. Insectivorous plants (1875) 2 0 0 0 0 0
9. Climbing plants (1875) 1 0 0 0 0 4
10. Cross and self-fertilization (1876) 4 0 0 5 0 14
11. Different forms of flowers (1877) 7 0 0 11 0 323
12. Power of movement (1880) 5 0 0 13 0 0
13.  Earthworms (1881) 0 0 0 0 0 0
Total 642 295 32 397 36 637

 

Quando consideramos a frequência absoluta de uso de cada termo em cada obra (Figura 1), no Origin (1859), o termo “natural selection” é o mais proeminente, com 308 menções (representando 63,5% das ocorrências ligadas a variação no livro). Essa predominância se mantém em On the various contrivances by which British and foreign orchids are fertilised by insects (1862), no qual “natural selection” aparece apenas 9 vezes (56%). Já em The variation of animals and plants under domestication (vol. 1 e 2, 1868) o cenário muda, “natural selection” ocorre 28 vezes (17,8%) no volume 1 e é mencionada 100 vezes (21,9%) no volume 2, sendo “reversion” o termo mais utilizado em ambos os volumes, com 61 menções (40%) no volume 1 e 239 menções (52%) no volume 2.

Figura 1: Distribuição da frequência absoluta das seis causas de variação indicadas por Darwin no Prefácio da segunda edição do The Descent of Man (azul escuro: natural selection; laranja: sexual selection; vermelho: use and disuse; azul claro: reversion; roxo: correlation of growth; verde: conditions of life) nas obras de Charles Darwin publicadas entre 1859 e 1881.

No volume 1 de The descent of man and selection in relation to sex (1871), “natural selection” e “sexual selection” são igualmente mencionados com 99 menções cada (38% das ocorrências). No volume 2, “sexual selection” se torna o termo mais utilizado, mencionado 175 vezes, (62,3%)[3].  Em The expression of the emotions in man and animals (1872), o termo mais frequentemente é“natural selection” com 4 ocorrências. Em Insectivorous plants (1875) “natural selection”  domina, embora com apenas 2 menções.

Nos trabalhos botânicos que se seguem, “conditions of life” ganha destaque: é o termo mais frequente em On the movements and habits of climbing plants (1875),  com 4 menções. Em The effects of cross and self fertilisation in the vegetable kingdom (1876), é mencionado 14 vezes (60,9%), e em The different forms of flowers on plants of the same species (1877), 323 vezes (94,7%). Em The power of movement in plants (1880), “reversion” é citado 13 vezes (72%). E, por fim, em The formation of vegetable mould, through the action of worms, with observations on their habits (1881), não há nenhuma menção aos termos ligados à variação.

No caso da escrita de Darwin (Quadro 2), é relevante notar que, dentro do corpus analisado, as três palavras mais repetidas são “plants”, “species” e “flowers”, enquanto “animals” é só a décima-terceira palavra da lista, e “man”, a décima-quinta; “little” aparece em décimo lugar, mas seu oposto, “large”, “great” ou “big” não consta entre os vinte primeiros colocados.  Ressaltamos “selection”, com 1.958 ocorrências, que pode estar ligado a “natural selection” e “sexual selection”.

Quadro 2: Lista de termos mais utilizados nas obras de Charles Darwin publicadas entre 1859 e 1881.

Palavra Número de ocorrências Palavra Número de ocorrências
plants 6.317 selection 1.958
species 5.535 pollen 1.935
flowers 3.239 animals 1.910
leaves 2.915 time 1.867
crossed 2.413 man 1.839
plant 2.321 manner 1.839
self-fertilised 2.086 different 1.778
seeds 2.077 produced 1.765
male 1.979 young 1.674
little 1.961 varieties 1.640

Discussão

Dentro do conjunto de obras, “natural selection” é uma constante, sendo o único termo presente em todos os livros, com exceção de “The formation of vegetable mould, through the action of worms, with observations on their habits”. Vale notar que, com exceção de “conditions of life”, há uma redução mais generalizada do vocabulário relacionado à questão da variação das espécies — uma análise qualitativa dos textos poderia avaliar se essa mudança corresponde a uma atualização de seus interesses, ou se essas questões amplamente abordadas no Origin se tornaram implícitas, servindo de ponto de partida para seus escritos posteriores.

O aparecimento do termo “use and disuse” sugere que ele não descartou esse mecanismo, evidenciando o equívoco histórico de tomar a herança de caracteres adquiridos como traço característico da teoria de Lamarck. Esse fato já foi apontado há muito tempo por um biólogo evolucionista, Ernst Mayr (1964), que identificou 13 referências ao conceito no Origin. Essa recorrência mostra que a ideia coexistia com a seleção natural no pensamento de Darwin.

Como limitação do presente estudo está a limitação de nossa metodologia, que nos levou a localizar apenas 11 das 13 ocorrências de “use and disuse” em Origin identificadas por Mayr. Uma investigação mais detalhada dos textos, considerando a ocorrência de “use” e “disuse” de forma separada e a inclusão de citações indiretas e correlatas, poderia revelar mais menções ao conceito. Essa mesma consideração se aplica aos demais termos-chave aqui analisados. Além disso, na nossa busca, não foram incluídos outros textos além dos publicados em formato de livro. Isto é, não foram levados em consideração os artigos publicados em periódicos, igualmente relevantes, nem a vasta produção epistolar de Darwin ou seus diários. Essa ampliação do estudo será realizada em outra oportunidade.

Em relação aos termos mais frequentes no conjunto da obra de Darwin, é evidente o uso majoritário de vocabulário botânico, com destaque para “plants”, “flowers” e “leaves”. Tal fato é consistente com o corpus analisado, no qual oito das obras se dedicam ao estudo de plantas.

Considerações finais

Este artigo explora uma primeira etapa do “círculo hermenêutico” de análise de texto como descrito por Antonio Candido (2006). Para ele, a crítica literária, longe de ser mera opinião ou impressão do leitor, deve necessariamente passar por uma avaliação detida dos elementos de que um texto é composto: seu vocabulário, encadeamento, grau de clareza ou obscuridade, metáforas e outras figuras de linguagem, elementos sonoros etc. Disso, parte-se para outro nível de investigação do contexto social e literário em que o texto se insere, localizando referências e ressonâncias, de maneira que o crítico “empenha [sua] personalidade” e “intervém na sensibilidade do leitor”, oferecendo, finalmente, uma interpretação da obra (Candido, [1959], 2023, p. 24). Sendo o movimento da hermenêutica algo circular, no entanto, nenhuma dessas etapas é um começo ou final definitivo, e o caminho não é definido de antemão.

Por fim, este artigo se dirige a uma pergunta ainda em aberto: quais métodos seriam viáveis para se pensar uma crítica literária da ciência — à maneira das áreas interdisciplinares mais consolidadas, como a História da ciência, Filosofia da ciência, Antropologia da ciência, Sociologia da ciência e Psicologia da ciência?

Referências

BARLOW, Nora (Ed.). The autobiography of Charles Darwin 1809-1882. With the original omissions restored. Edited and with appendix and notes by his grand-daughter Nora Barlow. London: Collins, 1958.

BOWLER, Peter J. The eclipse of Darwinism: Anti-Darwinian evolution theories in the decades around 1900. Baltimore: Johns Hopkins University Press, 1983.

CANDIDO, Antonio. Formação da literatura brasileira: momentos decisivos. 1º volume, 1750-1836). [1959]. São Paulo: Martins Fontes, 2023.

CANDIDO, Antonio. O estudo analítico do poema. 5. ed. São Paulo: Humanitas, 2006. Disponível em: http://revistas.usp.br/criacaoecritica. Acesso em: 15 jul. 2025.

DAHL, Hartvig; TELLER, Virginia; MOSS, Donald; TRUJILLO, Manuel. Countertransference Examples of the Syntactic Expression of Warded-Off Contents. The Psychoanalytic Quarterly, 47 (3): 339-363, 1978. Disponível em: https://doi.org/10.1080/21674086.1978.11926847 Acesso em: 15 jul. 2025.

DARWIN, Charles R. On the origin of species by means of natural selection, or the preservation of favoured races in the struggle for life. 1st ed. London: John Murray, 1859.

DARWIN, Charles R. On the various contrivances by which British and foreign orchids are fertilised by insects. London: Murray, 1862.

DARWIN, Charles R. The variation of animals and plants under domestication. London: Murray. First edition, first issue. Volume 1. 1868.

DARWIN, Charles R. The variation of animals and plants under domestication. London: Murray. First edition, first issue. Volume 2. 1868.

DARWIN, Charles R. The descent of man, and selection in relation to sex. London: Murray. Volume 1. 1st edition. 1871.

DARWIN, Charles R. The descent of man, and selection in relation to sex. London: Murray. Volume 2. 1st edition. 1871.

DARWIN, Charles R. The expression of the emotions in man and animals. London: Murray, 1872.

DARWIN, Charles R. Insectivorous plants. London: Murray, 1875.

DARWIN, Charles R. On the movements and habits of climbing plants. 2nd edition. London: Murray, 1872.

DARWIN, Charles R. The effects of cross and self fertilisation in the vegetable kingdom. London: Murray, 1876.

DARWIN, Charles R. The different forms of flowers on plants of the same species.  London: Murray, 1877.

DARWIN, Charles R. The power of movement in plants. London: Murray, 1880.

DARWIN, Charles R. The formation of vegetable mould, through the action of worms, with observations on their habits. London: Murray, 1881.

FERREIRA, Luiz Gustavo; LIMA, Bruno F.; Barbosa, Gabriel R.; PRESTES, Maria Elice B. A seleção sexual como causa secundária da evolução no livro A Origem das Espécies. Boletim de História e Filosofia da Biologia, 19 (4): 1-9, dez. 2025.

GLIBOFF, Sander. Origin’s Chapter V: How “Random” Is Evolutionary Change?. Pp. 261-273, in: PRESTES, Maria Elice B. (Ed.). Understanding Evolution in Darwin’s “Origin”: The Emerging Context of Evolutionary Thinking. Cham: Springer, 2023.

HUXLEY, Julian. Evolution: The modern synthesis. [1942]. Baltimore: Johns Hopkins University Press, 1983.

JIMÉNEZ-PAZOS, Bárbara. Darwin Puzzled? A Computer-assisted Analysis of Language in the Origin of Species. Topoi, 41 (3): 561-571, 2022.

JIMÉNEZ-PAZOS, Bárbara. You Too Can Find “Grandeur in This View of Life”: A Linguistic Remedy for Resisting the Desire to Abandon Darwin’s Origin of Species. Pp. 183-202, in: PRESTES, Maria Elice B. (Ed.). Understanding Evolution in Darwin’s “Origin”: The Emerging Context of Evolutionary Thinking. Cham: Springer, 2023.

MARTINS, Lilian A.-C. P. A teoria da progressão dos animais, em Lamarck. Rio de Janeiro: Booklink; São Paulo, FAPESP; Campinas, GHTC, 2007.

MAYR, Ernst. Introduction. Pp. vii-xxvii, in: DARWIN, Charles R. On the origin of species: A facsimile of the first edition. Oxford: Oxford University Press, 1964.

PRESTES, Maria Elice B. There Have Been Few Such Naturalists Before, but Still…: Darwin’s Public Account of Predecessors. Pp. 163-182, in: PRESTES, Maria Elice B. (Ed.). Understanding Evolution in Darwin’s “Origin”: The Emerging Context of Evolutionary Thinking. Cham: Springer, 2023.

TANGHE, Koen B. Leave Lamarck Alone!: Why the Use of the Term “Lamarckism” and Its Cognates Must Be Shunned. Perspectives in Biology and Medicine, 62 (1): 72-94, 2019.

WYHE John van, The Complete Work of Charles Darwin Online. 2002. Disponível em: http://darwin-online.org.uk/. Acesso em: 15 jul. 2025.

Notas

[1] A autora retoma a escritura de Darwin em capítulo intitulado “You Too Can Find “Grandeur in This View of Life”: A Linguistic Remedy for Resisting the Desire to Abandon Darwin’s Origin of Species”, na obra coletiva Understanding Evolution in Darwin’s “Origin”: The Emerging Context of Evolutionary Thinking (2023).

[2] O termo “lamarckismo” usado por Huxley [1942] e muitos outros naturalistas, desde o final do século XIX, refere-se à herança de caracteres adquiridos, numa sinonímia que a historiografia da biologia, há várias décadas, mostra ser um equívoco a ser descartado ou, no máximo, entre aspas indicadoras de termo usado por outros autores, desavisados do problema (ver Martins, 2007; Tangue, 2019).

[3] Sobre o papel da seleção sexual na teoria de Darwin, particularmente, no A Origem das Espécies, ver Ferreira et al. (2025), neste mesmo número do Boletim de História e Filosofia da Biologia.

 

Como citar este artigo:

MAUCH, Heraldo; NESTROVSKI, Sofia Scarici. Uma análise quantitativa do léxico darwiniano: o que as ocorrências revelam? Boletim de História e Filosofia da Biologia, 19 (4): 1-10, dez. 2025. Versão online disponível em: https://www.abfhib.org. Acesso em: dd/mm/aaaa.