Origem do discurso - Origin of speech

A origem da fala refere-se ao problema geral da origem da linguagem no contexto do desenvolvimento fisiológico dos órgãos da fala humana , como a língua , os lábios e os órgãos vocais usados ​​para produzir unidades fonológicas em todas as línguas humanas .

Fundo

Embora relacionada ao problema mais geral da origem da linguagem , a evolução das capacidades de fala distintamente humanas tornou-se uma área distinta e em muitos aspectos separada da pesquisa científica. O tópico é separado porque a linguagem não é necessariamente falada: pode igualmente ser escrita ou assinada . A fala é, neste sentido, opcional, embora seja a modalidade padrão para a linguagem.

Locais de articulação (passivo e ativo):
1. Exo-labial, 2. Endo-labial, 3. Dentário, 4. Alveolar, 5. Pós-alveolar, 6. Pré-palatal, 7. Palatal, 8. Velar, 9 . Uvular, 10. Faríngea, 11. Glótica, 12. Epiglótica, 13. Radical, 14. Póstero-dorsal, 15. Antero-dorsal, 16. Laminal, 17. Apical, 18. Sub-apical

Incontroversamente, macacos, macacos e humanos, como muitos outros animais, desenvolveram mecanismos especializados para produzir sons para fins de comunicação social. Por outro lado, nenhum macaco ou símio usa a língua para tais fins. O uso sem precedentes da língua, lábios e outras partes móveis de nossa espécie parece colocar a fala em uma categoria bastante distinta, tornando seu surgimento evolutivo um desafio teórico intrigante aos olhos de muitos estudiosos.

No entanto, insights recentes sobre a evolução humana - mais especificamente, a evolução litorânea do Pleistoceno humano - ajudam a entender como a fala humana evoluiu: diferentes pré-adaptações biológicas à linguagem falada têm sua origem em nosso passado próximo à água, como um cérebro maior (graças ao DHA e outro cérebro nutrientes específicos em frutos do mar), respiração voluntária (mergulho em apneia para crustáceos, etc.) e alimentação por sucção de frutos do mar moles e escorregadios. A alimentação por sucção explica por que os humanos, ao contrário de outros hominóides, evoluíram com descendência hioidal (osso da língua descendo na garganta), fileiras de dentes fechadas (com dentes caninos incisiformes) e uma língua globular perfeitamente ajustada a um palato abobadado e liso (sem transverso cristas como em macacos): tudo isso permitiu a pronúncia de consoantes. Outras pré-adaptações à fala humana, provavelmente mais antigas, são canções territoriais, duetos semelhantes aos do gibão e aprendizagem vocal. O aprendizado vocal, a habilidade de imitar sons - como em muitos pássaros e morcegos e vários cetáceos e pinipedia - é indiscutivelmente necessário para localizar ou reencontrar (em meio à folhagem ou no mar) a prole ou os pais. Na verdade, linhas de evidência independentes (comparativas, fósseis, arqueológicas, paleoambientais, isotópicas, nutricionais e fisiológicas) mostram que o Homo "arcaico" do início do Pleistoceno se espalhou intercontinentalmente ao longo das costas do Oceano Índico (eles chegaram até mesmo a ilhas ultramarinas, como Flores). onde eles mergulhavam regularmente em busca de alimentos litorâneos, como crustáceos e crustáceos, que são extremamente ricos em nutrientes específicos para o cérebro, explicando o aumento do cérebro do Homo. O mergulho raso para frutos do mar requer controle voluntário das vias aéreas, um pré-requisito para a linguagem falada. Os frutos do mar, como os crustáceos, geralmente não precisam ser mordidos e mastigados, mas sim o uso de ferramentas de pedra e alimentação por sucção. Esse controle mais refinado do aparelho oral foi sem dúvida outra pré-adaptação biológica à fala humana, especialmente para a produção de consoantes.

Independência de modalidade

Áreas de linguagem do cérebro humano. O giro angular é representado em laranja, o giro supramarginal é representado em amarelo, a área de Broca é representada em azul, a área de Wernicke é representada em verde e o córtex auditivo primário é representado em rosa.

O termo modalidade significa o formato representacional escolhido para codificar e transmitir informações. Uma característica marcante da linguagem é que ela é independente da modalidade. Se uma criança deficiente for impedida de ouvir ou produzir sons, sua capacidade inata de dominar uma linguagem pode igualmente encontrar expressão na sinalização. As línguas de sinais dos surdos são inventadas de forma independente e têm todas as propriedades principais da linguagem falada, exceto a modalidade de transmissão. A partir disso, parece que os centros de linguagem do cérebro humano devem ter evoluído para funcionar perfeitamente, independentemente da modalidade selecionada.

"O distanciamento das entradas específicas da modalidade pode representar uma mudança substancial na organização neural, que afeta não apenas a imitação, mas também a comunicação; apenas os humanos podem perder uma modalidade (por exemplo, audição) e compensar esse déficit comunicando-se com total competência em um modalidade diferente (ou seja, assinatura). "

-  Marc Hauser, Noam Chomsky e W. Tecumseh Fitch, 2002. A Faculdade de Linguagem: O que é, quem tem e como evoluiu?
A Figura 18 a partir de Charles DarwinA expressão das emoções no homem e nos animais . A legenda diz "Chimpanzé decepcionado e mal-humorado. Tirado da vida pelo Sr. Wood." '

Esse recurso é extraordinário. Os sistemas de comunicação animal rotineiramente combinam propriedades e efeitos visíveis com audíveis, mas nenhum é independente da modalidade. Nenhuma baleia, golfinho ou ave canora com deficiência vocal, por exemplo, poderia expressar seu repertório de canções igualmente em exibição visual. De fato, no caso da comunicação animal, mensagem e modalidade não são capazes de se desemaranhar. Qualquer mensagem transmitida decorre das propriedades intrínsecas do sinal.

A independência da modalidade não deve ser confundida com o fenômeno comum da multimodalidade. Macacos e macacos contam com um repertório de "gestos-chamados" específicos da espécie - vocalizações emocionalmente expressivas inseparáveis ​​das exibições visuais que os acompanham. Os humanos também têm chamadas gestuais específicas da espécie - risos, gritos, soluços e assim por diante - junto com gestos involuntários que acompanham a fala. Muitos monitores de animais são polimodais no sentido de que cada um parece projetado para explorar vários canais simultaneamente.

A propriedade linguística humana de "independência de modalidade" é conceitualmente distinta desta. Ele permite que o locutor codifique o conteúdo informativo de uma mensagem em um único canal enquanto alterna entre os canais conforme necessário. Os modernos moradores das cidades alternam facilmente entre a palavra falada e a escrita em suas várias formas - caligrafia, digitação, e-mail e assim por diante. Qualquer que seja a modalidade escolhida, ele pode transmitir de forma confiável todo o conteúdo da mensagem sem ajuda externa de qualquer tipo. Ao falar ao telefone, por exemplo, quaisquer gestos faciais ou manuais que acompanham, por mais naturais que sejam para o locutor, não são estritamente necessários. Ao digitar ou assinar manualmente, ao contrário, não há necessidade de adicionar sons. Em muitas culturas aborígenes australianas, uma seção da população - talvez mulheres observando um tabu ritual - tradicionalmente se restringe por longos períodos a uma versão silenciosa (assinada manualmente) de sua língua. Então, ao serem libertados do tabu, esses mesmos indivíduos voltam a narrar histórias à beira da lareira ou no escuro, mudando para o som puro sem sacrificar o conteúdo informativo.

Evolução dos órgãos da fala

Trato vocal humano

Falar é a modalidade padrão para o idioma em todas as culturas. O primeiro recurso dos humanos é codificar nossos pensamentos em som - um método que depende de sofisticadas capacidades para controlar os lábios, a língua e outros componentes do aparelho vocal.

Os órgãos da fala, todos concordam, evoluíram em primeira instância não para a fala, mas para funções corporais mais básicas, como alimentação e respiração. Primatas não humanos têm órgãos amplamente semelhantes, mas com controles neurais diferentes. Os macacos usam suas línguas altamente flexíveis e manobráveis ​​para comer, mas não para vocalizar. Quando um macaco não está comendo, o controle motor fino sobre sua língua é desativado. Ou está fazendo ginástica com a língua ou está vocalizando; ele não pode realizar as duas atividades simultaneamente. Uma vez que isso se aplica aos mamíferos em geral, o Homo sapiens é excepcional no aproveitamento de mecanismos projetados para respiração e ingestão para as necessidades radicalmente diferentes da fala articulada.

Língua

Espectrograma de vogais do inglês americano [i, u, ɑ] mostrando os formantes f 1 e f 2

A palavra "idioma" deriva da língua latina , "língua". Os foneticistas concordam que a língua é o mais importante articulador da fala, seguida dos lábios. Uma linguagem natural pode ser vista como uma forma particular de usar a língua para expressar o pensamento.

A língua humana tem um formato incomum. Na maioria dos mamíferos, é uma estrutura longa e plana, em grande parte contida na boca. Ele está preso na parte posterior do osso hióide , situado abaixo do nível oral na faringe . Em humanos, a língua tem um contorno sagital (linha média) quase circular , grande parte dele deitada verticalmente em uma faringe estendida , onde está presa a um osso hióide em uma posição abaixada. Em parte como resultado disso, os tubos horizontais (dentro da boca) e verticais (garganta abaixo) que formam o trato vocal supralaríngeo (TVS) são quase iguais em comprimento (enquanto em outras espécies, a seção vertical é mais curta ) Conforme movemos nossas mandíbulas para cima e para baixo, a língua pode variar a área da seção transversal de cada tubo independentemente em cerca de 10: 1, alterando as frequências dos formantes de acordo. O fato de os tubos serem unidos em um ângulo reto permite a pronúncia das vogais [i], [u] e [a] , o que os primatas não humanos não podem fazer. Mesmo quando não executada de forma particularmente precisa, em humanos a ginástica articulatória necessária para distinguir essas vogais produz resultados acústicos consistentes e distintos, ilustrando a natureza quântica dos sons da fala humana. Pode não ser coincidência que [i], [u] e [a] sejam as vogais mais comuns nas línguas do mundo. As línguas humanas são muito mais curtas e finas do que os outros mamíferos e são compostas por um grande número de músculos, o que ajuda a formar uma variedade de sons dentro da cavidade oral. A diversidade da produção de som também é aumentada com a capacidade do ser humano de abrir e fechar as vias aéreas, permitindo que quantidades variáveis ​​de ar saiam pelo nariz. Os movimentos motores finos associados à língua e às vias aéreas tornam os humanos mais capazes de produzir uma ampla gama de formas intrincadas, a fim de produzir sons em diferentes taxas e intensidades.

Lábios

Em humanos, os lábios são importantes para a produção de plosivas e fricativas , além das vogais . Nada, porém, sugere que os lábios tenham evoluído por essas razões. Durante a evolução dos primatas, uma mudança da atividade noturna para a diurna em társios , macacos e macacos (os haplorrinos ) trouxe consigo uma maior dependência da visão em detrimento do olfato. Como resultado, o focinho ficou reduzido e o rinário ou "nariz molhado" foi perdido. Os músculos da face e lábios, conseqüentemente, tornaram-se menos contraídos, permitindo sua cooptação para servir a propósitos de expressão facial. Os lábios também ficaram mais grossos e a cavidade oral escondida atrás ficou menor. "Portanto", de acordo com uma autoridade importante, "a evolução dos lábios musculosos e móveis, tão importantes para a fala humana, foi o resultado exaptivo da evolução da diurnalidade e da comunicação visual no ancestral comum dos haplorrinos". Não está claro se nossos lábios sofreram uma adaptação mais recente às necessidades específicas da fala.

Controle respiratório

Comparados com os primatas não humanos, os humanos aumentaram significativamente o controle da respiração, permitindo que as exalações sejam estendidas e as inalações encurtadas enquanto falamos. Enquanto falamos, os músculos intercostais e abdominais internos são recrutados para expandir o tórax e puxar o ar para os pulmões e, subsequentemente, controlar a liberação de ar à medida que os pulmões esvaziam. Os músculos envolvidos são marcadamente mais inervados em humanos do que em primatas não humanos. Evidências de hominíneos fósseis sugerem que o alargamento necessário do canal vertebral e, portanto, das dimensões da medula espinhal, pode não ter ocorrido no Australopithecus ou no Homo erectus, mas estava presente nos Neandertais e nos primeiros humanos modernos.

Laringe

Anatomia da laringe, visão anterolateral

Illu larynx.jpg

A laringe ou caixa vocal é um órgão do pescoço que abriga as pregas vocais , responsáveis ​​pela fonação . Em humanos, a laringe desce, está posicionada mais abaixo do que em outros primatas . Isso ocorre porque a evolução dos humanos para a posição vertical deslocou a cabeça diretamente acima da medula espinhal, forçando todo o resto para baixo. O reposicionamento da laringe resultou em uma cavidade mais longa, denominada faringe, responsável por aumentar o alcance e a clareza do som produzido. Outros primatas quase não têm faringe; portanto, sua potência vocal é significativamente mais baixa. Nossa espécie não é única nesse aspecto: cabras, cachorros, porcos e micos abaixam a laringe temporariamente, para emitir gritos altos. Várias espécies de veados têm uma laringe abaixada permanentemente, que pode ser abaixada ainda mais pelos machos durante suas exibições de rugido. Leões, onças, chitas e gatos domésticos também fazem isso. No entanto, a descida laríngea em não humanos (de acordo com Philip Lieberman) não é acompanhada pela descida do hióide; portanto, a língua permanece horizontal na cavidade oral, impedindo-a de atuar como articulador da faringe.

Visão anterolateral da cabeça e pescoço

Apesar de tudo isso, os estudiosos permanecem divididos sobre o quão "especial" o trato vocal humano realmente é. Foi demonstrado que a laringe desce até certo ponto durante o desenvolvimento nos chimpanzés , seguido pela descida hioidal. Em oposição a isso, Philip Lieberman destaca que apenas os humanos desenvolveram uma descendência laríngea permanente e substancial em associação com a descida hioidal, resultando em uma língua curva e trato vocal de dois tubos com proporções de 1: 1. Exclusivamente no caso humano, o simples contato entre a epiglote e o véu, não é mais possível, interrompendo a separação mamífera normal dos tratos respiratório e digestivo durante a deglutição. Uma vez que isso acarreta custos substanciais - aumentando o risco de engasgo ao engolir alimentos - somos forçados a perguntar quais benefícios poderiam ter superado esses custos. O benefício óbvio - assim se afirma - deve ter sido a fala. Mas essa ideia foi vigorosamente contestada. Uma objeção é que os humanos, na verdade, não correm sério risco de engasgar com a comida: as estatísticas médicas indicam que acidentes desse tipo são extremamente raros. Outra objeção é que, na visão da maioria dos estudiosos, a fala como a conhecemos surgiu relativamente tarde na evolução humana, quase simultaneamente com o surgimento do Homo sapiens. Um desenvolvimento tão complexo quanto a reconfiguração do trato vocal humano teria demandado muito mais tempo, implicando em uma data de origem precoce. Essa discrepância nas escalas de tempo abala a ideia de que a flexibilidade vocal humana foi inicialmente impulsionada por pressões de seleção para a fala.

Pelo menos um orangotango demonstrou capacidade de controlar a caixa de voz.

A hipótese de exagero do tamanho

Abaixar a laringe é aumentar o comprimento do trato vocal, por sua vez diminuindo as frequências dos formantes para que a voz soe "mais profunda" - dando uma impressão de maior tamanho. John Ohala argumenta que a função da laringe abaixada nos humanos, especialmente no sexo masculino, é provavelmente aumentar as exibições de ameaça, e não a própria fala. Ohala aponta que, se a laringe abaixada fosse uma adaptação para a fala, esperaríamos que os machos humanos adultos estivessem melhor adaptados a esse respeito do que as fêmeas adultas, cuja laringe é consideravelmente menos baixa. Na verdade, as mulheres invariavelmente superam os homens nos testes verbais, falsificando toda essa linha de raciocínio. W. Tecumseh Fitch também argumenta que esta foi a vantagem seletiva original do rebaixamento da laringe em nossa espécie. Embora (de acordo com Fitch) o abaixamento inicial da laringe em humanos não tivesse nada a ver com a fala, o aumento da gama de padrões formantes possíveis foi subsequentemente cooptado para a fala. O exagero de tamanho continua sendo a única função da extrema descendência laríngea observada em cervos machos. Consistente com a hipótese de exagero de tamanho, uma segunda descida da laringe ocorre na puberdade em humanos, embora apenas em homens. Em resposta à objeção de que a laringe é descendente de fêmeas humanas, Fitch sugere que mães que vocalizam para proteger seus bebês também teriam se beneficiado dessa habilidade.

Discurso de Neandertal

Osso hioide - superfície anterior, ampliada

A maioria dos especialistas atribui aos Neandertais habilidades de fala que não são radicalmente diferentes daquelas do Homo sapiens moderno . Uma linha indireta de argumento é que suas táticas de fabricação de ferramentas e caça seriam difíceis de aprender ou executar sem algum tipo de discurso. Uma recente extração de DNA de ossos de neandertais indica que os neandertais tinham a mesma versão do gene FOXP2 que os humanos modernos. Este gene, antes erroneamente descrito como o "gene da gramática", desempenha um papel no controle dos movimentos orofaciais que (nos humanos modernos) estão envolvidos na fala.

Durante a década de 1970, acreditava-se amplamente que os neandertais não tinham habilidades modernas de fala. Foi alegado que eles possuíam um osso hióide tão alto no trato vocal que excluía a possibilidade de produzir certos sons vocálicos.

O osso hióide está presente em muitos mamíferos . Ele permite uma ampla gama de movimentos da língua, da faringe e da laringe, colocando essas estruturas lado a lado para produzir variação. Percebe-se agora que sua posição abaixada não é exclusiva do Homo sapiens , embora sua relevância para a flexibilidade vocal possa ter sido exagerada: embora os homens tenham uma laringe mais baixa, eles não produzem uma gama maior de sons do que as mulheres ou crianças de dois anos de idade. bebês. Não há evidências de que a posição da laringe dos neandertais impediu a gama de sons vocálicos que eles podiam produzir. A descoberta de um osso hióide de aparência moderna de um homem de Neandertal na Caverna Kebara em Israel levou seus descobridores a argumentar que os Neandertais tinham uma laringe descendente e, portanto, capacidades de fala semelhantes às humanas . No entanto, outros pesquisadores afirmam que a morfologia do hióide não é indicativa da posição da laringe. É necessário levar em consideração a base do crânio, a mandíbula e as vértebras cervicais e um plano de referência cranial.

A morfologia do ouvido externo e médio dos hominíneos do Pleistoceno Médio de Atapuerca SH na Espanha, que se acredita serem proto-Neandertais, sugere que eles tinham uma sensibilidade auditiva semelhante à dos humanos modernos e muito diferente dos chimpanzés. Eles provavelmente foram capazes de diferenciar entre muitos sons de fala diferentes.

Canal hipoglosso

Nervo hipoglosso
Gray794.png
Nervo hipoglosso, plexo cervical e seus ramos
Detalhes
Identificadores
Latina nervus hipoglosso
Termos anatômicos de neuroanatomia

O nervo hipoglosso desempenha um papel importante no controle dos movimentos da língua. Em 1998, uma equipe de pesquisa usou o tamanho do canal hipoglosso na base de crânios fósseis em uma tentativa de estimar o número relativo de fibras nervosas, alegando com base nisso que os hominíneos e os neandertais do Pleistoceno Médio tinham um controle da língua mais refinado do que qualquer um dos dois. australopitecinos ou macacos. Posteriormente, no entanto, foi demonstrado que o tamanho do canal hipoglosso e os tamanhos dos nervos não estão correlacionados, e agora é aceito que tais evidências não são informativas sobre o momento da evolução da fala humana.

Origem dos sons da fala

Teoria das características distintivas

De acordo com uma escola influente, o aparelho vocal humano é intrinsecamente digital no modelo de um teclado ou computador digital. Se for assim, isso é notável: nada no aparelho vocal de um chimpanzé sugere um teclado digital, apesar das semelhanças anatômicas e fisiológicas. Isso levanta a questão de quando e como, durante o curso da evolução humana, ocorreu a transição da estrutura e função analógica para a digital.

O trato supralaríngeo humano é considerado digital no sentido de que é um arranjo de chaves ou interruptores móveis, cada um dos quais, a qualquer momento, deve estar em um estado ou outro. As cordas vocais, por exemplo, estão vibrando (produzindo um som) ou não vibrando (no modo silencioso). Em virtude da física simples, a característica distintiva correspondente  - neste caso, "voz" - não pode estar em algum lugar entre os dois. As opções são limitadas a "off" e "on". Igualmente digital é o recurso conhecido como " nasalização ". A qualquer momento, o palato mole ou velum permite ou não permite que o som ressoe na câmara nasal. No caso de posições de lábios e língua, mais de dois estados digitais podem ser permitidos.

A teoria de que os sons da fala são entidades compostas constituídas por complexos de características fonéticas binárias foi apresentada pela primeira vez em 1938 pelo lingüista russo Roman Jakobson . Um defensor inicial proeminente dessa abordagem foi Noam Chomsky , que passou a estendê-la da fonologia para a linguagem de maneira mais geral, em particular para o estudo da sintaxe e da semântica. Em seu livro de 1965, Aspects of the Theory of Syntax, Chomsky tratou os conceitos semânticos como combinações de elementos atômicos digitais binários explicitamente no modelo da teoria dos traços distintivos. O item lexical "solteiro", nesta base, seria expresso como [+ Humano], [+ Masculino], [- Casado].

Os defensores dessa abordagem veem as vogais e consoantes reconhecidas por falantes de uma determinada língua ou dialeto em um determinado momento como entidades culturais de pouco interesse científico. Do ponto de vista das ciências naturais, as unidades que importam são aquelas comuns ao Homo sapiens em virtude de nossa natureza biológica. Ao combinar os elementos atômicos ou "características" com as quais todos os humanos são inatamente equipados, qualquer um pode, em princípio, gerar toda a gama de vogais e consoantes que podem ser encontradas em qualquer uma das línguas do mundo, seja no passado, no presente ou no futuro. Os traços distintivos são, nesse sentido, componentes atômicos de uma linguagem universal.

Contraste de voz em fricativas inglesas
Articulação Sem voz Dublado
Pronunciado com o lábio inferior contra os dentes: [f] ( f an ) [v] ( v an )
Pronunciado com a língua contra os dentes: [θ] ( th in, th igh) [ð] ( th en, th y)
Pronunciado com a língua perto da gengiva: [s] ( s ip ) [z] ( z ip )
Pronunciado com a língua agrupada: [ʃ] (pre ss ure) [ʒ] (fundamento s ure)

Crítica

Nos últimos anos, a noção de uma "gramática universal" inata subjacente à variação fonológica foi questionada. A monografia mais abrangente já escrita sobre os sons da fala, Sounds of the World Languages, de Peter Ladefoged e Ian Maddieson , não encontrou praticamente nenhuma base para a postulação de um pequeno número de características fonéticas fixas, discretas e universais. Examinando 305 línguas, por exemplo, eles encontraram vogais que estavam posicionadas basicamente em todos os lugares ao longo do continuum articulatório e acústico. Ladefoged conclui que as características fonológicas não são determinadas pela natureza humana: "As características fonológicas são mais bem vistas como artefatos que os linguistas criaram para descrever os sistemas linguísticos." A controvérsia permanece sem solução.

Teoria da auto-organização

Passando em bandos, um exemplo de auto-organização em biologia

A auto-organização caracteriza os sistemas em que as estruturas macroscópicas são formadas espontaneamente a partir de interações locais entre os vários componentes do sistema. Em sistemas auto-organizados, as propriedades organizacionais globais não podem ser encontradas no nível local. Em termos coloquiais, a auto-organização é aproximadamente capturada pela ideia de organização "de baixo para cima" (em oposição a "de cima para baixo"). Exemplos de sistemas auto-organizados variam de cristais de gelo a espirais de galáxias no mundo inorgânico e de manchas na pele de leopardo à arquitetura de ninhos de cupins ou a forma de um bando de estorninhos.

Um cupinzeiro (Macrotermitinae) no Delta do Okavango nos arredores de Maun , Botswana

De acordo com muitos foneticistas, os sons da linguagem se organizam e se reorganizam por meio da auto-organização. Os sons da fala têm propriedades perceptuais ("como você os ouve") e articulatórias ("como você os produz"), todas com valores contínuos. Os alto-falantes tendem a minimizar o esforço, favorecendo a facilidade de articulação em vez da clareza. Os ouvintes fazem o oposto, favorecendo os sons que são fáceis de distinguir, mesmo que difíceis de pronunciar. Visto que falantes e ouvintes estão constantemente trocando de papéis, os sistemas de sílabas realmente encontrados nas línguas do mundo acabam sendo um meio-termo entre distinção acústica, por um lado, e facilidade articulatória, por outro.

Como, precisamente, surgem os sistemas de vogais, consoantes e sílabas? Os modelos de computador baseados em agentes assumem a perspectiva da auto-organização no nível da comunidade de fala ou da população. Os dois paradigmas principais aqui são (1) o modelo de aprendizagem iterada e (2) o modelo do jogo de linguagem. O aprendizado iterado se concentra na transmissão de geração em geração, normalmente com apenas um agente em cada geração. No modelo do jogo de linguagem, toda uma população de agentes simultaneamente produz, percebe e aprende a linguagem, inventando novas formas quando surge a necessidade.

Vários modelos têm mostrado como interações vocais ponto a ponto relativamente simples, como a imitação, podem se auto-organizar espontaneamente um sistema de sons compartilhado por toda a população e diferente em diferentes populações. Por exemplo, os modelos elaborados por Berrah et al., Bem como de Boer, e recentemente reformulados usando a teoria Bayesiana, mostraram como um grupo de indivíduos jogando jogos de imitação pode auto-organizar repertórios de sons vocálicos que compartilham propriedades substanciais com sistemas vocálicos humanos. Por exemplo, no modelo de Boer, inicialmente as vogais são geradas aleatoriamente, mas os agentes aprendem uns com os outros à medida que interagem repetidamente ao longo do tempo. O Agente A escolhe uma vogal de seu repertório e a produz, inevitavelmente com algum ruído. O Agente B ouve essa vogal e escolhe o equivalente mais próximo de seu repertório. Para verificar se isso realmente corresponde ao original, B produz a vogal que pensa ter ouvido , ao que A se refere mais uma vez ao seu próprio repertório para encontrar o equivalente mais próximo. Se corresponder ao que ela selecionou inicialmente, o jogo foi bem-sucedido, caso contrário, falhou. "Por meio de interações repetidas", de acordo com de Boer, "emergem sistemas vocálicos muito parecidos com os encontrados nas línguas humanas."

Em um modelo diferente, o foneticista Björn Lindblom foi capaz de prever, em bases auto-organizacionais, as escolhas favorecidas de sistemas vocálicos variando de três a nove vogais com base em um princípio de diferenciação perceptual ótima.

Outros modelos estudaram o papel da auto-organização nas origens da codificação fonêmica e da combinatorialidade, que é a existência de fonemas e sua reutilização sistemática para construir sílabas estruturadas. Pierre-Yves Oudeyer desenvolveu modelos que mostraram que o equipamento neural básico para imitação vocal holística adaptativa, acoplando diretamente representações motoras e perceptivas no cérebro, pode gerar sistemas combinatórios de vocalizações espontaneamente compartilhados, incluindo padrões fonotáticos, em uma sociedade de indivíduos balbuciantes. Esses modelos também caracterizam como restrições morfológicas e fisiológicas inatas podem interagir com esses mecanismos auto-organizados para dar conta da formação de regularidades estatísticas e da diversidade nos sistemas de vocalização.

Teoria gestual

A teoria gestual afirma que a fala foi um desenvolvimento relativamente tardio, evoluindo gradualmente a partir de um sistema que era originalmente gestual. Nossos ancestrais eram incapazes de controlar sua vocalização na época em que os gestos eram usados ​​para se comunicar; entretanto, conforme eles lentamente começaram a controlar suas vocalizações, a linguagem falada começou a evoluir.

Três tipos de evidências apóiam essa teoria:

  1. A linguagem gestual e a linguagem vocal dependem de sistemas neurais semelhantes. As regiões do córtex responsáveis ​​pelos movimentos da boca e das mãos fazem fronteira entre si.
  2. Os primatas não humanos minimizam os sinais vocais em favor de gestos manuais, faciais e outros gestos visíveis, a fim de expressar conceitos simples e intenções comunicativas na natureza. Alguns desses gestos se assemelham aos dos humanos, como a "postura implorando", com as mãos estendidas, que os humanos compartilham com os chimpanzés.
  3. Neurônios espelho

A pesquisa encontrou um forte apoio para a ideia de que a linguagem falada e a sinalização dependem de estruturas neurais semelhantes. Pacientes que usavam a linguagem de sinais e que sofriam de lesão no hemisfério esquerdo apresentaram os mesmos distúrbios com a linguagem de sinais que os pacientes com vozes apresentavam com a linguagem oral. Outros pesquisadores descobriram que as mesmas regiões cerebrais do hemisfério esquerdo estavam ativas durante a linguagem de sinais e durante o uso da linguagem vocal ou escrita.

Os humanos usam gestos faciais e manuais espontaneamente ao formular ideias a serem transmitidas pela fala. É claro que também existem muitas línguas de sinais , comumente associadas a comunidades surdas ; conforme observado acima, eles são iguais em complexidade, sofisticação e poder expressivo a qualquer linguagem oral. A principal diferença é que os "fonemas" são produzidos fora do corpo, articulados com as mãos, corpo e expressão facial, em vez de dentro do corpo articulados com língua, dentes, lábios e respiração.

Muitos psicólogos e cientistas examinaram o sistema de espelho do cérebro para responder a essa teoria, bem como a outras teorias comportamentais. As evidências para apoiar os neurônios-espelho como um fator na evolução da fala incluem neurônios-espelho em primatas, o sucesso de ensinar macacos a se comunicar gestualmente e apontar / gesticular para ensinar a linguagem a crianças pequenas. Fogassi e Ferrari (2014) monitoraram a atividade do córtex motor em macacos, especificamente a área F5 na área de Broca, onde os neurônios-espelho estão localizados. Eles observaram mudanças na atividade elétrica nesta área quando o macaco executou ou observou diferentes ações manuais realizadas por outra pessoa. A área de Broca é uma região do lobo frontal responsável pela produção e processamento da linguagem. A descoberta de neurônios-espelho nessa região, que disparam quando uma ação é feita ou observada especificamente com a mão, apóia fortemente a crença de que a comunicação antes era realizada com gestos. O mesmo é verdade quando se ensina a linguagem para crianças pequenas. Quando alguém aponta para um objeto ou local específico, os neurônios-espelho da criança disparam como se estivessem fazendo a ação, o que resulta em um aprendizado de longo prazo

Crítica

Os críticos observam que, para os mamíferos em geral, o som acaba sendo o melhor meio para codificar informações para transmissão a distâncias em velocidade. Dada a probabilidade de isso se aplicar também aos primeiros humanos, é difícil ver por que eles deveriam ter abandonado esse método eficiente em favor de sistemas mais caros e complicados de gestos visuais - apenas para voltar ao som em um estágio posterior.

A título de explicação, foi proposto que em um estágio relativamente avançado da evolução humana, as mãos de nossos ancestrais tornaram-se tão solicitadas para fazer e usar ferramentas que as demandas concorrentes de gestos manuais se tornaram um obstáculo. Diz-se que a transição para a linguagem falada ocorreu apenas nesse ponto. Como os humanos, ao longo da evolução, vêm fazendo e usando ferramentas, entretanto, a maioria dos estudiosos permanece não convencida por esse argumento. (Para uma abordagem diferente para este quebra-cabeça - uma partindo de considerações de confiabilidade e confiabilidade do sinal - consulte "da pantomima à fala" abaixo).

Linha do tempo da evolução da fala

Pouco se sabe sobre o momento do surgimento da linguagem na espécie humana. Ao contrário da escrita, a fala não deixa vestígios materiais, o que a torna arqueologicamente invisível. Na falta de evidências linguísticas diretas, os especialistas em origens humanas recorreram ao estudo de características anatômicas e genes indiscutivelmente associados à produção da fala. Embora tais estudos possam fornecer informações sobre se as espécies pré-modernas de Homo tinham capacidade de fala , ainda não se sabe se eles realmente falavam. Embora eles possam ter se comunicado verbalmente, os dados anatômicos e genéticos não têm a resolução necessária para diferenciar a protolinguagem da fala.

Usando métodos estatísticos para estimar o tempo necessário para alcançar a atual disseminação e diversidade em línguas modernas hoje, Johanna Nichols  - uma lingüista da Universidade da Califórnia, Berkeley - argumentou em 1998 que as línguas vocais devem ter começado a se diversificar em nossa espécie há pelo menos 100.000 anos atrás.

Mais recentemente - em 2012 - os antropólogos Charles Perreault e Sarah Mathew usaram a diversidade fonêmica para sugerir uma data consistente com esta. "Diversidade fonêmica" denota o número de unidades de som perceptualmente distintas - consoantes, vogais e tons - em uma língua. O atual padrão mundial de diversidade fonêmica contém potencialmente o sinal estatístico da expansão do Homo sapiens moderno para fora da África, começando por volta de 60-70 mil anos atrás. Alguns estudiosos argumentam que a diversidade fonêmica evolui lentamente e pode ser usada como um relógio para calcular quanto tempo as línguas africanas mais antigas teriam de existir para acumular o número de fonemas que possuem hoje. Conforme as populações humanas deixaram a África e se expandiram para o resto do mundo, elas passaram por uma série de gargalos - pontos nos quais apenas uma pequena população sobreviveu para colonizar um novo continente ou região. Supostamente, tal queda populacional levou a uma redução correspondente na diversidade genética, fenotípica e fonêmica. As línguas africanas hoje possuem alguns dos maiores inventários fonêmicos do mundo, enquanto os menores inventários são encontrados na América do Sul e na Oceania, algumas das últimas regiões do globo a serem colonizadas. Por exemplo, Rotokas , uma língua da Nova Guiné, e Pirahã , falada na América do Sul, têm apenas 11 fonemas, enquanto ! Xun , uma língua falada na África do Sul, tem 141 fonemas. Os autores usam um experimento natural - a colonização do sudeste da Ásia continental por um lado, as ilhas Andaman isoladas , por outro - para estimar a taxa na qual a diversidade fonêmica aumenta ao longo do tempo. Usando essa taxa, eles estimam que as línguas do mundo datam da Idade da Pedra Média na África, em algum momento entre 350 mil e 150 mil anos atrás. Isso corresponde ao evento de especiação que deu origem ao Homo sapiens .

Esses e outros estudos semelhantes foram, no entanto, criticados por linguistas que argumentam que eles são baseados em uma analogia falha entre genes e fonemas, uma vez que os fonemas são frequentemente transferidos lateralmente entre línguas diferentes de genes, e em uma amostragem falha das línguas do mundo, desde Oceania e as Américas também contêm línguas com um número muito alto de fonemas, e a África contém línguas com muito poucos. Eles argumentam que a distribuição real da diversidade fonêmica no mundo reflete o contato recente com a linguagem e não uma história profunda da linguagem - uma vez que está bem demonstrado que as línguas podem perder ou ganhar muitos fonemas em períodos muito curtos. Em outras palavras, não há razão linguística válida para esperar que os efeitos genéticos do fundador influenciem a diversidade fonêmica.

Cenários especulativos

Especulações iniciais

"Não posso duvidar que a linguagem deve sua origem à imitação e modificação, auxiliada por sinais e gestos, de vários sons naturais, as vozes de outros animais e os próprios gritos instintivos do homem."

- Charles Darwin, 1871. The Descent of Man, and Selection in Relation to Sex.

Em 1861, o linguista histórico Max Müller publicou uma lista de teorias especulativas sobre as origens da linguagem falada: Essas teorias foram agrupadas na categoria denominada hipóteses de invenção. Todas essas hipóteses pretendiam compreender como a primeira linguagem poderia ter se desenvolvido e postular que a mimetização humana de sons naturais foi a forma como as primeiras palavras com significado foram derivadas.

  • Bow-wow . A teoria do wow ou cuco , que Müller atribuiu ao filósofo alemão Johann Gottfried Herder , via as primeiras palavras como imitações dos gritos de animais e pássaros. Essa teoria, que se acredita ser derivada da onomatopeia, relaciona o significado do som ao som real formulado pelo falante.
  • Pooh-pooh . A teoria Pooh-Pooh viu as primeiras palavras como interjeições e exclamações emocionais desencadeadas por dor, prazer, surpresa e assim por diante. Todos esses sons foram produzidos em inspirações repentinas, o que é diferente de qualquer outra linguagem. Ao contrário das reações emocionais, a linguagem falada é produzida na expiração, de modo que os sons contidos nesta forma de comunicação são diferentes daqueles usados ​​na produção normal da fala, o que torna essa teoria menos plausível para a aquisição da linguagem.
  • Ding-dong . Müller sugeriu o que chamou de teoria Ding-Dong , que afirma que todas as coisas têm uma ressonância natural vibrante, ecoada de alguma forma pelo homem em suas primeiras palavras. As palavras são derivadas do som associado ao seu significado; por exemplo, “ crash tornou-se uma palavra para trovão, boom para explosão”. Essa teoria também se baseia fortemente no conceito de onomatopeia.
  • Yo-he-ho . A teoria do yo-he-ho via a linguagem emergir do trabalho rítmico coletivo, a tentativa de sincronizar o esforço muscular resultando em sons como o de levantar e alternar com sons como ho . Acredita-se que seja derivada da base de esforços colaborativos humanos, esta teoria afirma que os humanos precisavam de palavras, que podem ter começado como cânticos, para se comunicar. Essa necessidade poderia ser para afastar predadores ou servir como um grito de guerra unificador.
  • Ta-ta . Isso não constava da lista de Max Müller, tendo sido proposto em 1930 por Sir Richard Paget . De acordo com a teoria ta-ta , os humanos faziam as primeiras palavras por movimentos da língua que imitavam gestos manuais, tornando-os audíveis.

Um conceito comum de onomatopeia como a primeira fonte de palavras está presente; no entanto, há um problema gritante com essa teoria. Onomatopeia pode explicar as primeiras palavras, todas derivadas de fenômenos naturais, mas não há explicação de como as palavras mais complexas sem uma contraparte natural vieram a ser. A maioria dos estudiosos hoje considera todas essas teorias não tão erradas - eles ocasionalmente oferecem percepções periféricas - como comicamente ingênuas e irrelevantes. O problema com essas teorias é que são estritamente mecanicistas. Eles presumem que, depois que nossos ancestrais descobriram o engenhoso mecanismo apropriado para ligar sons e significados, a linguagem evoluiu e mudou automaticamente.

Problemas de confiabilidade e engano

Do ponto de vista da ciência moderna, o principal obstáculo para a evolução da comunicação semelhante à fala na natureza não é mecanicista. Em vez disso, os símbolos - associações arbitrárias de sons com significados correspondentes - não são confiáveis ​​e podem muito bem ser falsos. Como diz o ditado, "as palavras são baratas". O problema da confiabilidade não foi reconhecido por Darwin, Müller ou outros teóricos evolucionistas iniciais.

Os sinais vocais dos animais são, em sua maioria, intrinsecamente confiáveis. Quando um gato ronrona, o sinal constitui uma evidência direta do estado de contentamento do animal. Pode-se "confiar" no sinal não porque o gato esteja inclinado a ser honesto, mas porque ele simplesmente não consegue fingir aquele som. Chamadas vocais de primatas podem ser um pouco mais manipuláveis, mas permanecem confiáveis ​​pelo mesmo motivo - porque são difíceis de falsificar. A inteligência social dos primatas é maquiavélica  - egoísta e irrestrita por escrúpulos morais. Macacos e macacos freqüentemente tentam enganar uns aos outros, enquanto ao mesmo tempo permanecem constantemente em guarda contra serem eles próprios vítimas de engano. Paradoxalmente, é precisamente a resistência dos primatas ao engano que bloqueia a evolução de seus sistemas de comunicação vocal ao longo de linhas semelhantes às da linguagem. A linguagem é descartada porque a melhor maneira de evitar ser enganado é ignorar todos os sinais, exceto aqueles que podem ser verificados instantaneamente. As palavras falham automaticamente neste teste.

As palavras são fáceis de falsificar. Se acabarem sendo mentiras, os ouvintes se adaptarão ignorando-as em favor de índices ou pistas difíceis de falsificar. Para que a linguagem funcione, então, os ouvintes devem estar confiantes de que aqueles com quem estão se comunicando geralmente são honestos. Uma característica peculiar da linguagem é a "referência deslocada", que significa referência a tópicos fora da situação perceptível atualmente. Essa propriedade evita que os enunciados sejam corroborados no "aqui" e no "agora" imediatos. Por essa razão, a linguagem pressupõe níveis relativamente altos de confiança mútua para se estabelecer ao longo do tempo como uma estratégia evolutivamente estável . Uma teoria das origens da linguagem deve, portanto, explicar por que os humanos podem começar a confiar em sinais baratos de maneiras que outros animais aparentemente não podem (veja a teoria da sinalização ).

"Seleção de parentesco"

A hipótese das "línguas maternas" foi proposta em 2004 como uma possível solução para este problema. W. Tecumseh Fitch sugeriu que o princípio darwiniano de "seleção de parentesco" - a convergência de interesses genéticos entre parentes - pode ser parte da resposta. Fitch sugere que as línguas faladas eram originalmente "línguas maternas". Se a fala evoluiu inicialmente para a comunicação entre as mães e seus próprios filhos biológicos, estendendo-se posteriormente para incluir também parentes adultos, os interesses dos falantes e dos ouvintes tenderiam a coincidir. Fitch argumenta que interesses genéticos compartilhados teriam levado a confiança e cooperação suficientes para que sinais vocais intrinsecamente não confiáveis ​​- palavras faladas - fossem aceitos como confiáveis ​​e, assim, começassem a evoluir pela primeira vez.

Crítica

Os críticos dessa teoria apontam que a seleção de parentesco não é exclusiva dos humanos. As mães macacas também compartilham genes com seus filhos, como todos os animais, então por que apenas os humanos falam? Além disso, é difícil acreditar que os primeiros humanos restringiram a comunicação linguística aos parentes genéticos: o tabu do incesto deve ter forçado homens e mulheres a interagir e se comunicar com não parentes. Portanto, mesmo se aceitarmos as premissas iniciais de Fitch, a extensão das redes postuladas de "língua materna" de parentes para não parentes permanece sem explicação.

"Altruísmo recíproco"

Ib Ulbæk invoca outro princípio darwiniano padrão - "altruísmo recíproco" - para explicar os níveis incomumente elevados de honestidade intencional necessários para a evolução da linguagem. O "altruísmo recíproco" pode ser expresso como o princípio de que, se você coçar minhas costas, eu coçarei as suas. Em termos linguísticos, significaria que se você falar a verdade comigo, eu falarei a verdade com você. O altruísmo recíproco darwiniano comum, Ulbæk aponta, é uma relação estabelecida entre indivíduos que interagem com frequência. Para que a linguagem prevalecesse em toda uma comunidade, entretanto, a reciprocidade necessária teria que ser imposta universalmente, em vez de ser deixada para a escolha individual. Ulbæk conclui que, para a linguagem evoluir, a sociedade primitiva como um todo deve ter estado sujeita à regulamentação moral.

Crítica

Os críticos apontam que esta teoria falha em explicar quando, como, por que ou por quem o "altruísmo recíproco obrigatório" poderia ter sido imposto. Várias propostas foram apresentadas para remediar este defeito. Outra crítica é que a linguagem não funciona com base no altruísmo recíproco, de qualquer maneira. Os humanos em grupos de conversação não retêm informações para todos, exceto para ouvintes que provavelmente ofereçam informações valiosas em troca. Pelo contrário, parecem querer anunciar ao mundo seu acesso a informações socialmente relevantes, transmitindo-as a quem quiser ouvir sem pensar em voltar.

"Fofoca e cuidados pessoais"

A fofoca, de acordo com Robin Dunbar , faz para os humanos que vivem em grupo o que a preparação manual faz para os outros primatas - permite que os indivíduos sirvam aos seus relacionamentos e, assim, mantenham suas alianças. À medida que os humanos começaram a viver em grupos sociais cada vez maiores, a tarefa de cuidar manualmente de todos os amigos e conhecidos tornou-se tão demorada que se tornou inacessível. Em resposta a esse problema, os humanos inventaram "uma forma barata e ultraeficiente de aliciamento" - o aliciamento vocal . Para manter seus aliados felizes, agora você só precisava "prepará-los" com sons vocais de baixo custo, atendendo a vários aliados simultaneamente, mantendo ambas as mãos livres para outras tarefas. A preparação vocal (a produção de sons agradáveis ​​sem sintaxe ou semântica combinatória) evoluiu de alguma forma para a fala sintática.

Crítica

Os críticos dessa teoria apontam que a própria eficiência do "tratamento vocal" - que as palavras são tão baratas - teria minado sua capacidade de sinalizar um compromisso do tipo transmitido por um tratamento manual demorado e caro. Outra crítica é que a teoria não faz nada para explicar a transição crucial do cuidado vocal - a produção de sons agradáveis, mas sem sentido - para as complexidades cognitivas da fala sintática.

Da pantomima ao discurso

De acordo com outra escola de pensamento, a linguagem evoluiu da mimese  - a "encenação" de cenários usando pantomima vocal e gestual. Charles Darwin, que também era cético, levantou a hipótese de que a fala e a linguagem humanas são derivadas de gestos e pantomima com a boca. Essa teoria, mais elaborada por vários autores, postula que o gênero Homo , diferente de nossos ancestrais macacos, desenvolveu um novo tipo de cognição. Os macacos são capazes de aprendizagem associativa. Eles podem vincular uma pista sensorial a uma resposta motora geralmente treinada por meio do condicionamento clássico. No entanto, em macacos, a pista sensorial condicionada é necessária para que uma resposta condicionada seja observada novamente. A resposta motora não ocorrerá sem uma sugestão externa de um agente externo. Uma habilidade notável que os humanos possuem é a habilidade de recuperar memórias voluntariamente sem a necessidade de uma deixa (por exemplo, estímulo condicionado). Esta não é uma habilidade observada em animais, exceto em macacos treinados na linguagem. Ainda há muita controvérsia sobre se a pantomima é uma capacidade para macacos, tanto selvagens quanto capturados. Enquanto os enunciados precisavam ser emocionalmente expressivos e convincentes, não foi possível completar a transição para signos puramente convencionais. Partindo desse pressuposto, gestos e vocalizações pré-linguísticas teriam sido necessários não apenas para eliminar a ambigüidade dos significados pretendidos, mas também para inspirar confiança em sua confiabilidade intrínseca. Se os compromissos contratuais fossem necessários para inspirar a confiança de toda a comunidade nas intenções comunicativas, seguir-se-ia que eles deveriam estar em vigor antes que os humanos pudessem finalmente mudar para uma sinalização ultraeficiente e de alta velocidade - digital em oposição à analógica formato. As características vocais (contrastes de som) são ideais para esse propósito. Sugere-se, portanto, que o estabelecimento de entendimentos contratuais permitiu a transição decisiva do gesto mimético para a fala totalmente convencionalizada e digitalmente codificada.

"Coevolução ritual / fala"

A teoria da coevolução ritual / fala foi originalmente proposta pelo distinto antropólogo social Roy Rappaport antes de ser elaborada por antropólogos como Chris Knight, Jerome Lewis, Nick Enfield, Camilla Power e Ian Watts. O cientista cognitivo e engenheiro de robótica Luc Steels é outro defensor proeminente dessa abordagem geral, assim como o antropólogo biológico / neurocientista Terrence Deacon .

Esses estudiosos argumentam que não pode haver uma "teoria das origens da linguagem". Isso ocorre porque a linguagem não é uma adaptação separada, mas um aspecto interno de algo muito mais amplo - a saber, a cultura simbólica humana como um todo. As tentativas de explicar a linguagem independentemente desse contexto mais amplo falharam espetacularmente, dizem esses cientistas, porque estão abordando um problema sem solução. Podemos imaginar um historiador tentando explicar o surgimento dos cartões de crédito independentemente do sistema mais amplo do qual fazem parte? Usar um cartão de crédito só faz sentido se você tiver uma conta bancária reconhecida institucionalmente dentro de um certo tipo de sociedade capitalista avançada - aquela em que a tecnologia de comunicação já foi inventada e a fraude pode ser detectada e evitada. Da mesma forma, a linguagem não funcionaria fora de um conjunto específico de mecanismos e instituições sociais. Por exemplo, não funcionaria para um macaco se comunicar com outros macacos na natureza. Nem mesmo o macaco mais inteligente poderia fazer a linguagem funcionar sob tais condições.

"A mentira e a alternativa, inerentes à linguagem, ... colocam problemas para qualquer sociedade cuja estrutura seja fundada na linguagem, ou seja, todas as sociedades humanas. Portanto, argumentei que, para haver palavras, é necessário estabelecer A Palavra, e que A Palavra é estabelecida pela invariância da liturgia. "

Os defensores dessa escola de pensamento afirmam que as palavras são baratas. Como alucinações digitais, eles são intrinsecamente não confiáveis. Se um macaco especialmente inteligente, ou mesmo um grupo de macacos articulados, tentasse usar palavras na selva, eles não teriam convicção. As vocalizações de primatas que fazer carry convicção - aqueles que realmente usar - são palavras ao contrário, em que eles são emocionalmente expressivo, intrinsecamente significativo e confiável, porque eles são relativamente caro e difícil de falsificar.

A fala consiste em contrastes digitais cujo custo é essencialmente zero. Como puras convenções sociais, sinais desse tipo não podem evoluir em um mundo social darwiniano - eles são uma impossibilidade teórica. Por ser intrinsecamente não confiável, a linguagem só funciona se você construir uma reputação de confiabilidade dentro de um certo tipo de sociedade - ou seja, aquela em que fatos culturais simbólicos (às vezes chamados de "fatos institucionais") podem ser estabelecidos e mantidos por meio de endosso social coletivo. Em qualquer sociedade de caçadores-coletores , o mecanismo básico para estabelecer confiança em fatos culturais simbólicos é o ritual coletivo . Portanto, a tarefa que os pesquisadores das origens da linguagem enfrentam é mais multidisciplinar do que normalmente se supõe. Envolve abordar o surgimento evolutivo da cultura simbólica humana como um todo, com a linguagem um componente importante, mas subsidiário.

Crítica

Os críticos da teoria incluem Noam Chomsky , que a denomina hipótese de "não existência" - uma negação da própria existência da linguagem como objeto de estudo para as ciências naturais. A própria teoria de Chomsky é que a linguagem surgiu em um instante e de forma perfeita, levando seus críticos, por sua vez, a retrucar que apenas algo que não existe - uma construção teórica ou ficção científica conveniente - poderia surgir de forma tão milagrosa. A controvérsia permanece sem solução.

Especulações do século vinte

Origens festivas

O ensaio "A origem festiva da fala humana", embora publicado no final do século XIX, teve pouco impacto até que a filósofa americana Susanne Langer o redescobriu e publicou em 1941.

"No início da história dos sons articulados, eles próprios não conseguiam criar nenhum significado, mas preservavam e eram intimamente associados aos sentimentos e percepções peculiares que vinham de forma mais proeminente às mentes dos músicos festivos durante sua empolgação."

- J. Donovan, 1891. The Festal Origin of Human Speech.

A teoria parte da observação de que os sons vocais dos primatas são, acima de tudo, emocionalmente expressivos. As emoções despertadas são socialmente contagiosas. Por causa disso, um ataque prolongado de gritos, vaias ou latidos tenderá a expressar não apenas os sentimentos deste ou daquele indivíduo, mas os altos e baixos mutuamente contagiosos de todos ao alcance da voz.

Voltando-se para os ancestrais do Homo sapiens , a teoria da "origem festiva" sugere que na "emoção lúdica" que precede ou segue uma caçada comunitária ou outra atividade de grupo, todos podem ter combinado suas vozes de maneira comparável, enfatizando seu humor de união com ruídos como tambores rítmicos e palmas. Vozes com tons variados teriam formado padrões convencionais, de modo que o canto coral se tornasse parte integrante da celebração comunitária.

Embora ainda não fosse fala, de acordo com Langer, desenvolveu as capacidades vocais das quais a fala derivaria mais tarde. Haveria modos convencionais de ulular, bater palmas ou dançar apropriados a diferentes ocasiões festivas, cada um tão intimamente associado a esse tipo de ocasião que tenderia coletivamente a defender e incorporar o conceito dele. Qualquer um que ouvisse um fragmento de som de tal música se lembraria da ocasião e do clima associados. Uma seqüência melódica e rítmica de sílabas convencionalmente associadas a um certo tipo de celebração se tornaria, com efeito, sua marca vocal. Com base nisso, certas sequências de sons familiares se tornariam "simbólicas".

Em apoio a tudo isso, Langer cita relatos etnográficos de canções tribais consistindo inteiramente de "sílabas rítmicas sem sentido". Ela admite que um equivalente em inglês como "hey-nonny-nonny", embora talvez sugira certos sentimentos ou idéias, não é substantivo, verbo, adjetivo, nem qualquer outra parte sintática do discurso. Contanto que o som articulado tenha servido apenas na qualidade de "ei não-ninhada", "aleluia" ou "alack-a-day", ainda não pode ter sido fala. Para que isso ocorresse, segundo Langer, era necessário que tais sequências fossem emitidas cada vez mais fora de contexto  - fora da situação total que as originou. Estender um conjunto de associações de um contexto cognitivo a outro, completamente diferente, é o segredo da metáfora . Langer invoca uma versão inicial do que é hoje denominado teoria da "gramaticalização" para mostrar como, a partir de tal ponto de partida, a fala sintaticamente complexa pode ter surgido progressivamente.

Langer reconhece que Emile Durkheim propôs uma teoria surpreendentemente semelhante em 1912. Para um pensamento recente em linhas amplamente semelhantes, veja Steven Brown em "musilanguage", Chris Knight em "ritual" e "play", Jerome Lewis em "mimetismo", Steven Mithen em "Hmmmmm" Bruce Richman em "sílabas nonsense" e Alison Wray em "protolinguagem holística".

Hipótese do neurônio espelho (MSH) e a teoria motora da percepção da fala

Os neurônios espelho, originalmente encontrados no macaco macaque, são neurônios que são ativados tanto no executor da ação quanto no observador da ação. Este é um mecanismo proposto em humanos.

A hipótese do neurônio espelho, baseada em um fenômeno descoberto em 2008 por Rizzolatti e Fabbri, apóia a teoria motora da percepção da fala. A teoria motora da percepção da fala foi proposta em 1967 por Liberman, que acreditava que o sistema motor e os sistemas de linguagem estavam intimamente interligados. Isso resultaria em um processo mais simplificado de geração de fala; tanto a cognição quanto a formulação da fala podem ocorrer simultaneamente. Essencialmente, é um desperdício ter um processo de decodificação e codificação de voz independentes um do outro. Esta hipótese foi ainda apoiada pela descoberta de neurônios motores. Rizzolatti e Fabbri descobriram que havia neurônios específicos no córtex motor dos macacos macacos que eram ativados ao ver uma ação. Os neurônios que são ativados são os mesmos neurônios nos quais seriam obrigados a realizar a mesma ação eles próprios. Os neurônios-espelho disparam ao observar uma ação e realizá-la, indicando que esses neurônios encontrados no córtex motor são necessários para a compreensão de um processo visual. A presença de neurônios-espelho pode indicar que a comunicação gestual não-verbal é muito mais antiga do que se pensava ser. A teoria motora da percepção da fala baseia-se na compreensão das representações motoras que fundamentam os gestos da fala, como o movimento labial. Não há uma compreensão clara da percepção da fala atualmente, mas é geralmente aceito que o córtex motor é ativado na percepção da fala em alguma capacidade.

"Musilanguage"

O termo "musilinguagem" (ou "hmmmmm") refere-se a um sistema pré-linguístico de comunicação vocal do qual (de acordo com alguns estudiosos) tanto a música quanto a linguagem derivaram posteriormente. A ideia é que o ritual vocal rítmico, melódico e emocionalmente expressivo ajudou a formar coalizões e, com o tempo, criou pressões de seleção para aumentar o controle volitivo sobre os articuladores da fala. Os padrões de canto coral sincronizado variam de acordo com a ocasião. Por exemplo, "estamos partindo para encontrar mel" pode soar qualitativamente diferente de "estamos partindo para caçar" ou "estamos de luto pela morte de nosso parente". Se a posição social dependesse de manter uma batida regular e harmonizar a própria voz com a de todos os outros, os membros do grupo teriam sofrido pressão para demonstrar suas habilidades corais.

Arqueólogo Steven Mithen especula que a neandertalenses possuía alguma tal sistema, expressando-se em um "idioma" conhecido como "Hmmmmm", estando por H Olistic, m anipulative, m , em última m odal, m usical e m imetic. p. 169-175 Na versão anterior de Bruce Richman de essencialmente a mesma ideia, a repetição frequente das mesmas poucas canções por muitas vozes tornava fácil para as pessoas se lembrarem dessas sequências como unidades inteiras. Atividades que um grupo de pessoas fazia enquanto vocalizavam juntos - atividades importantes, marcantes ou ricamente emocionais - passaram a ser associadas a sequências sonoras particulares, de modo que, cada vez que um fragmento era ouvido, evocava memórias altamente específicas. A ideia é que os primeiros itens lexicais (palavras) começaram como fragmentos abreviados do que eram originalmente canções comunitárias.

"Sempre que as pessoas cantavam ou entoavam uma sequência sonora específica, elas se lembravam dos detalhes concretos da situação mais fortemente associada a ela: ah, sim! Cantamos isso durante este ritual específico admitindo novos membros no grupo; ou, cantamos isso durante um longa jornada na floresta; ou, quando uma clareira é concluída para um novo acampamento, é o que cantamos; ou esses são os lamentos que cantamos durante as cerimônias sobre os membros mortos de nosso grupo. "

- Richman, B. 2000. How music fixed "nonsense" em fórmulas significativas: em ritmo, repetição e significado. Em NL Wallin, B. Merker e S. Brown (eds), The Origins of Music: Uma introdução à musicologia evolucionária. Cambridge, Massachusetts: MIT Press, pp. 301-314.

À medida que os membros do grupo acumulavam um repertório em expansão de canções para diferentes ocasiões, os padrões interpessoais de chamada e resposta evoluíram ao longo de uma trajetória para assumir uma forma linguística. Enquanto isso, ao longo de uma trajetória divergente, o canto polifônico e outros tipos de música tornaram-se cada vez mais especializados e sofisticados.

Para explicar o estabelecimento da fala sintática, Richman cita o inglês "I wanna go home". Ele imagina que isso foi aprendido em primeira instância, não como uma sequência combinatória de palavras independentes, mas como uma única combinação colada - o som melódico que as pessoas fazem para expressar "saudade de casa". Alguém pode cantar "I wanna go home", fazendo com que outras vozes gritem "I need to go home", "I love to go home", "Let's go home" e assim por diante. Observe que uma parte da música permanece constante, enquanto outra pode variar. Se essa teoria for aceita, a fala sintaticamente complexa começa a evoluir à medida que cada mantra entoado permite a variação em um determinado ponto, permitindo a inserção de um elemento de alguma outra canção. Por exemplo, durante o luto durante um rito fúnebre, alguém pode querer se lembrar de uma lembrança da coleta de mel com o falecido, sinalizando isso em um momento apropriado com um fragmento da canção "estamos coletando mel". Imagine que essas práticas se tornassem comuns. Enunciados carregados de significado agora teriam se tornado sujeitos a um princípio criativo distintamente linguístico - o da incorporação recursiva.

Igualitarismo caçador-coletor

Compartilhamento de carne caçador-coletor Mbendjele

Muitos estudiosos associam o surgimento evolutivo da fala com profundos desenvolvimentos sociais, sexuais, políticos e culturais. Uma visão é que o domínio do estilo primata precisava dar lugar a um estilo de vida mais cooperativo e igualitário do tipo característico dos caçadores-coletores modernos.

Intersubjetividade

De acordo com Michael Tomasello , a capacidade cognitiva chave que distingue o Homo sapiens de nossos primos macacos é a " intersubjetividade ". Isso envolve a mudança de direção e a inversão de papéis: seu parceiro se esforça para ler sua mente, você simultaneamente se esforça para ler a dele e cada um de vocês faz um esforço consciente para ajudar o outro no processo. O resultado é que cada parceiro forma uma representação da mente do outro na qual a sua própria mente pode ser discernida por reflexão.

Tomasello argumenta que esse tipo de cognição bidirecional é central para a própria possibilidade de comunicação linguística. Com base em sua pesquisa com crianças e chimpanzés, ele relata que os bebês humanos, a partir de um ano de idade, começam a ver sua própria mente como se fosse do ponto de vista dos outros. Ele descreve isso como uma revolução cognitiva. Os chimpanzés, à medida que crescem, nunca passam por tal revolução. A explicação, de acordo com Tomasello, é que sua psicologia evoluída está adaptada a um modo de vida profundamente competitivo. Chimpanzés selvagens de hierarquias sociais despóticas, a maioria das interações envolvendo cálculos de dominação e submissão. Um chimpanzé adulto se esforçará para enganar seus rivais, adivinhando suas intenções, enquanto os impede de retribuir. Visto que a comunicação intersubjetiva bidirecional é impossível sob tais condições, as capacidades cognitivas necessárias para a linguagem não evoluem.

Contra-dominância

No cenário favorecido por David Erdal e Andrew Whiten, a dominação do estilo primata provocou resistência coalizão igual e oposta - a contra-dominação. Durante o curso da evolução humana, estratégias cada vez mais eficazes de rebelião contra indivíduos dominantes levaram a um acordo. Ao abandonar qualquer tentativa de dominar os outros, os membros do grupo afirmaram vigorosamente sua autonomia pessoal, mantendo suas alianças para fazer os indivíduos potencialmente dominantes pensarem duas vezes. Dentro de coalizões cada vez mais estáveis, de acordo com essa perspectiva, o status começou a ser conquistado de maneiras novas, recompensas sociais acumulando-se àqueles percebidos por seus pares como especialmente cooperativos e autoconscientes.

Dominância reversa

Enquanto a contra-dominação, de acordo com esta narrativa evolucionária, culmina em um impasse, o antropólogo Christopher Boehm estende a lógica um passo adiante. A contra-dominância finalmente se inclina para uma "dominância reversa" em grande escala. A coalizão rebelde derruba decisivamente a figura do macho alfa primata. Nenhum domínio é permitido, exceto o da comunidade auto-organizada como um todo.

Como resultado dessa mudança social e política, o igualitarismo caçador-coletor é estabelecido. À medida que as crianças crescem, são motivadas pelas pessoas ao seu redor a inverter a perspectiva, envolvendo-se com outras mentes seguindo o seu próprio modelo. As pressões de seleção favorecem inovações psicológicas como empatia imaginativa, atenção conjunta, julgamento moral, colaboração orientada a projetos e a capacidade de avaliar o próprio comportamento do ponto de vista dos outros. Apoiando as probabilidades aumentadas de transmissão cultural e evolução cultural cumulativa, esses desenvolvimentos culminaram no estabelecimento de igualitarismo no estilo caçador-coletor em associação com comunicação e cognição intersubjetivas. É nesse contexto social e político que a linguagem se desenvolve.

Cenários envolvendo interações mãe-bebê

"Colocando o bebê no chão"

De acordo com a teoria de "colocar o bebê no chão" de Dean Falk, as interações vocais entre as primeiras mães hominíneas e os bebês desencadearam uma sequência de eventos que levou, por fim, às primeiras palavras de nossos ancestrais. A ideia básica é que as mães humanas em evolução, ao contrário de seus macacos e macacos homólogos, não podiam se mover e forragear com seus filhos agarrados às costas. A perda de pêlo no caso humano deixava os bebês sem meios de se agarrar. Freqüentemente, portanto, as mães tinham que colocar seus bebês no chão. Como resultado, esses bebês precisavam ter certeza de que não estavam sendo abandonados. As mães responderam desenvolvendo o "manhês" - um sistema comunicativo dirigido por bebês que abrange expressões faciais, linguagem corporal, toques, tapinhas, carícias, risos, cócegas e chamadas de contato emocionalmente expressivas. O argumento é que a linguagem de alguma forma se desenvolveu a partir de tudo isso.

Crítica

Embora essa teoria possa explicar um certo tipo de "protolinguagem" dirigida a crianças - conhecida hoje como "manhês" - ela faz pouco para resolver o problema realmente difícil, que é o surgimento da fala sintática entre os adultos.

Melhoramento cooperativo

A antropóloga evolucionista Sarah Hrdy observa que apenas as mães humanas entre os grandes macacos estão dispostas a permitir que outro indivíduo tome conta de seus próprios bebês; além disso, estamos rotineiramente dispostos a permitir que outras pessoas tomem conta. Ela identifica a falta de confiança como o principal fator que impede as mães de chimpanzés, bonobos ou gorilas de fazer o mesmo: "Se as mães macacas insistem em carregar seus bebês para todos os lugares ... é porque as alternativas disponíveis não são seguras o suficiente." O problema fundamental é que as mães macacas (ao contrário das mães macacas que costumam ser babás) não têm parentes do sexo feminino por perto. A forte implicação é que, no curso da evolução do Homo , o alocare poderia se desenvolver porque as mães Homo tinham parentes femininos por perto - em primeiro lugar, de maneira mais confiável, suas próprias mães. Estendendo a hipótese da avó , Hrdy argumenta que as fêmeas Homo erectus em evolução necessariamente dependiam de parentes femininos inicialmente; essa nova situação na evolução da mãe, do bebê e da mãe da mãe como alocarer forneceu o terreno evolutivo para o surgimento da intersubjetividade. Ela relaciona o início da "reprodução cooperativa em um macaco" às mudanças na história de vida e ao desenvolvimento mais lento da criança, ligadas à mudança no cérebro e no tamanho do corpo a partir da marca de 2 milhões de anos.

O primatologista Klaus Zuberbühler usa essas idéias para ajudar a explicar o surgimento da flexibilidade vocal na espécie humana. A reprodução cooperativa teria compelido os bebês a lutar ativamente para ganhar a atenção dos cuidadores, dos quais nem todos estariam diretamente relacionados. Um repertório básico de sinais vocais de primatas pode ter sido insuficiente para esse desafio social. A seleção natural, de acordo com essa visão, teria favorecido bebês com habilidades vocais avançadas, começando com balbucio (que desencadeia respostas positivas nos cuidadores) e abrindo caminho para as habilidades de fala elaboradas e únicas dos humanos modernos.

"Mamãe" foi a primeira palavra?

Essas ideias podem estar ligadas às do renomado lingüista estrutural Roman Jakobson, que afirmou que "as atividades de sucção da criança são acompanhadas por um leve sopro nasal, a única fonação produzida quando os lábios são pressionados contra o peito da mãe. .e a boca fica cheia ". Ele propôs que mais tarde no desenvolvimento do bebê, "esta reação fonatória à amamentação é reproduzida como um sinal antecipado à simples visão de comida e, finalmente, como uma manifestação de um desejo de comer, ou mais geralmente, como uma expressão de descontentamento e anseio impaciente por falta de comida ou amamentação ausente, e qualquer desejo indesejado. " Assim, a ação de abrir e fechar a boca, aliada à produção de um som nasal ao fechar os lábios, deu origem à sequência sonora "mamãe", que pode, portanto, contar como a primeira palavra. Peter MacNeilage simpaticamente discute essa teoria em seu livro principal, The Origin of Speech , relacionando-a com a teoria de Dean Falk de "colocar o bebê no chão" (veja acima). Desnecessário dizer que outros estudiosos sugeriram candidatos completamente diferentes para a primeira palavra do Homo sapiens .

Teoria da construção de nicho

Uma represa de castores na Terra do Fogo. Os castores se adaptam a um nicho ambiental que moldam por meio de suas próprias atividades.

Embora a faculdade da linguagem biológica seja herdada geneticamente, as línguas ou dialetos reais são transmitidos culturalmente, assim como as normas sociais, tradições tecnológicas e assim por diante. Os biólogos esperam uma trajetória coevolutiva robusta ligando a evolução genética humana com a evolução da cultura. Indivíduos capazes de formas rudimentares de protolinguagem teriam desfrutado de maior acesso a compreensões culturais, enquanto estas, transmitidas de maneiras que os cérebros jovens poderiam aprender prontamente, teriam, por sua vez, sido transmitidas com eficiência crescente.

De certa forma, como os castores, à medida que constroem suas represas, os humanos sempre se engajaram na construção de nichos , criando novos ambientes aos quais posteriormente se adaptaram. As pressões de seleção associadas a nichos anteriores tendem a se tornar relaxadas à medida que os humanos dependem cada vez mais de novos ambientes criados continuamente por suas próprias atividades produtivas. Segundo Steven Pinker, a linguagem é uma adaptação ao "nicho cognitivo". Variações sobre o tema da coevolução ritual / fala - segundo o qual a fala evoluiu para fins de comunicação interna dentro de um domínio construído ritualmente - tentaram especificar mais precisamente quando, por que e como esse nicho especial foi criado pela atividade colaborativa humana.

Estruturas conceituais

Estruturalismo

"Considere um cavalo no xadrez. A peça em si é um elemento do jogo? Certamente não. Pois, como um objeto material, separado de sua casa no tabuleiro e das outras condições de jogo, não tem significado para o jogador. Torna-se um elemento real e concreto apenas quando assume ou se identifica com o seu valor no jogo. Suponha que durante um jogo esta peça seja destruída ou perdida. Pode ser substituída? Claro que pode. Não apenas por outra cavaleiro, mas mesmo por um objeto de uma forma bastante diferente, que pode ser contado como um cavaleiro, desde que seja atribuído o mesmo valor da peça que faltava. "

-  de Saussure, F. (1983) [1916]. Curso de Lingüística Geral . Traduzido por R. Harris. Londres: Duckworth. pp. 108–09.

O estudioso suíço Ferdinand de Saussure fundou a lingüística como uma disciplina profissional do século XX. Saussure considerava a linguagem um sistema governado por regras, muito parecido com um jogo de tabuleiro como o xadrez. Para entender o xadrez, ele insistia, devemos ignorar fatores externos como o clima prevalecente durante uma sessão particular ou a composição material desta ou daquela peça. O jogo é autônomo em relação às suas modalidades materiais. Da mesma forma, ao estudar a língua, é fundamental focar na sua estrutura interna como instituição social. Assuntos externos ( por exemplo , a forma da língua humana) são irrelevantes deste ponto de vista. Saussure considerava 'falar' (parole) como individual, auxiliar e mais ou menos acidental em comparação com a "linguagem" (langue) , que ele via como coletiva, sistemática e essencial.

Saussure mostrou pouco interesse na teoria da evolução de Darwin por seleção natural. Ele também não considerou que valesse a pena especular sobre como a linguagem poderia ter evoluído originalmente. As suposições de Saussure de fato lançam dúvidas sobre a validade dos cenários de origens estreitamente concebidos. Seu paradigma estruturalista, quando aceito em sua forma original, volta a atenção dos estudiosos para um problema mais amplo: como nossa espécie adquiriu a capacidade de estabelecer instituições sociais em geral.

Behaviourism

"Os processos e relações básicas que dão ao comportamento verbal suas características especiais são agora bastante bem compreendidos. Muito do trabalho experimental responsável por esse avanço foi realizado em outras espécies, mas os resultados mostraram-se surpreendentemente livres de restrições de espécie. Recente o trabalho mostrou que os métodos podem ser estendidos ao comportamento humano sem modificações sérias. "

-  Skinner, BF (1957). Comportamento verbal . Nova York: Appleton Century Crofts. p. 3

Nos Estados Unidos, antes e imediatamente após a Segunda Guerra Mundial, o paradigma psicológico dominante era o behaviorismo . Dentro dessa estrutura conceitual, a linguagem era vista como um certo tipo de comportamento - a saber, comportamento verbal, a ser estudado como qualquer outro tipo de comportamento no mundo animal. Assim como um rato de laboratório aprende como encontrar seu caminho em um labirinto artificial, a criança humana aprende o comportamento verbal da sociedade em que nasceu. As complexidades fonológicas, gramaticais e outras complexidades da fala são, nesse sentido, fenômenos "externos", inscritos em um cérebro inicialmente não estruturado. A emergência da linguagem no Homo sapiens, nessa perspectiva, não apresenta nenhum desafio teórico especial. O comportamento humano, seja verbal ou não, ilustra a natureza maleável do cérebro dos mamíferos - e especialmente do humano.

Nativismo de Chomsky

A modularidade da mente é uma ideia que foi prefigurada em alguns aspectos pelo movimento da frenologia do século XIX .

Nativismo é a teoria de que os humanos nascem com certos módulos cognitivos especializados que nos permitem adquirir corpos de conhecimento altamente complexos, como a gramática de uma língua.

"Há uma longa história de estudo da origem da linguagem, perguntando como ela surgiu a partir de chamadas de macacos e assim por diante. Essa investigação, na minha opinião, é uma completa perda de tempo porque a linguagem é baseada em um princípio totalmente diferente de qualquer comunicação animal sistema."

-  Chomsky, N. (1988). Linguagem e problemas de conhecimento . Cambridge, Massachusetts: MIT Press. p. 183

De meados da década de 1950 em diante, Noam Chomsky , Jerry Fodor e outros montaram o que conceituaram como uma 'revolução' contra o behaviorismo. Retrospectivamente, isso foi rotulado de "a revolução cognitiva ". Enquanto o behaviorismo havia negado a validade científica do conceito de "mente", Chomsky respondeu que, na verdade, o conceito de "corpo" é mais problemático. Os comportamentais tendiam a ver o cérebro da criança como uma tabula rasa , inicialmente sem estrutura ou conteúdo cognitivo. De acordo com BF Skinner, por exemplo, a riqueza de detalhes comportamentais (sejam verbais ou não verbais) emanam do ambiente. Chomsky virou essa ideia de cabeça para baixo. O ambiente linguístico encontrado por uma criança, de acordo com a versão de Chomsky do nativismo psicológico , é na verdade irremediavelmente inadequado. Nenhuma criança poderia adquirir as complexidades da gramática de uma fonte tão pobre. Longe de ver a linguagem como totalmente externa, Chomsky a reconceituou como totalmente interna. Para explicar como uma criança adquire tão rápida e facilmente sua língua natal, ele insistiu, devemos concluir que ela vem ao mundo com os fundamentos da gramática já pré-instalados. Nenhuma outra espécie, de acordo com Chomsky, está geneticamente equipada com uma faculdade de linguagem - ou mesmo com algo remotamente parecido com uma. O surgimento de tal corpo docente no Homo sapiens , desse ponto de vista, apresenta à ciência biológica um grande desafio teórico.

Teoria dos atos de fala

Uma maneira de explicar a complexidade biológica é por referência à sua função inferida. De acordo com o influente filósofo John Austin , a função primária da fala é ativa no mundo social.

Os atos de fala , de acordo com esse corpo teórico, podem ser analisados ​​em três níveis diferentes: elocucionário, ilocucionário e perlocucionário. Um ato é locucionário quando visto como a produção de certos sons linguísticos - por exemplo, praticar a pronúncia correta em uma língua estrangeira. Um ato é ilocucionário na medida em que constitui uma intervenção no mundo percebido ou entendido em conjunto. Prometer, casar, divorciar, declarar, declarar, autorizar, anunciar e assim por diante são todos atos de fala neste sentido ilocucionário . Um ato é perlocucionário quando visto em termos de seu efeito psicológico direto sobre o público. Assustar um bebê dizendo 'Boo!' seria um exemplo de ato "perlocucionário".

Para Austin, "fazer coisas" com palavras significa, antes de mais nada , desdobrar força ilocucionária . O segredo disso é a participação da comunidade ou conluio. Deve haver um procedimento "correto" (convencionalmente acordado) e todos os envolvidos devem aceitar que ele foi seguido de maneira adequada.

"Um de nossos exemplos foi, por exemplo, a expressão 'eu aceito' (tome esta mulher como minha legítima esposa), proferida durante uma cerimônia de casamento. Aqui devemos dizer que, ao dizer essas palavras, estamos fazendo algo - ou seja, casar, em vez de relatar algo, ou seja, que estamos nos casando. "

-  Austin, JL (1962). Como fazer coisas com palavras . Oxford: Oxford University Press. pp. 12–13.

No caso de um padre declarar que um casal é marido e mulher, suas palavras terão força ilocucionária somente se ele for devidamente autorizado e somente se a cerimônia for conduzida adequadamente, usando palavras consideradas apropriadas para a ocasião. Austin aponta que se alguém tentar batizar um pinguim, o ato será nulo e sem efeito. Por razões que nada têm a ver com física, química ou biologia, o batismo é impróprio para ser aplicado a pinguins, independentemente da formulação verbal usada.

Este corpo teórico pode ter implicações para cenários especulativos relativos às origens do discurso. "Fazer coisas com palavras" pressupõe entendimentos e acordos compartilhados relativos não apenas à linguagem, mas também à conduta social em geral. Os macacos podem produzir sequências de sons estruturados, influenciando uns aos outros dessa forma. Para desdobrar força ilocucionária , no entanto, eles precisariam ter entrado em um reino não físico e não biológico - um de contratos compartilhados e outros intangíveis. Este novo domínio cognitivo consiste no que os filósofos chamam de "fatos institucionais" - fatos objetivos cuja existência, paradoxalmente, depende da fé ou crença comum. Poucos primatologistas, psicólogos evolucionistas ou antropólogos consideram que os primatas não humanos são capazes dos níveis necessários de atenção conjunta, compromisso sustentado ou colaboração na busca de objetivos futuros.

Biosemiótica

A estrutura de parte de uma dupla hélice de DNA

"a decifração do código genético revelou que possuímos uma linguagem muito mais antiga que os hieróglifos, uma linguagem tão antiga quanto a própria vida, uma linguagem que é a linguagem mais viva de todas - mesmo que suas letras sejam invisíveis e suas palavras estejam enterradas em as células de nossos corpos. "

-  Beadle, G .; Beadle, M. (1966). A linguagem da vida. Uma introdução à ciência da genética . Nova York: Doubleday and Co.

A biossemiótica é uma disciplina relativamente nova, inspirada em grande parte pela descoberta do código genético no início dos anos 1960. Seu pressuposto básico é que o Homo sapiens não está sozinho em sua dependência de códigos e signos. A linguagem e a cultura simbólica devem ter raízes biológicas, portanto, os princípios semióticos devem ser aplicados também ao mundo animal.

A descoberta da estrutura molecular do DNA aparentemente contradiz a ideia de que a vida poderia ser explicada, em última instância, em termos das leis fundamentais da física. As letras do alfabeto genético pareciam ter "significado", mas significado não é um conceito que tenha lugar na física. A comunidade das ciências naturais inicialmente resolveu essa dificuldade invocando o conceito de "informação", tratando a informação como independente de significado. Mas uma solução diferente para o quebra-cabeça era lembrar que as leis da física em si nunca são suficientes para explicar os fenômenos naturais. Para explicar, digamos, as características físicas e químicas únicas dos planetas em nosso sistema solar, os cientistas devem descobrir como as leis da física foram restringidas por sequências particulares de eventos após a formação do Sol.

De acordo com Howard Pattee , o mesmo princípio se aplica à evolução da vida na terra, um processo no qual certos "acidentes congelados" ou "restrições naturais" de tempos em tempos reduziram drasticamente o número de possíveis resultados evolutivos. Os códigos, quando se mostram estáveis ​​ao longo do tempo evolutivo, são restrições desse tipo. O mais fundamental desses "acidentes congelados" foi o surgimento do DNA como uma molécula auto-replicante, mas a história da vida na terra foi caracterizada por uma sucessão de eventos comparativamente dramáticos, cada um dos quais pode ser conceituado como o surgimento de um novo código. Dessa perspectiva, o surgimento evolutivo da linguagem falada foi mais um evento essencialmente do mesmo tipo.

O princípio da desvantagem

A cauda de um pavão: um exemplo clássico de sinalização cara

Em 1975, o biólogo teórico israelense Amotz Zahavi propôs uma nova teoria que, embora controversa, passou a dominar o pensamento darwiniano sobre como os sinais evoluem. O "princípio da deficiência" de Zahavi afirma que, para serem eficazes, os sinais devem ser confiáveis; para serem confiáveis, o investimento físico neles deve ser tão alto que torne a trapaça não lucrativa.

Paradoxalmente, se essa lógica for aceita, os sinais na natureza evoluem não para serem eficientes, mas, ao contrário, para serem elaborados e desperdiçadores de tempo e energia. A cauda de um pavão é a ilustração clássica. A teoria de Zahavi é que, uma vez que as pavoas estão à procura de fanfarrões e trapaceiros do sexo masculino, elas insistem em uma exibição de qualidade tão cara que apenas um pavão genuinamente em forma poderia pagar. Desnecessário dizer que nem todos os sinais no mundo animal são tão elaborados quanto a cauda de um pavão. Mas se Zahavi estiver correto, tudo isso requer algum investimento corporal - um gasto de tempo e energia que "prejudica" o sinalizador de alguma forma.

As vocalizações de animais (de acordo com Zahavi) são confiáveis ​​porque são reflexos fiéis do estado do corpo do sinalizador. Para mudar de uma chamada honesta para uma enganosa, o animal teria que adotar uma postura corporal diferente. Uma vez que toda ação corporal tem sua própria posição inicial ótima, mudar essa posição para produzir uma mensagem falsa interferiria na tarefa de realizar a ação realmente pretendida. Os ganhos obtidos com a trapaça não compensariam as perdas incorridas ao assumir uma postura inadequada - e, portanto, a mensagem falsa acaba por não valer seu preço. p. 69 Isso pode explicar, em particular, por que os sinais vocais dos macacos e macacos tornaram-se tão inflexíveis quando comparados com os diversos sons da fala produzidos pela língua humana. A aparente inflexibilidade das vocalizações dos chimpanzés pode parecer surpreendente para o observador humano, até que percebamos que ser inflexível está necessariamente ligado a ser perceptivelmente honesto no sentido de "difícil de falsificar".

Se aceitarmos essa teoria, o surgimento da fala torna-se teoricamente impossível. A comunicação deste tipo simplesmente não pode evoluir. O problema é que as palavras são baratas. Nada em seus recursos acústicos pode garantir aos ouvintes que eles são genuínos e não falsos. Qualquer estratégia de confiar na língua de outra pessoa - talvez o órgão mais flexível do corpo - pressupõe níveis sem precedentes de honestidade e confiança. Até o momento, os pensadores darwinianos acharam difícil explicar os níveis necessários de cooperação e confiança em toda a comunidade.

Um livro-texto padrão influente é Animal Signals, de John Maynard Smith e David Harper . Esses autores dividem os custos de comunicação em dois componentes: (1) o investimento necessário para garantir a transmissão de um sinal discernível; (2) o investimento necessário para garantir que cada sinal seja confiável e não falso. Os autores apontam que, embora os custos na segunda categoria possam ser relativamente baixos, eles não são zero. Mesmo em contextos sociais cooperativos relativamente relaxados - por exemplo, quando a comunicação está ocorrendo entre parentes genéticos - algum investimento deve ser feito para garantir a confiabilidade. Resumindo, a noção de comunicação supereficiente - eliminando todos os custos, exceto aqueles necessários para uma transmissão bem-sucedida - é biologicamente irreal. No entanto, a fala entra precisamente nesta categoria.

Representação de 1997 de Johnstone do Princípio de Handicap.

O gráfico mostra as diferentes intensidades de sinal como resultado de custos e benefícios. Se dois indivíduos enfrentam custos diferentes, mas têm os mesmos benefícios, ou têm benefícios diferentes, mas o mesmo custo, eles sinalizam em níveis diferentes. O sinal mais alto representa uma qualidade mais confiável. O indivíduo de alta qualidade maximizará os custos relativos aos benefícios em intensidades de sinal altas, enquanto o indivíduo de baixa qualidade maximiza seus benefícios em relação ao custo em intensidade de sinal baixa. O indivíduo de alta qualidade assume mais riscos (maior custo), o que pode ser entendido em termos de sinais honestos, que são caros. Quanto mais forte você for, mais facilmente poderá arcar com o custo do sinal, tornando-se um parceiro de acasalamento mais atraente. Os indivíduos de baixa qualidade têm menos probabilidade de conseguir um sinal específico e, conseqüentemente, menos probabilidade de atrair uma mulher.

Lingüística cognitiva

A linguística cognitiva vê a estrutura linguística como surgindo continuamente do uso. Os palestrantes estão sempre descobrindo novas maneiras de transmitir significados por meio da produção de sons e, em alguns casos, essas novas estratégias se tornam convencionais. Entre a estrutura fonológica e a estrutura semântica, não existe relação causal. Em vez disso, cada novo par de som e significado envolve um salto imaginativo.

Em seu livro, Metaphors We Live By, George Lakoff e Mark Johnson ajudaram a criar essa abordagem, afirmando que a metáfora é o que torna o pensamento humano especial. Toda linguagem, eles argumentaram, é permeada por metáforas, cujo uso na verdade constitui um pensamento distintamente humano - isto é, distintamente abstrato. Para conceituar coisas que não podem ser percebidas diretamente - intangíveis como tempo, vida, razão, mente, sociedade ou justiça - não temos escolha a não ser partir de fenômenos mais concretos e diretamente perceptíveis, como movimento, localização, distância, tamanho e assim adiante. Em todas as culturas em todo o mundo, de acordo com Lakoff e Johnson, as pessoas recorrem a metáforas familiares como as ideias são locais, o pensamento é movimento e a mente é corpo . Por exemplo, podemos expressar a ideia de "chegar a um ponto crucial em nosso argumento" procedendo como se estivéssemos literalmente viajando de um local físico para outro.

Metáforas, por definição, não são literalmente verdadeiras. A rigor, são ficções - de um ponto de vista pedante, até mesmo falsidades. Mas se não pudéssemos recorrer a ficções metafóricas, é duvidoso que pudéssemos formar representações conceituais de fenômenos nebulosos como "idéias", pensamentos "," mentes "e assim por diante.

A influência dessas idéias sobre o pensamento atual sobre as origens da fala permanece obscura. Uma sugestão é que a comunicação do macaco tende a resistir à metáfora por razões sociais. Uma vez que habitam um mundo social darwiniano (em oposição ao moralmente regulamentado), esses animais estão sob forte pressão competitiva para não aceitar ficções patenteadas como moeda comunicativa válida. A comunicação vocal do macaco tende a ser inflexível, marginalizando a língua ultraflexível, justamente porque o ouvinte trata com desconfiança qualquer sinal que venha a ser falso. Essa insistência na veracidade perceptível é claramente incompatível com o uso metafórico. Uma implicação é que nem a fala articulada nem o pensamento abstrato distintamente humano poderiam ter começado a evoluir até que nossos ancestrais tivessem se tornado mais cooperativos e confiantes nas intenções comunicativas uns dos outros.

Ciências naturais vs interpretações das ciências sociais

Realidade social

Quando as pessoas conversam umas com as outras, de acordo com o filósofo americano John Searle , elas estão fazendo movimentos, não no mundo real que outras espécies habitam, mas em um reino virtual compartilhado peculiar a nós. Ao contrário do desdobramento do esforço muscular para mover um objeto físico, o desdobramento da força ilocucionária não requer nenhum esforço físico (exceto o movimento da língua / boca para produzir a fala) e não produz nenhum efeito que qualquer dispositivo de medição possa detectar. Em vez disso, nossa ação ocorre em um nível bastante diferente - o da realidade social . Esse tipo de realidade é, em certo sentido, alucinatório, sendo um produto da intencionalidade coletiva. Não consiste em "fatos brutos" - fatos que existem de qualquer maneira, independentemente da crença de qualquer pessoa - mas em "fatos institucionais", que "existem" apenas se você acreditar neles. Governo, casamento, cidadania e dinheiro são exemplos de “fatos institucionais”. Pode-se distinguir entre fatos "brutos" e "institucionais" aplicando um teste simples. Suponha que ninguém acreditasse no fato - ainda seria verdade? Se a resposta for "sim", é "bruto". Se a resposta for "não", é "institucional".

“Imagine um grupo de criaturas primitivas, mais ou menos como nós ... Agora imagine que agindo em grupo, eles constroem uma barreira, um muro ao redor do lugar onde vivem ... O muro é projetado para manter os intrusos fora e mantê-los membros do grupo em ... Suponhamos que a parede gradualmente se deteriora. Ela se deteriora lentamente até que tudo o que resta é uma linha de pedras. Mas vamos supor que os habitantes continuem a tratar a linha de pedras como se ela pudesse funcionar a função da parede. Suponhamos que, de facto, tratem a linha de pedras como se entendessem que ela não deve ser cruzada ... Esta mudança é o movimento decisivo na criação da realidade institucional . É nada menos do que o movimento decisivo na criação do que pensamos ser distinto nos seres humanos, em oposição aos animais, as sociedades. "

-  John R. Searle (1995). A construção da realidade social . Imprensa livre. p. 134

Os fatos da linguagem em geral e da fala, em particular, são, nessa perspectiva, "institucionais" e não "brutos". O significado semântico de uma palavra, por exemplo, é o que seus usuários imaginam que seja. "Fazer coisas com palavras" é operar em um mundo virtual que parece real porque o compartilhamos em comum. Neste mundo incorpóreo, as leis da física, química e biologia não se aplicam. Isso explica por que a força ilocucionária pode ser implantada sem exercer esforço muscular. Macacos e macacos habitam o mundo "bruto". Para causar impacto, eles devem gritar, latir, ameaçar, seduzir ou de qualquer outra forma investir esforço corporal. Se fossem convidados a jogar xadrez, não seriam capazes de resistir a atirar as peças uns contra os outros. A fala não é assim. Alguns movimentos da língua, em condições apropriadas, podem ser suficientes para abrir o parlamento, anular um casamento, conferir um título de cavaleiro ou declarar guerra. Para explicar, em uma base darwiniana, como essa aparente magia começou a funcionar, devemos perguntar como, quando e por que o Homo sapiens conseguiu estabelecer o domínio mais amplo dos fatos institucionais.

Natureza ou sociedade?

" Fatos brutos ", na terminologia do filósofo dos atos de fala John Searle , são fatos verdadeiros de qualquer maneira, independentemente da crença humana. Suponha que você não acredite na gravidade: pule de um penhasco e ainda assim cairá. A ciência natural é o estudo de fatos desse tipo. "Fatos institucionais" são ficções com status factual dentro das instituições sociais humanas . Fatos monetários e comerciais são ficções desse tipo. As complexidades do sistema monetário global de hoje são fatos apenas enquanto acreditamos neles: suspenda a crença e os fatos se dissolvem correspondentemente. No entanto, embora os fatos institucionais se baseiem na crença humana, isso não os torna meras distorções ou alucinações. Tenha certeza de que essas duas notas de cinco libras em meu bolso valem dez libras. Essa não é apenas minha crença subjetiva: é um fato objetivo e indiscutível. Mas agora imagine um colapso da confiança do público no sistema monetário. De repente, as realidades em meu bolso se dissolvem.

Os estudiosos que duvidam da validade científica da noção de "fatos institucionais" incluem Noam Chomsky , para quem a linguagem não é social. Na visão de Chomsky, a linguagem é um objeto natural (um componente do cérebro individual) e seu estudo, portanto, um ramo das ciências naturais. Ao explicar a origem da linguagem, os estudiosos desse campo intelectual invocam desenvolvimentos não sociais - no caso de Chomsky, uma mutação genética aleatória. Chomsky argumenta que a linguagem pode existir dentro do cérebro de um único gorila mutante, mesmo que ninguém mais acredite nela, mesmo que ninguém mais existisse além do mutante - e mesmo que o gorila em questão permanecesse inconsciente de sua existência, nunca realmente falando . No campo filosófico oposto estão aqueles que, na tradição de Ferdinand de Saussure , argumentam que, se ninguém acreditasse em palavras ou regras, elas simplesmente não existiriam. Esses estudiosos, correspondentemente, consideram a linguagem como essencialmente institucional, concluindo que a linguística deve ser considerada um tópico dentro das ciências sociais . Ao explicar o surgimento evolutivo da linguagem, os estudiosos desse campo intelectual tendem a invocar mudanças profundas nas relações sociais.

Crítica. Os cientistas darwinianos hoje vêem pouco valor na distinção tradicional entre ciência "natural" e "social". O darwinismo em sua forma moderna é o estudo da cooperação e da competição na natureza - um tópico que é intrinsecamente social. Contra esse pano de fundo, há uma consciência crescente entre linguistas evolucionistas e antropólogos darwinistas de que as barreiras interdisciplinares tradicionais podem ter consequências danosas para as investigações sobre as origens da fala.

Veja também

Notas

Leitura adicional

  • Bickerton, D. 2009. Adam's Tongue. Nova York: Hill e Wang.
  • Botha, R. e C. Knight (eds) 2009. The Prehistory of Language. Oxford: Oxford University Press.
  • Botha, R. e C. Knight (eds) 2009. The Cradle of Language. Oxford: Oxford University Press.
  • Burling, R. 2005. The Talking Ape. Como a linguagem evoluiu. Oxford: Oxford University Press.
  • Christiansen, M. e S. Kirby (eds), 2003. Language Evolution. Oxford: Oxford University Press.
  • Corballis , MC, 2002. From Hand to Mouth: The Origins of Language. Princeton e Oxford: Princeton University Press.
  • Deacon, TW, 1997. The Symbolic Species: The Co-evolution of Language and the Brain. Nova York: WW Norton.
  • de Boer. 2001. "The Origins of Vowels Systems", Oxford University Press.
  • de Grolier, E. (ed.), 1983. The Origin and Evolution of Language. Paris: Harwood Academic Publishers.
  • Deutscher, G. 2005. The Unfolding of Language. A evolução da maior invenção da humanidade. Londres: Random House.
  • Dor, D., C. Knight e J. Lewis (eds), 2014. The Social Origins of Language. Oxford: Oxford University Press.
  • Dunbar, RIM 1996. Grooming, Gossip and the Evolution of Language. Londres: Faber e Faber.
  • Dunbar, RIM; Knight, Chris; Poder, Camilla. (1999). A evolução da cultura: uma visão interdisciplinar . Edimburgo: Editora da Universidade de Edimburgo. ISBN 978-0-7486-1076-1. OCLC  807340111 .
  • Fitch, WT 2010. The Evolution of Language. Cambridge: Cambridge University Press.
  • Harnad, SR, HD Steklis e J. Lancaster (eds), 1976. Origins and Evolution of Language and Speech. Nova York: Anais da Academia de Ciências de Nova York.
  • Hrdy, SB 2009. Mães e outros. As origens evolutivas da compreensão mútua. Londres e Cambridge, Massachusetts: Belknap Press of Harvard University Press.
  • Hurford, JR 2007. The Origins of Meaning. Linguagem à luz da evolução. Oxford: Oxford University Press.
  • Hurford, James R .; Studdert-Kennedy, Michael .; Knight, Chris (1998). Abordagens à evolução da linguagem: bases sociais e cognitivas . Cambridge, Reino Unido; Nova York: Cambridge University Press. ISBN 978-0-521-63964-4. OCLC  37742390 .
  • Kenneally, C. 2007. The First Word. A busca pelas origens da linguagem. Nova York: Viking.
  • Lenneberg, EH 1967. Biological Foundations of Language. Nova York: Wiley.
  • Leroi-Gourhan, A. 1993. Gesture and Speech. Trans. A. Bostock Berger. Cambridge, Massachusetts: MIT Press.
  • Lieberman, Philip. (1991). Exclusivamente humano: a evolução da fala, do pensamento e do comportamento altruísta . Cambridge, Massachusetts: Harvard University Press. ISBN 978-0-674-92182-5. OCLC  21764294 .
  • Lieberman, Philip. (2006). Rumo a uma biologia evolutiva da linguagem . Cambridge, Massachusetts: Belknap Press of Harvard University Press. ISBN 978-0-674-02184-6. OCLC  62766735 .
  • Logan, Robert K. 2007. "The Extended Mind: The Emergence of Language, the Human Mind and Culture. Toronto: University of Toronto Press.
  • MacNeilage, P. 2008. The Origin of Speech. Oxford: Oxford University Press.
  • Maynard Smith, J. e D. Harper 2003. Animal Signals. Oxford: Oxford University Press.
  • Oudeyer, PY. (2006) "Auto-Organização na Evolução da Fala", Oxford University Press.
  • Tallerman, M. e K. Gibson (eds), 2012. The Oxford Handbook of Language Evolution. Oxford: Oxford University Press.
  • Tomasello, M. 2008. Origins of Human Communication. Cambridge, Massachusetts: MIT Press.
  • Zahavi, A. e A. Zahavi 1997. The Handicap Principle. Uma peça que faltava no quebra-cabeça de Darwin. Nova York e Oxford: Oxford University Press.

links externos