Lingüística quantitativa - Quantitative linguistics

A lingüística quantitativa ( QL ) é uma subdisciplina da lingüística geral e, mais especificamente, da lingüística matemática . A linguística quantitativa lida com a aprendizagem de línguas, mudança de linguagem e aplicação, bem como estrutura de línguas naturais. QL investiga idiomas usando métodos estatísticos; seu objetivo mais exigente é a formulação de leis de linguagem e, em última análise, de uma teoria geral da linguagem no sentido de um conjunto de leis de línguas inter-relacionadas. A lingüística sinérgica foi desde o início projetada especificamente para esse propósito. A QL é empiricamente baseada nos resultados das estatísticas linguísticas, um campo que pode ser interpretado como estatísticas de línguas ou como estatísticas de qualquer objeto linguístico. Este campo não está necessariamente conectado a ambições teóricas substanciais. A linguística de corpus e a linguística computacional são outros campos que contribuem com evidências empíricas importantes .

História

As primeiras abordagens de QL datam do antigo mundo grego e indiano. Uma das fontes históricas consiste em aplicações da combinatória a questões linguísticas, outra é baseada em estudos estatísticos elementares, que podem ser encontrados sob o cabeçalho colometry e Stichometry .

Leis da língua

Em QL, o conceito de direito é entendido como a classe de hipóteses de direito que foram deduzidas de pressupostos teóricos, são matematicamente formulados, estão inter-relacionados com outras leis no campo e foram suficientemente e com sucesso testados em dados empíricos, ou seja, que poderiam não ser refutado, apesar de muito esforço para fazê-lo. Köhler escreve sobre as leis de QL: "Além disso, pode-se mostrar que essas propriedades dos elementos linguísticos e das relações entre eles obedecem a leis universais que podem ser formuladas estritamente matematicamente da mesma forma que as comuns nas ciências naturais. É preciso suportar lembrando-se, neste contexto, que essas leis são de natureza estocástica; não são observadas em todos os casos (isso não seria necessário nem possível); ao contrário, determinam as probabilidades dos eventos ou proporções em estudo. É fácil encontrar contra-exemplos a cada um dos exemplos acima mencionados; no entanto, estes casos não violam as leis correspondentes, uma vez que as variações em torno da média estatística não só são admissíveis, mas até mesmo essenciais, sendo elas próprias quantitativamente determinadas com exatidão pelas leis correspondentes. o das ciências naturais, que há muito abandonaram as velhas visões determinísticas e causais do mundo e as substituíram pela estatística / modelos probabilísticos. "

Leis lingüísticas

Na linguística quantitativa, as leis linguísticas são regularidades estatísticas emergentes em diferentes escalas linguísticas (ou seja, fonemas, sílabas, palavras ou sentenças) que podem ser formuladas matematicamente e que foram deduzidas de certos pressupostos teóricos. Também é necessário que tenham sido testados com sucesso por meio do uso de dados, ou seja, não tenham sido refutados por evidências empíricas. Dentre as principais leis linguísticas propostas por diversos autores, destacam-se as seguintes:

  • Lei de Zipf : a frequência das palavras é inversamente proporcional à sua classificação nas listas de frequência. Distribuição semelhante entre classificação e frequência de sons, fonemas e letras pode ser observada.
  • Lei de Heaps : descreve o número de palavras distintas em um documento (ou conjunto de documentos) em função do comprimento do documento.
  • Lei da brevidade ou lei da abreviação de Zipf : afirma qualitativamente que quanto mais freqüentemente uma palavra é usada, mais 'curta' ela tende a ser.
  • Lei de Menzerath (também, lei de Menzerath-Altmann): Esta lei estabelece que os tamanhos dos constituintes de uma construção diminuem com o aumento do tamanho da construção em estudo. Quanto mais longa, por exemplo, uma frase (medida em termos do número de cláusulas), mais curtas são as cláusulas (medidas em termos do número de palavras), ou: quanto mais longa uma palavra (em sílabas ou formas), mais curtas são as sílabas ou palavras em sons).
  • Lei da diversificação: se categorias linguísticas, como classes gramaticais ou terminações flexionais, aparecem em várias formas, pode-se demonstrar que as frequências de suas ocorrências em textos são controladas por leis.
  • Lei de Martin: Esta lei diz respeito a cadeias lexicais que são obtidas procurando a definição de uma palavra em um dicionário, em seguida, procurando a definição da definição recém-obtida etc. Finalmente, todas essas definições formam uma hierarquia de significados cada vez mais gerais, em que o número de definições diminui com o aumento da generalidade. Entre os níveis desse tipo de hierarquia, existem várias relações legítimas.
  • Lei da mudança de linguagem: Os processos de crescimento da linguagem, como o crescimento do vocabulário, a dispersão de palavras estrangeiras ou emprestadas, mudanças no sistema flexional, etc. obedecem a uma lei conhecida em QL como lei de Piotrowski e corresponde a modelos de crescimento em outras disciplinas científicas. A lei de Piotrowski é um caso do chamado modelo logístico (cf. equação logística). Foi demonstrado que abrange também os processos de aquisição da linguagem (cf. lei de aquisição da linguagem).
  • Lei do bloco de texto: unidades linguísticas (por exemplo, palavras, letras, funções sintáticas e construções) mostram uma distribuição de frequência específica em blocos de texto igualmente grandes.

Estilística

O estudo de estilos poéticos e também não poéticos pode ser baseado em métodos estatísticos; além disso, é possível conduzir investigações correspondentes com base nas formas específicas (parâmetros) que as leis de linguagem assumem em textos de estilos diferentes. Nesses casos, o QL apóia a pesquisa em estilística : um dos objetivos gerais é a evidência tão objetiva quanto possível também em pelo menos parte do domínio dos fenômenos estilísticos, referindo-se às leis da linguagem. Um dos pressupostos centrais da QL é que algumas leis (por exemplo, a distribuição de comprimentos de palavras) requerem modelos diferentes, pelo menos valores de parâmetros diferentes das leis (distribuições ou funções) dependendo do tipo de texto a que um texto pertence. Se estiverem em estudo textos poéticos, os métodos de QV constituem uma subdisciplina do Estudo Quantitativo da Literatura ( estilometria ).

Autores importantes

Veja também

Notas

Referências

  • Karl-Heinz Best: Quantitative Linguistik. Eine Annäherung . 3., stark überarbeitete und ergänzte Auflage. Peust & Gutschmidt, Göttingen 2006, ISBN  3-933043-17-4 .
  • Karl-Heinz Best, Otto Rottmann: Quantitative Linguistics, an Invitation. RAM-Verlag, Lüdenscheid 2017. ISBN  978-3-942303-51-4 .
  • Reinhard Köhler com a assistência de Christiane Hoffmann: Bibliography of Quantitative Linguistics. Benjamins, Amsterdam / Philadelphia 1995, ISBN  90-272-3751-4 .
  • Reinhard Köhler, Gabriel Altmann, Gabriel, Rajmund G. Piotrowski (eds.): Quantitative Linguistik - Quantitative Linguistics. Ein internationales Handbuch - Um manual internacional . de Gruyter, Berlin / New York 2005, ISBN  3-11-015578-8 .
  • Haitao Liu e Wei Huang. Lingüística Quantitativa: Estado da Arte, Teorias e Métodos . Journal of Zhejiang University (Humanities and Social Science) . 2012,43 (2) : 178-192. em chinês.

links externos