Transliteração devanágari - Devanagari transliteration

Devanāgarī é uma escrita indianausada para muitas línguas da Índia e do Nepal , incluindo hindi , marathi , nepalês e sânscrito . Existem vários métodos semelhantes de transliteração de Devanāgarī para a escrita romana (um processo às vezes chamado de romanização ), incluindo anotação IAST influente e sem perdas.

IAST

O Alfabeto Internacional de Transliteração Sânscrita (IAST) é um subconjunto do padrão ISO 15919 , usado para a transliteração de Sânscrito , Prakrit e Pāḷi em escrita Romana com diacríticos. IAST é um padrão amplamente utilizado. Ele usa diacríticos para eliminar a ambigüidade de glifos sânscritos foneticamente semelhantes, mas não idênticos. Por exemplo, consoantes dentais e retroflexas são eliminadas da ambigüidade com um underdot: dental द = d e retroflexo ड = ḍ. Uma característica importante do IAST é que ele é reversível sem perdas, ou seja, a transliteração do IAST pode ser convertida de volta para Devanāgarī correta ou para outros scripts do sul da Ásia sem ambigüidade. Muitas fontes Unicode suportam totalmente a exibição e impressão IAST.

Sistema Hunteriano

O sistema Hunteriano é o "sistema nacional de romanização da Índia" e o oficialmente adotado pelo Governo da Índia .

O sistema Hunteriano foi desenvolvido no século XIX por William Wilson Hunter , então Surveyor General of India. Quando foi proposto, ele encontrou imediatamente a oposição de defensores do método não sistemático praticado anteriormente e muitas vezes distorcedor do "método Sir Roger Dowler" (uma corrupção inicial de Siraj ud-Daulah ) da transcrição fonética, que culminou em um confronto dramático em um Reunião do Conselho da Índia em 28 de maio de 1872, onde o novo método Hunteriano venceu. O método Hunteriano era inerentemente mais simples e extensível a várias escritas índicas porque sistematizava a transliteração de grafemas e veio a prevalecer e ganhar aceitação governamental e acadêmica. Os oponentes do modelo de transliteração de grafema continuaram a montar tentativas malsucedidas de reverter a política governamental até a virada do século, com um crítico apelando ao "governo indiano para desistir de toda tentativa de transliteração científica (isto é, Hunteriana) e decidir uma vez e para todos a favor de um retorno à antiga grafia fonética. "

Com o tempo, o método Hunteriano se estendeu para cobrir vários escritos índicos, incluindo birmanês e tibetano . Provisões para exclusão de schwa em línguas indo-arianas também foram feitas quando aplicável, por exemplo, o hindi कानपुर é transliterado como kānpur (e não kānapura ), mas o sânscrito क्रम é transliterado como krama (e não kram ). O sistema sofreu alguma evolução ao longo do tempo. Por exemplo, as vogais longas eram marcadas com um diacrítico de acento na versão original, mas isso foi mais tarde substituído na atualização do Governo da Índia de 1954 por um mácron . Assim, जान ( vida ) foi romanizado anteriormente como ján, mas começou a ser romanizado como jān . O sistema Hunteriano tem enfrentado críticas ao longo dos anos por não produzir resultados foneticamente precisos e por ser "desavergonhadamente voltado para um público-alvo de língua inglesa". Especificamente, a falta de diferenciação entre retroflexas e dentários consoantes (por exemplo e são representados por d ) tem sido objecto de críticas repetido e inspirado várias modificações propostas de Hunteriano, incluindo o uso de um diacrítico abaixo retroflexes (por exemplo, fazendo = d e = , que é mais legível, mas requer impressão diacrítica) ou capitalizando-os (por exemplo, tornando = d e = D , que não requer impressão diacrítica, mas é menos legível porque mistura letras maiúsculas e minúsculas nas palavras).

Métodos alternativos de transliteração

Esquemas com diacríticos

Romanização da Biblioteca Nacional em Calcutá

A romanização da Biblioteca Nacional em Calcutá , destinada à romanização de todas as escritas índicas , é uma extensão do IAST . Ele difere do IAST no uso dos símbolos ē e ō para e (e e o são usados ​​para as vogais curtas presentes em muitas línguas indianas), o uso de 'ḷ' para a consoante (em Kannada ) , e a ausência de símbolos para , e .

ISO 15919

Uma convenção de transliteração padrão não apenas para Devanagari, mas para todos os idiomas do sul da Ásia foi codificada no padrão ISO 15919 de 2001, fornecendo a base para bibliotecas digitais modernas que estão em conformidade com as normas da International Organization for Standardization (ISO). ISO 15919 define a base Unicode comum para a transliteração romana de textos do sul da Ásia em uma ampla variedade de idiomas / scripts.

As transliterações ISO 15919 são textos independentes de plataforma para que possam ser usados ​​de forma idêntica em todos os sistemas operacionais modernos e pacotes de software, desde que estejam em conformidade com as normas ISO. Este é um pré-requisito para todas as plataformas modernas para que a ISO 15919 se torne o novo padrão para bibliotecas e arquivos digitais para transliterar todos os textos do sul da Ásia.

A ISO 15919 usa diacríticos para mapear o conjunto muito maior de grafemas brâmanes para a escrita latina. A parte específica do Devanagari é quase idêntica ao padrão acadêmico, IAST : "Alfabeto Internacional de Transliteração Sânscrita" e ao ALA-LC , o padrão da Biblioteca do Congresso dos Estados Unidos.

Outro padrão, os Sistemas de Romanização das Nações Unidas para Nomes Geográficos (UNRSGN), foi desenvolvido pelo Grupo de Especialistas em Nomes Geográficos das Nações Unidas (UNGEGN) e cobre muitas escritas bramicas. Existem algumas diferenças entre ISO 15919 e UNRSGN.

Esquemas ASCII

Harvard-Kyoto

Comparado ao IAST , Harvard-Kyoto parece muito mais simples. Ele não contém nenhuma das marcas diacríticas que o IAST contém. Em vez de sinais diacríticos, Harvard-Kyoto usa letras maiúsculas . O uso de letras maiúsculas torna a digitação em Harvard-Kyoto muito mais fácil do que em IAST, mas produz palavras com letras maiúsculas dentro delas.

Esquema ITRANS

ITRANS é uma extensão de Harvard-Kyoto . Muitas páginas da web são escritas em ITRANS. Muitos fóruns também são escritos em ITRANS.

O esquema de transliteração ITRANS foi desenvolvido para o pacote de software ITRANS , um pré-processador para scripts índicos . As entradas do usuário em letras romanas e o pré-processador ITRANS converte as letras romanas em Devanāgarī (ou outras escritas índicas). A versão mais recente do ITRANS é a 5.30 lançada em julho de 2001.

Velthuis

A desvantagem dos esquemas ASCII acima é a distinção entre maiúsculas e minúsculas, o que implica que os nomes transliterados não podem ser capitalizados. Essa dificuldade é evitada com o sistema desenvolvido em 1996 por Frans Velthuis para TeX , vagamente baseado em IAST, caso em que é irrelevante.

SLP1

SLP1 (Sanskrit Library Phonetic) é um esquema com distinção entre maiúsculas e minúsculas inicialmente usado pela Sanskrit Library que foi desenvolvido por Peter Scharf e (o último) Malcolm Hyman, que o descreveu pela primeira vez no apêndice B de seu livro Linguistic Issues in Encoding Sanskrit. A vantagem do SLP1 sobre outras codificações é que um único caractere ASCII é usado para cada letra Devanagari, uma peculiaridade que facilita a transliteração reversa.

Outros

Outros esquemas ASCII menos populares incluem a notação WX , Vedatype e o ISO 15919 de 7 bits. A notação WX é um esquema de transliteração para representar idiomas indianos em ASCII. Ele se originou no IIT Kanpur para processamento computacional de línguas indianas e é amplamente utilizado pela comunidade de processamento de linguagem natural (PNL) na Índia. Este esquema é descrito em PNL Panini (Apêndice B). É semelhante, mas não tão versátil quanto, SLP1, no que diz respeito à cobertura do Sânscrito Védico. A comparação de WX com outros esquemas é encontrada em Huet (2009), App A .. Vedatype é outro esquema usado para codificar textos védicos na Maharishi University of Management . Um utilitário de transcodificação online em todos esses esquemas é fornecido na Biblioteca de Sânscrito . ISO 15919 inclui a chamada opção de "conjunto limitado de caracteres" para substituir os diacríticos por prefixos, de forma que seja compatível com ASCII. Uma explicação pictórica está aqui de Anthony Stone .

Comparação de transliteração

O que se segue é uma comparação dos principais métodos de transliteração usados ​​para Devanāgarī.

Vogais

Devanāgarī IAST ISO 15919 Monier-Williams72 Harvard-Kyoto ITRANS Velthuis SLP1 WX
uma uma uma uma uma uma uma uma
uma uma uma UMA A / aa aa UMA UMA
eu eu eu eu eu eu eu eu
eu eu eu eu I / ii ii eu eu
você você você você você você você você
você você você você U / uu uu você você
e ē e e e e e e
ai ai ai ai ai ai E E
o ō o o o o o o
au au au au au au O O
ṛi R RRi / R ^ i .r f q
r̥̄ ṛī RR RRI / R ^ I .rr F Q
eu eu lṛi lR LLi / L ^ i .eu x eu
eu eu lṛī lRR LLI / L ^ I .ll X LY
अं ṉ / ṃ M M / .n / .m .m M M
अः H H .h H H
अँ .N ~ az
' ' ' .uma .uma ' Z

Consoantes

As letras consoantes independentes Devanāgarī são seguidas por um shwa implícito (/ Ə /). Em todos os sistemas de transliteração, esse / Ə / deve ser representado explicitamente usando um 'a' ou qualquer equivalente de shwa .

Devanāgarī IAST ISO 15919 Monier-Williams72 Harvard-Kyoto ITRANS Velthuis SLP1 WX
ka ka ka ka ka ka ka ka
kha kha kha kha kha kha Ka Ka
ga ga ga ga ga ga ga ga
gha gha gha gha gha gha Ga Ga
n / D n / D n / D Ga ~ Na "n / D N / D fa
ca ca ća CH cha ca ca ca
cha cha ćha chha Chha chha Ca Ca
ja ja ja ja ja ja ja ja
jha jha jha jha jha jha Ja Ja
n / D n / D n / D Ja ~ na ~ na Ya Fa
ṭa ṭa ṭa Ta Ta .ta wa ta
ṭha ṭha ṭha Tha Tha .tha Wa Ta
ḍa ḍa ḍa Da Da .da qa da
ḍha ḍha ḍha Dha Dha .dha Qa Da
n / D n / D n / D N / D N / D .n / D Ra N / D
ta ta ta ta ta ta ta wa
isso isso isso isso isso isso Ta Wa
da da da da da da da xa
dha dha dha dha dha dha Da Xa
n / D n / D n / D n / D n / D n / D n / D n / D
pa pa pa pa pa pa pa pa
pha pha pha pha pha pha Pa Pa
BA BA BA BA BA BA BA BA
bha bha bha bha bha bha BA BA
mãe mãe mãe mãe mãe mãe mãe mãe
sim sim sim sim sim sim sim sim
ra ra ra ra ra ra ra ra
la la la la la la la la
va va va va va / wa va va va
śa śa ṡa za sha "sa
ṣa ṣa sha Sha .sa za Ra
sa sa sa sa sa sa sa sa
ha ha ha ha ha ha ha ha

Encontros consonantais irregulares

Devanāgarī ISO 15919 Harvard-Kyoto ITRANS Velthuis SLP1 WX
क्ष kṣa kSa kSa / kSha / xa k.sa kza kRa
त्र tra tra tra tra tra wra
ज्ञ jña jJa GYa / j ~ na j ~ na jYa jFa
श्र śra zra shra "sra Sra Sra

Outras consoantes

Devanāgarī ISO 15919 ITRANS WX
क़ qa qa kZa
ख़ k͟ha Ka KZa
ग़ ġa Ga gZa
ज़ za za jZa
फ़ fa fa PZa
ड़ ṛa .Da dZa
ढ़ ṛha .Dha / Rha DZa

Comparação de IAST com ISO 15919

A tabela abaixo mostra apenas as diferenças entre ISO 15919 e IAST para transliteração Devanagari .

Devanágari ISO 15919 IAST Comente
ए / े ē e Para distinguir entre 'e' longo e curto nas línguas dravidianas , 'e' agora representa ऎ / ॆ (curto). Observe que o uso de ē é considerado opcional na ISO 15919, e usar e para (longo) é aceitável para idiomas que não distinguem e longo e curto.
ओ / ो ō o Para distinguir entre 'o' longo e curto nas línguas dravidianas, 'o' agora representa ऒ / ॊ (curto). Observe que o uso de ō é considerado opcional na ISO 15919, e usar o para (longo) é aceitável para idiomas que não distinguem o longo e o curto.
ऋ / ृ Na ISO 15919, ṛ é usado para representar ड़ .
ॠ / ॄ r̥̄ Para consistência com r̥
ऌ / ॢ eu eu Na ISO 15919, ḷ é usado para representar .
ॡ / ॣ eu eu Para consistência com l̥
◌ं ISO 15919 tem duas opções sobre o anusvāra. (1) Na opção de nasalização simplificada, um anusvāra é sempre transliterado como . (2) Na opção de nasalização estrita, anusvāra antes de uma consoante de classe é transliterado como a classe nasal— ṅ antes de k, kh, g, gh, ṅ; ñ antes de c, ch, j, jh, ñ; antes de , ṭh, ḍ, ḍh, ṇ; n antes de t, th, d, dh, n; m antes de p, ph, b, bh, m. às vezes é usado para representar especificamente Gurmukhi Tippi .
ṅ ñ ṇ nm
◌ँ A nasalização vocálica é transliterada como um til acima da vogal transliterada (sobre a segunda vogal no caso de um dígrafo como aĩ, aũ), exceto em Sânscrito.

Detalhes

Tratamento de schwa inerente

As consoantes de Devanāgarī incluem um som "a inerente", chamado schwa , que deve ser explicitamente representado com um caractere "a" na transliteração. Muitas palavras e nomes transliterados de Devanāgarī terminam com "a", para indicar a pronúncia no sânscrito original . Este schwa é excluído obrigatoriamente em várias línguas indo-arianas modernas , como Hindi , Punjabi , Marathi e outras. Isso resulta em transliterações diferentes para o sânscrito e os idiomas de exclusão de schwa que retêm ou eliminam o schwa conforme apropriado:

  • Sânscrito: Mahābhārata, Rāmāyaṇa, Śiva, Sāmaveda
  • Hindi: Mahābhārat, Rāmāyaṇ, Śiv, Sāmved

Algumas palavras podem manter o a final, geralmente porque seriam difíceis de dizer sem ele:

  • Krishna, Vajra, Maurya

Consoantes retroflexas

A maioria das línguas indianas faz distinção entre as formas retroflexa e dentária das consoantes dentais. Em esquemas de transliteração formal, as letras romanas padrão são usadas para indicar a forma dentária, e a forma retroflexa é indicada por marcas especiais ou o uso de outras letras. Por exemplo, na transliteração IAST , as formas retroflexas são ṇ, ṭ, ḍ e ṣ.

Na maioria das transcrições informais, a distinção entre consoantes retroflexas e dentais não é indicada. No entanto, muitos capitalizam consoantes retroflexas no teclado QWERTY em mensagens informais. Isso geralmente elimina a necessidade de transliteração.

Consoantes aspiradas

Onde a letra "h" aparece após uma consoante plosiva na transliteração de Devanāgarī, sempre indica aspiração . Assim, "ph" é pronunciado como op em "pit" (com um pequeno sopro de ar liberado como é dito), nunca como ph em "photo" ( IPA / f /). (Por outro lado, "p" é pronunciado como op em "cuspir" sem liberação de ar.) Da mesma forma, "th" é um "t" aspirado, nem o th de "this" (expresso, IPA / ð / ) nem o th de "thin" (surda, IPA / θ /).

A aspiração é geralmente indicada em sistemas de transliteração formal e informal.

Uso do computador como uma unidade para romanização

Como o inglês é amplamente usado como uma língua profissional e de ensino superior na Índia, a disponibilidade de teclados Devanagari é ofuscada por teclados ingleses. Da mesma forma, o software e as interfaces de usuário lançados e promovidos na Índia são em inglês, assim como grande parte da educação em informática disponível lá. Devido ao baixo conhecimento dos layouts de teclado Devanagari, muitos usuários indianos digitam hindi na escrita romana.

Antes de Devanagari ser adicionado ao Unicode , muitas soluções alternativas foram usadas para exibir Devanagari na Internet e muitos sites e serviços continuaram a usá-los, apesar da ampla disponibilidade de fontes Unicode com suporte para Devanagari. Embora existam várias convenções de transliteração sobre a transliteração do hindi para o romano, a maioria delas depende de diacríticos. Como a maioria dos indianos está familiarizada com a escrita romana por meio da língua inglesa (que tradicionalmente não usa diacríticos), esses sistemas de transliteração são muito menos conhecidos. A maioria desses "Romanagari" é transliterada arbitrariamente para imitar a ortografia do inglês e, portanto, resulta em inúmeras inconsistências.

Também é prejudicial para os mecanismos de pesquisa, que não classificam o texto em hindi na escrita romana como hindi. O mesmo texto também não pode ser classificado como inglês.

Independentemente do layout do teclado físico, é possível instalar layouts de teclado Hindi baseados em Unicode na maioria dos sistemas operacionais modernos. Existem muitos serviços online disponíveis que transliteram textos escritos em romano para devanágari com precisão, usando dicionários de hindi como referência, como a transliteração do Google . Esta solução é semelhante aos Editores de método de entrada , que são tradicionalmente usados ​​para inserir texto em idiomas que usam caracteres complexos, como chinês , japonês ou coreano .

História da transliteração sânscrita

Os primeiros textos em sânscrito eram originalmente transmitidos por memorização e repetição. A Índia pós-Harappan não tinha nenhum sistema para escrever línguas índicas até a criação (nos séculos 4 e 3 aC) das escritas Kharoshti e Brahmi . Esses sistemas de escrita, embora adequados para as línguas do Índico Médio , não eram bem adaptados para escrever Sânscrito. No entanto, descendentes posteriores de Brahmi foram modificados para que pudessem registrar o sânscrito em detalhes fonéticos precisos. O texto físico mais antigo em sânscrito é uma inscrição na rocha do governante Kshatrapa Ocidental Rudradaman , escrita c. 150 dC em Junagadh , Gujarat . Devido à notável proliferação de diferentes variedades de Brahmi na Idade Média, não existe hoje uma única escrita usada para escrever sânscrito; em vez disso, os estudiosos do sânscrito podem escrever o idioma na forma de qualquer script usado para escrever seu idioma local. No entanto, desde o final da Idade Média, tem havido uma tendência de usar Devanagari para escrever textos em sânscrito para um grande número de leitores.

Estudiosos ocidentais no século 19 adotaram Devanagari para edições impressas de textos em sânscrito. A editio princeps do Rigveda por Max Müller estava em Devanagari. Os compositores londrinos de Müller competiram com seus colegas de Petersburgo trabalhando nos dicionários de Böhtlingk e Roth para cortar todos os tipos de ligaduras exigidos.

Desde o início, a filologia sânscrita ocidental também sentiu a necessidade de uma grafia romanizada da língua. Franz Bopp em 1816 usou um esquema de romanização, ao lado de Devanagari, diferindo de IAST em expressar o comprimento da vogal por um circunflexo (â, î, û), e aspiração por um asper spiritus (por exemplo, bʽ para IAST bh). As sibilantes IAST ṣ e ś ele expressou com spiritus asper e lenis, respectivamente (sʽ, sʼ). Monier-Williams em seu dicionário de 1899 usou ć, ṡ e sh para IAST c, ś e ṣ, respectivamente.

A partir do final do século 19, o interesse ocidental na composição tipográfica Devanágari diminuiu. Theodor Aufrecht publicou sua edição de 1877 do Rigveda em sânscrito romanizado, e a gramática védica de 1910 de Arthur Macdonell (e a gramática védica de 1916 para estudantes ) também dispensam o devanagari (enquanto sua gramática sânscrita introdutória para estudantes mantém o devanagari junto com o sânscrito romanizado). As edições ocidentais contemporâneas de textos em sânscrito aparecem principalmente no IAST.

Veja também

Referências

links externos

http://sanskrit-ai.com/threads/mappings-for-devan%C4%81gar%C4%AB-indic-roman%C4%81gar%C4%AB.333/