Devanagari音譯

Devanagari是用於北印度尼泊爾許多印度語語言的指示腳本,包括印地語馬拉地語尼泊爾,這是用於編寫古典梵文的腳本。從Devanagari到羅馬腳本(有時稱為羅馬化的過程),有幾種類似的音譯方法,包括有影響力和無損的IAST符號。羅馬化的Devanagari也被稱為Romanagari

iast

梵文音譯(IAST)的國際字母ISO 15919標準的子集,用於梵語prakritpāḷi的音譯為帶有變節的羅馬文字。 IAST是廣泛使用的標準。它使用變音符號來消除語音相似但不相同的梵文字形。例如,牙齒和反射輔音用淡化劑歧義:牙齒द= d和retroflexड=ḍ。 iAST的一個重要特徵是它是無損的,即iAST的音譯可能會轉換回Devanāgarī或其他南亞腳本而沒有歧義的情況。許多Unicode字體完全支持IAST顯示和打印。

獵人系統

獵人體系是“印度羅馬化的國家化體系”,是印度政府正式採用的製度。

獵人系統是由當時的印度測量師威廉·威爾遜·亨特(William Wilson Hunter)於19世紀開發的。提出提議時,它立即遇到了早期實踐的支持者的反對,通常扭曲了“羅傑·道勒爵士”(Sir Roger dowler Methods爵士”(早期的Siraj Ud-Daulah )語音轉錄的腐敗,這種轉錄在一次戲劇性的攤牌中達到了高潮印度理事會會議於1872年5月28日開會,新的獵人方法持續了一天。獵人的方法本質上更簡單,並且可以對幾個指示腳本進行擴展,因為它使石墨般的音譯系統化,並且它佔了上風並獲得了政府和學術上的接受。素數音譯模型的反對者繼續進行不成功的嘗試逆轉政府政策,直到本世紀初,一位批評家呼籲“印度政府放棄整個科學企圖(IE獵人)音譯,並決定一次所有人都讚成返回舊的語音拼寫。”

隨著時間的流逝,獵人的方法擴展到覆蓋範圍,以涵蓋包括緬甸藏族在內的幾個指示腳本。在適用的情況下,還為印度 - 雅利語中的Schwa缺失提供了規定,例如,印地語被譯為Kānpur (而不是Kānapura ),但是梵語是sanskrit的,被翻譯為Krama (而不是Kram )。隨著時間的流逝,該系統經歷了一些演變。例如,在原始版本中,長元音標記了重音的重音,但後來在1954年印度政府更新中以馬克龍的更新取代了這一點。因此, Life )以前被稱為ján ,但開始被詹妮(Jān)被羅馬化。多年來,獵人體係因沒有產生語音準確的結果而面臨批評,而“無所不能地適合英語接管人”。具體而言,反射輔音牙齒輔音之間缺乏分化(例如, d代表D )已重複進行批評,並啟發了一些提出的對亨特式的修改,包括在反射下使用變節(例如,使 = d = d andड= d = d = ,更可讀性,但需要大氣打印)或資本化它們(例如製作 = dand = d ,它不需要任何變性印刷,但不太可讀,因為它用單詞將小的大寫字母混合在一起)。

替代音譯方法

具有變量的方案

加爾各答羅馬化的國家圖書館

加爾各答羅馬化的國家圖書館,旨在用於所有指示腳本的羅馬化,是iAST的延伸。它不同於iAST在使用符號和ō的符號方面和e和o)(e和o用於許多印度語言中存在的短元音),用於輔音(在kannada中的'ḷ'和沒有符號

ISO 15919

不僅針對Devanagari的標準音譯公約,而且對於所有南亞語言,在2001年的ISO 15919標準中都進行了編纂,為符合國際標準化組織(ISO)規範的現代數字圖書館提供了基礎。 ISO 15919定義了以各種語言/腳本對南亞文本音譯的共同Unicode基礎。

ISO 15919音譯是與平台無關的文本,因此只要符合ISO規範,它們就可以在所有現代操作系統和軟件包上相同使用。這是所有現代平台的先決條件,因此ISO 15919已成為數字圖書館和檔案的新標準,用於音譯所有南亞文本。

ISO 15919使用變音符號將大量更大的Brahmic素描映射到拉丁文腳本。特定於Devanagari的部分幾乎與學術標準相同, IAST :“梵文音譯國際字母”,以及美國國會圖書館標準的ALA-LC

另一個標準的是聯合國對地理名稱的羅馬化系統(UNRSGN),是由聯合國地理名稱(UNGEGN)專家集團開發的,涵蓋了許多Brahmic腳本。 ISO 15919和UNRSGN之間存在一些差異。

ASCII計劃

哈佛大學 - 凱托

IAST相比,哈佛大學 - 京都看起來更簡單。它不包含iAST包含的任何變性標記。哈佛大學 - 凱托(Harvard-Kyoto)代替了變音術,使用大寫字母。大寫字母的使用使得在哈佛 - 京託的打字比iAST更容易,但在其中產生帶有大寫字母的單詞。

ITRANS計劃

ITRANS哈佛大學的延伸。 ITRANS音譯方案是為ITRANS軟件包開發的,ITRANS軟件包是指示腳本的預處理器。用戶輸入羅馬字母和ITRANS預處理器將羅馬字母轉換為Devanāgarī(或其他指示腳本)。 ITRANS的最新版本是2001年7月發布的5.30版。

Velthuis

上述ASCII方案的缺點是病例敏感性,這意味著音譯名稱可能不會大寫。通過弗朗斯·韋爾圖伊斯(Frans Velthuis)在1996年開發的系統中,避免了這種困難,以寬鬆的基於iAST,在這種情況下是無關緊要的。

WX

WX符號是代表ASCII印度語言的音譯方案。該計劃起源於IIT Kanpur用於印度語言的計算處理,並在印度的自然語言處理(NLP)社區中廣泛使用。例如,在IIT Kanpur的NLP教科書中使用了符號(儘管未識別)。[1]這種音譯方案的顯著特徵是:每個輔音和每個元音都有一個映射到羅馬的映射。因此,從計算的角度來看,這是一個前綴代碼,[2]有利。通常,小案例字母用於未吸氣的輔音和短元音,而大寫字母則用於吸氣輔音和長元音。雖然將反射的無聲和聲音輔音映射到“ t,t,d和d”,但牙齒映射到'w,w,w,x和x'。因此,方案“ WX”的名稱,指的是特質映射。 Ubuntu Linux為WX符號提供了鍵盤支持。

SLP1

SLP1(梵語圖書館語音)是梵文庫最初使用的案例敏感方案,該方案是由彼得·沙夫(Peter Scharf)和(已故的)馬爾科姆·海曼(Malcolm Hyman)開發的。 SLP1比其他編碼的優點是,每個Devanagari字母都使用了一個ASCII字符,這是一種可以緩解反向音譯的特殊性。

hinglish

Hinglish指的是在線使用的非標準化的羅馬化印地語,尤其是在社交媒體上。在印度,羅馬化的印地語是在線表達的主要形式。在對YouTube評論的分析中,Palakodety等人確定了52%的評論在羅馬化的印地語中,英語為46%,在Devanagari印地語中為1%。

其他的

其他不太流行的ASCII方案包括WX符號,VEDATYPE和7位ISO15919。WX符號是代表ASCII印度語言的音譯方案。它起源於IIT Kanpur用於印度語言的計算處理,並在印度的自然語言處理(NLP)社區中廣泛使用。該方案在2013年11月26日在Wayback Machine (附錄B)的NLP Panini描述。就吠陀梵語的覆蓋範圍而言,它與SLP1的用途相似,但不如SLP1。在Huet(2009),App A.中發現了WX與其他方案的比較。 VEDATYPE是Maharishi管理大學編碼吠陀文本的另一種計劃。 梵語圖書館提供了所有這些方案的在線轉碼實用程序。 ISO 15919包括一個所謂的“有限角色集”選項,以替換前綴替換變量,以使其與ASCII兼容。 安東尼·斯通(Anthony Stone) 這裡有一個繪畫解釋。

音譯比較

以下是用於Devanāgarī的主要音譯方法的比較。

元音

DevanāgarīiastISO 15919Monier-Williams72哈佛大學 - 凱托ItransVelthuisSLP1WX
aaaaaaaa
āāāAA/AAaaAA
iiiiiiii
īīīII/IIiiII
uuuuuuuu
ūūūUu/uuuuUU
eēeeeeee
人工智慧人工智慧人工智慧人工智慧人工智慧人工智慧EE
oōoooooo
auauauauauauOO
iiRrri/r^i.rfq
r̥̄ṛīRRrri/r^i.rrFQ
l馬LRlli/l^i.lxL
l̥̄lṛīLRRlli/l^i。二Xly
अंṉ/ṃMm/.n/.m.mMM
अःHH。HHH
अँã.n~AZ
''。A。A'Z

輔音

devanāgarī獨立的輔音字母后面是隱式shwa (/ə/)。在所有音譯系統中,必須使用“ A”或任何等效的SHWA明確表示該 /ə /。

DevanāgarīiastISO 15919Monier-Williams72哈佛大學 - 凱托ItransVelthuisSLP1WX
K aK aK aK aK aK aK aK a
khakhakhakhakhakhaK aK a
GAGAGAGAGAGAGAGA
GhaGhaGhaGhaGhaGhaGAGA
ṅaṅan·aGA〜na“ nanaF A
CACA®chachaCACACA
chachachhachachhaCACA
JAJAJAJAJAJAJAJA
JhaJhaJhaJhaJhaJhaJAJA
ñañaṅaJA〜na〜na是的F A
ṭaṭaṭatata.taWAta
HAHAHAthatha.thaWAta
ḍaḍaḍadada.da質量檢查da
ḍ哈ḍ哈ḍ哈dhadha.dha質量檢查da
nana.naRAna
tatatatatatataWA
thathathathathathataWA
dadadadadadadaxa
dhadhadhadhadhadhadaxa
nananananananana
PAPAPAPAPAPAPAPA
PHAPHAPHAPHAPHAPHAPAPA
BABABABABABABABA
bhabhabhabhabhabhaBABA
是的是的是的是的是的是的是的是的
RARARARARARARARA
洛杉磯洛杉磯洛杉磯洛杉磯洛杉磯洛杉磯洛杉磯洛杉磯
VAVAVAVAVA/WAVAVAVA
ŚaŚaṡaZA“ SASASA
ṣaṣaSA.saZARA
SASASASASASASASA
ḷaḷaḷa洛杉磯洛杉磯.la洛杉磯ly

不規則的輔音簇

DevanāgarīISO 15919哈佛大學 - 凱托ItransVelthuisSLP1WX
क्षkṣaKSAksa/ksha/xaK.SaKzaKra
त्र特拉特拉特拉特拉特拉WRA
ज्ञjñaJJAgya/j〜naJ〜naJyaJFA
श्रŚraZRA什拉“ SraSRASRA

其他輔音

DevanāgarīISO 15919ItransWX
क़質量檢查質量檢查Kza
ख़k͟haK aKza
ग़ġaGAGza
ज़ZAZAJZA
फ़F AF APZA
ड़a.da/raDZA
ढ़.dha/rhaDZA

IAST與ISO 15919的比較

下表僅顯示了ISO 15919和iAST之間的差異。

DevanagariISO 15919iast評論
ए / ेēe為了區分dravidian語言中的長“ e”,“ e”現在代表ऎ /ॆ (簡短)。請注意,在ISO 15919中,使用δ被認為是可選的,並且對於不區分長e和短e的語言是可以接受的。
ओ / ोōo為了區分dravidian語言中的長“ o”,'o'現在代表ऒ /ॊ (簡短)。請注意,在ISO 15919中,使用ō的使用被認為是可選的,並且對於不區分長o的語言,可以接受o 長)。
ऋ / ृ在ISO 15919中,用於代表ड़
ॠ / ॄr̥̄為了與R̥保持一致
ऌ / ॢ在ISO 15919中,ḷ用於表示
ॡ / ॣl̥̄為了與l̥一致
◌ंISO 15919有兩個關於Anusvāra的選擇。 (1)在簡化的鼻腔化選項中,肛門始終被音譯為 。 (2)在嚴格的鼻腔化選項中,輔音之前的Anusvāra被縮寫為鼻腔 - nasal -ṅ在k,kh,g,gh,ṅ之前;在C,CH,J,JH, ñ之前;之前,,,ḍ,ḍH,μ; n之前,t,t,d,dh,n; m p,pH,b,bh,m。 有時用於特異性代表Gurmukhi Tippi
nm
◌ँ元音鼻音化作為在音譯元音上方的tilde(在第二個元音(例如aĩ,aũ)的情況下,除了梵語中,元音在第二個元音上。

細節

固有的schwa處理

devanāgarī輔音包括一種“固有的”聲音,稱為schwa ,必須在音譯中以“ a”角色明確表示。從devanāgarī結束的許多單詞和名稱都以“ a”結束,以指示原始梵語中的發音。這種schwa被強制地用幾種現代的印度雅利語刪除,例如印地語旁遮普語馬拉地語等。這會導致梵語和Schwa填充語言的不同音譯,這些語言保留或消除SCHWA:

  • 梵語:Mahābhārata,Rāmāyaṇa,Śiva,sāmaveda
  • 印地語:Mahābhārat,Rāmāyaṇa,Śiv

有些單詞可能會保留最終A,因為沒有它,它們很難說:

  • 克里希納,金杰拉,莫里亞

因此,某些以輔音簇結尾的單詞在各種現代指示語言中都會改變:Mantra = Mantar。 shabda =沙巴德。 Sushumna = Sushumana。

反射輔音

大多數印度語言都在牙齒輔音的反射和牙齒形式之間有所區別。在正式的音譯方案中,標準羅馬字母用於指示牙齒形式,並且反射形式由特殊標記或其他字母的使用表示。例如,在iAST音譯中,反射形式為δ,,ḍ和δ。

在大多數非正式抄寫中,未指示反射和牙齒輔音之間的區別。但是,許多人在非正式消息傳遞中將Qwerty鍵盤上的Retroflex輔音大寫。這通常消除了音譯的需求。

吸氣輔音

在Devanāgarī音譯中的s諧音後,字母“ H”出現,它總是表明願望。因此,“ pH”發音為“坑”中的p (據說釋放了一小片空氣),從來沒有像“ photo”中的pH( ipa /f /)中的pH 。 (另一方面,“ p”發音為“吐口水”p 。 )也不“薄”(未配音的IPA /θ /)。

通常在正式和非正式音譯系統中表明願望。

計算機用作羅馬化的驅動器

由於英語在印度廣泛使用了專業和高等教育的語言,因此英語鍵盤使Devanagari鍵盤的可用性相形見war。同樣,在印度發布和推廣的軟件和用戶界面是英語,那裡的許多計算機教育也是如此。由於對Devanagari鍵盤佈局的意識較低,因此許多印度用戶在羅馬腳本中鍵入印地語。

在將Devanagari添加到Unicode之前,許多解決方法都被用於在互聯網上顯示Devanagari,儘管許多支持Devanagari的Unicode字體廣泛可用,但許多站點和服務仍在繼續使用它們。儘管有幾次關於將印地語音譯為羅馬的音譯慣例,但其中大多數依賴於變量。由於大多數印度人通過英語(傳統上不使用變音術)熟悉羅馬文字,因此這些音譯系統眾所周知。大多數這樣的“ romanagari”是任意的,以模仿英語拼寫,從而導致許多不一致之處。

它也不利於搜索引擎,這些引擎不會將印地語在羅馬腳本中分類為印地語。相同的文本也可能不會分類為英語。

無論物理鍵盤的佈局如何,都可以在大多數現代操作系統上安裝基於Unicode的印地語鍵盤佈局。有許多在線服務可以使用印地語詞典來準確地將羅馬文字譯為Devanagari,例如Google TrellliTrationMicrosoft Indic語言輸入工具。該解決方案類似於輸入方法編輯器,傳統上用來以使用複雜字符(例如中文日語韓語)輸入文本。

梵語音譯的歷史

梵文早期的文字最初是通過記憶和重複傳輸的。直到哈拉普( Kharoshti )和婆羅門(Brahmi)腳本的創作(在公元前4世紀)創建(在公元前4世紀)之前,印度哈拉潘(Harappan India)才有編寫指示語言的系統。這些寫作系統雖然足以適合中間語言,但並未適應梵語。但是,後來對婆羅門的後代進行了修改,以便他們可以記錄梵語的語音細節。梵語中最早的物理文字是西方Kshatrapa統治者魯德拉達曼(Rudradaman)的岩石銘文,書面c。 150 CE在古吉拉特邦Junagadh 。由於中世紀不同品種的不同品種的顯著擴散,如今沒有用於編寫梵語的單一腳本。相反,梵語學者可以以任何用來編寫本地語言的腳本的形式編寫語言。但是,由於中世紀後期,人們一直傾向於使用Devanagari來編寫梵文文本,以進行廣泛的讀者。

19世紀的西方學者採用了梵文印刷版的Devanagari。 MaxMüllerRigvedaEditio Princeps在Devanagari。穆勒(Müller)的倫敦排版者與他們在伯特林克( Böhtlingk )和羅斯(Böhtlingk)的詞典工作的彼得斯堡同齡人競爭,以削減所有必需的綁紮類型。

從一開始,西方的梵語語言學也感到需要對語言進行羅馬拼寫。弗朗茲·鮑普(Franz Bopp)在1816年與瓦納加里(Devanagari)一起使用了羅馬化方案,與iAST不同,與iAST通過繞元音長度表達元音長度(â,â,歧程) ,並通過spiritus asper(例如,iAST BH)的spiritus asper (例如BH)。他分別用Spiritus Asper和Lenis表達了sibinants g和Ś(Sʽ,S s)。 Monier-Williams在他的1899年詞典中分別使用了,ṡ和sh,分別用於iast c,Ś和g。

從19世紀後期開始,西方對排版Devanagari的興趣減少了。 Theodor Aufrecht published his 1877 edition of the Rigveda in romanized Sanskrit, and Arthur Macdonell 's 1910 Vedic grammar (and 1916 Vedic grammar for students ) likewise do without Devanagari (while his introductory Sanskrit grammar for students retains Devanagari alongside romanized Sanskrit).當代梵文文本的西方版本主要出現在iAST中。

也可以看看