Devanagari音譯
Devanagari是用於北印度和尼泊爾許多印度語語言的指示腳本,包括印地語,馬拉地語和尼泊爾,這是用於編寫古典梵文的腳本。從Devanagari到羅馬腳本(有時稱為羅馬化的過程),有幾種類似的音譯方法,包括有影響力和無損的IAST符號。羅馬化的Devanagari也被稱為Romanagari 。
iast
梵文音譯(IAST)的國際字母是ISO 15919標準的子集,用於梵語, prakrit和pāḷi的音譯為帶有變節的羅馬文字。 IAST是廣泛使用的標準。它使用變音符號來消除語音相似但不相同的梵文字形。例如,牙齒和反射輔音用淡化劑歧義:牙齒द= d和retroflexड=ḍ。 iAST的一個重要特徵是它是無損的,即iAST的音譯可能會轉換回Devanāgarī或其他南亞腳本而沒有歧義的情況。許多Unicode字體完全支持IAST顯示和打印。
獵人系統
獵人體系是“印度羅馬化的國家化體系”,是印度政府正式採用的製度。
獵人系統是由當時的印度測量師威廉·威爾遜·亨特(William Wilson Hunter)於19世紀開發的。提出提議時,它立即遇到了早期實踐的支持者的反對,通常扭曲了“羅傑·道勒爵士”(Sir Roger dowler Methods爵士”(早期的Siraj Ud-Daulah )語音轉錄的腐敗,這種轉錄在一次戲劇性的攤牌中達到了高潮印度理事會會議於1872年5月28日開會,新的獵人方法持續了一天。獵人的方法本質上更簡單,並且可以對幾個指示腳本進行擴展,因為它使石墨般的音譯系統化,並且它佔了上風並獲得了政府和學術上的接受。素數音譯模型的反對者繼續進行不成功的嘗試逆轉政府政策,直到本世紀初,一位批評家呼籲“印度政府放棄整個科學企圖(IE獵人)音譯,並決定一次所有人都讚成返回舊的語音拼寫。”
隨著時間的流逝,獵人的方法擴展到覆蓋範圍,以涵蓋包括緬甸和藏族在內的幾個指示腳本。在適用的情況下,還為印度 - 雅利語中的Schwa缺失提供了規定,例如,印地語被譯為Kānpur (而不是Kānapura ),但是梵語是sanskrit的,被翻譯為Krama (而不是Kram )。隨著時間的流逝,該系統經歷了一些演變。例如,在原始版本中,長元音標記了重音的重音,但後來在1954年印度政府更新中以馬克龍的更新取代了這一點。因此, ज ( Life )以前被稱為ján ,但開始被詹妮(Jān)被羅馬化。多年來,獵人體係因沒有產生語音準確的結果而面臨批評,而“無所不能地適合英語接管人”。具體而言,反射輔音和牙齒輔音之間缺乏分化(例如, d代表D )已重複進行批評,並啟發了一些提出的對亨特式的修改,包括在反射下使用變節(例如,使द = d = d andड= d = d和ड = ḍ ,更可讀性,但需要大氣打印)或資本化它們(例如製作द = dand ड = d ,它不需要任何變性印刷,但不太可讀,因為它用單詞將小的大寫字母混合在一起)。
替代音譯方法
具有變量的方案
加爾各答羅馬化的國家圖書館
加爾各答羅馬化的國家圖書館,旨在用於所有指示腳本的羅馬化,是iAST的延伸。它不同於iAST在使用符號和ō的符號方面和ओ ( e和o)(e和o用於許多印度語言中存在的短元音),用於輔音(在kannada ) ಳ中的'ḷ'和沒有符號ॠ , ऌ和ॡ 。
ISO 15919
不僅針對Devanagari的標準音譯公約,而且對於所有南亞語言,在2001年的ISO 15919標準中都進行了編纂,為符合國際標準化組織(ISO)規範的現代數字圖書館提供了基礎。 ISO 15919定義了以各種語言/腳本對南亞文本音譯的共同Unicode基礎。
ISO 15919音譯是與平台無關的文本,因此只要符合ISO規範,它們就可以在所有現代操作系統和軟件包上相同使用。這是所有現代平台的先決條件,因此ISO 15919已成為數字圖書館和檔案的新標準,用於音譯所有南亞文本。
ISO 15919使用變音符號將大量更大的Brahmic素描映射到拉丁文腳本。特定於Devanagari的部分幾乎與學術標準相同, IAST :“梵文音譯國際字母”,以及美國國會圖書館標準的ALA-LC 。
另一個標準的是聯合國對地理名稱的羅馬化系統(UNRSGN),是由聯合國地理名稱(UNGEGN)專家集團開發的,涵蓋了許多Brahmic腳本。 ISO 15919和UNRSGN之間存在一些差異。
ASCII計劃
哈佛大學 - 凱托
與IAST相比,哈佛大學 - 京都看起來更簡單。它不包含iAST包含的任何變性標記。哈佛大學 - 凱托(Harvard-Kyoto)代替了變音術,使用大寫字母。大寫字母的使用使得在哈佛 - 京託的打字比iAST更容易,但在其中產生帶有大寫字母的單詞。
ITRANS計劃
ITRANS是哈佛大學的延伸。 ITRANS音譯方案是為ITRANS軟件包開發的,ITRANS軟件包是指示腳本的預處理器。用戶輸入羅馬字母和ITRANS預處理器將羅馬字母轉換為Devanāgarī(或其他指示腳本)。 ITRANS的最新版本是2001年7月發布的5.30版。
Velthuis
上述ASCII方案的缺點是病例敏感性,這意味著音譯名稱可能不會大寫。通過弗朗斯·韋爾圖伊斯(Frans Velthuis)在1996年開發的系統中,避免了這種困難,以寬鬆的基於iAST,在這種情況下是無關緊要的。
WX
WX符號是代表ASCII印度語言的音譯方案。該計劃起源於IIT Kanpur用於印度語言的計算處理,並在印度的自然語言處理(NLP)社區中廣泛使用。例如,在IIT Kanpur的NLP教科書中使用了符號(儘管未識別)。[1]這種音譯方案的顯著特徵是:每個輔音和每個元音都有一個映射到羅馬的映射。因此,從計算的角度來看,這是一個前綴代碼,[2]有利。通常,小案例字母用於未吸氣的輔音和短元音,而大寫字母則用於吸氣輔音和長元音。雖然將反射的無聲和聲音輔音映射到“ t,t,d和d”,但牙齒映射到'w,w,w,x和x'。因此,方案“ WX”的名稱,指的是特質映射。 Ubuntu Linux為WX符號提供了鍵盤支持。
SLP1
SLP1(梵語圖書館語音)是梵文庫最初使用的案例敏感方案,該方案是由彼得·沙夫(Peter Scharf)和(已故的)馬爾科姆·海曼(Malcolm Hyman)開發的。 SLP1比其他編碼的優點是,每個Devanagari字母都使用了一個ASCII字符,這是一種可以緩解反向音譯的特殊性。
hinglish
Hinglish指的是在線使用的非標準化的羅馬化印地語,尤其是在社交媒體上。在印度,羅馬化的印地語是在線表達的主要形式。在對YouTube評論的分析中,Palakodety等人確定了52%的評論在羅馬化的印地語中,英語為46%,在Devanagari印地語中為1%。
其他的
其他不太流行的ASCII方案包括WX符號,VEDATYPE和7位ISO15919。WX符號是代表ASCII印度語言的音譯方案。它起源於IIT Kanpur用於印度語言的計算處理,並在印度的自然語言處理(NLP)社區中廣泛使用。該方案在2013年11月26日在Wayback Machine (附錄B)的NLP Panini中描述。就吠陀梵語的覆蓋範圍而言,它與SLP1的用途相似,但不如SLP1。在Huet(2009),App A.中發現了WX與其他方案的比較。 VEDATYPE是Maharishi管理大學編碼吠陀文本的另一種計劃。 梵語圖書館提供了所有這些方案的在線轉碼實用程序。 ISO 15919包括一個所謂的“有限角色集”選項,以替換前綴替換變量,以使其與ASCII兼容。 安東尼·斯通(Anthony Stone) 這裡有一個繪畫解釋。
音譯比較
以下是用於Devanāgarī的主要音譯方法的比較。
元音
Devanāgarī | iast | ISO 15919 | Monier-Williams72 | 哈佛大學 - 凱托 | Itrans | Velthuis | SLP1 | WX |
---|---|---|---|---|---|---|---|---|
अ | a | a | a | a | a | a | a | a |
आ | ā | ā | ā | A | A/AA | aa | A | A |
इ | i | i | i | i | i | i | i | i |
ई | ī | ī | ī | I | I/II | ii | I | I |
उ | u | u | u | u | u | u | u | u |
ऊ | ū | ū | ū | U | u/uu | uu | U | U |
ए | e | ē | e | e | e | e | e | e |
ऐ | 人工智慧 | 人工智慧 | 人工智慧 | 人工智慧 | 人工智慧 | 人工智慧 | E | E |
ओ | o | ō | o | o | o | o | o | o |
औ | au | au | au | au | au | au | O | O |
ऋ | ṛ | r̥ | ii | R | rri/r^i | .r | f | q |
ॠ | ṝ | r̥̄ | ṛī | RR | rri/r^i | .rr | F | Q |
ऌ | ḷ | l̥ | l馬 | LR | lli/l^i | .l | x | L |
ॡ | ḹ | l̥̄ | lṛī | LRR | lli/l^i | 。二 | X | ly |
अं | ṃ | ṁ | ṉ/ṃ | M | m/.n/.m | .m | M | M |
अः | ḥ | ḥ | ḥ | H | H | 。H | H | H |
अँ | ã | m̐ | .n | ~ | AZ | |||
ऽ | ' | ’ | ' | 。A | 。A | ' | Z |
輔音
devanāgarī獨立的輔音字母后面是隱式shwa (/ə/)。在所有音譯系統中,必須使用“ A”或任何等效的SHWA明確表示該 /ə /。
Devanāgarī | iast | ISO 15919 | Monier-Williams72 | 哈佛大學 - 凱托 | Itrans | Velthuis | SLP1 | WX |
---|---|---|---|---|---|---|---|---|
क | K a | K a | K a | K a | K a | K a | K a | K a |
ख | kha | kha | kha | kha | kha | kha | K a | K a |
ग | GA | GA | GA | GA | GA | GA | GA | GA |
घ | Gha | Gha | Gha | Gha | Gha | Gha | GA | GA |
ङ | ṅa | ṅa | n·a | GA | 〜na | “ na | na | F A |
च | CA | CA | ® | cha | cha | CA | CA | CA |
छ | cha | cha | 哈 | chha | cha | chha | CA | CA |
ज | JA | JA | JA | JA | JA | JA | JA | JA |
झ | Jha | Jha | Jha | Jha | Jha | Jha | JA | JA |
ञ | ña | ña | ṅa | JA | 〜na | 〜na | 是的 | F A |
ट | ṭa | ṭa | ṭa | ta | ta | .ta | WA | ta |
ठ | HA | HA | HA | tha | tha | .tha | WA | ta |
ड | ḍa | ḍa | ḍa | da | da | .da | 質量檢查 | da |
ढ | ḍ哈 | ḍ哈 | ḍ哈 | dha | dha | .dha | 質量檢查 | da |
ण | 鴻 | 鴻 | 鴻 | na | na | .na | RA | na |
त | ta | ta | ta | ta | ta | ta | ta | WA |
थ | tha | tha | tha | tha | tha | tha | ta | WA |
द | da | da | da | da | da | da | da | xa |
ध | dha | dha | dha | dha | dha | dha | da | xa |
न | na | na | na | na | na | na | na | na |
प | PA | PA | PA | PA | PA | PA | PA | PA |
फ | PHA | PHA | PHA | PHA | PHA | PHA | PA | PA |
ब | BA | BA | BA | BA | BA | BA | BA | BA |
भ | bha | bha | bha | bha | bha | bha | BA | BA |
म | 嘛 | 嘛 | 嘛 | 嘛 | 嘛 | 嘛 | 嘛 | 嘛 |
य | 是的 | 是的 | 是的 | 是的 | 是的 | 是的 | 是的 | 是的 |
र | RA | RA | RA | RA | RA | RA | RA | RA |
ल | 洛杉磯 | 洛杉磯 | 洛杉磯 | 洛杉磯 | 洛杉磯 | 洛杉磯 | 洛杉磯 | 洛杉磯 |
व | VA | VA | VA | VA | VA/WA | VA | VA | VA |
श | Śa | Śa | ṡa | ZA | 莎 | “ SA | SA | SA |
ष | ṣa | ṣa | 莎 | SA | 莎 | .sa | ZA | RA |
स | SA | SA | SA | SA | SA | SA | SA | SA |
ह | 哈 | 哈 | 哈 | 哈 | 哈 | 哈 | 哈 | 哈 |
ळ | ḷa | ḷa | ḷa | 洛杉磯 | 洛杉磯 | .la | 洛杉磯 | ly |
不規則的輔音簇
Devanāgarī | ISO 15919 | 哈佛大學 - 凱托 | Itrans | Velthuis | SLP1 | WX |
---|---|---|---|---|---|---|
क्ष | kṣa | KSA | ksa/ksha/xa | K.Sa | Kza | Kra |
त्र | 特拉 | 特拉 | 特拉 | 特拉 | 特拉 | WRA |
ज्ञ | jña | JJA | gya/j〜na | J〜na | Jya | JFA |
श्र | Śra | ZRA | 什拉 | “ Sra | SRA | SRA |
其他輔音
Devanāgarī | ISO 15919 | Itrans | WX |
---|---|---|---|
क़ | 質量檢查 | 質量檢查 | Kza |
ख़ | k͟ha | K a | Kza |
ग़ | ġa | GA | Gza |
ज़ | ZA | ZA | JZA |
फ़ | F A | F A | PZA |
ड़ | a | .da/ra | DZA |
ढ़ | 哈 | .dha/rha | DZA |
IAST與ISO 15919的比較
下表僅顯示了ISO 15919和iAST之間的差異。
Devanagari | ISO 15919 | iast | 評論 |
---|---|---|---|
ए / े | ē | e | 為了區分dravidian語言中的長“ e”,“ e”現在代表ऎ /ॆ (簡短)。請注意,在ISO 15919中,使用δ被認為是可選的,並且對於不區分長e和短e的語言是可以接受的。 |
ओ / ो | ō | o | 為了區分dravidian語言中的長“ o”,'o'現在代表ऒ /ॊ (簡短)。請注意,在ISO 15919中,使用ō的使用被認為是可選的,並且對於不區分長o的語言,可以接受o (長)。 |
ऋ / ृ | r̥ | ṛ | 在ISO 15919中,用於代表ड़ 。 |
ॠ / ॄ | r̥̄ | ṝ | 為了與R̥保持一致 |
ऌ / ॢ | l̥ | ḷ | 在ISO 15919中,ḷ用於表示ळ 。 |
ॡ / ॣ | l̥̄ | ḹ | 為了與l̥一致 |
◌ं | ṁ | ṃ | ISO 15919有兩個關於Anusvāra的選擇。 (1)在簡化的鼻腔化選項中,肛門始終被音譯為ṁ 。 (2)在嚴格的鼻腔化選項中,輔音之前的Anusvāra被縮寫為鼻腔 - nasal -ṅ在k,kh,g,gh,ṅ之前;在C,CH,J,JH, ñ之前;之前,,,ḍ,ḍH,μ; n之前,t,t,d,dh,n; m p,pH,b,bh,m。 ṃ有時用於特異性代表Gurmukhi Tippi ੰ 。 |
nm | |||
◌ँ | m̐ | m̐ | 元音鼻音化作為在音譯元音上方的tilde(在第二個元音(例如aĩ,aũ)的情況下,除了梵語中,元音在第二個元音上。 |
細節
固有的schwa處理
devanāgarī輔音包括一種“固有的”聲音,稱為schwa ,必須在音譯中以“ a”角色明確表示。從devanāgarī結束的許多單詞和名稱都以“ a”結束,以指示原始梵語中的發音。這種schwa被強制地用幾種現代的印度雅利語刪除,例如印地語,旁遮普語,馬拉地語等。這會導致梵語和Schwa填充語言的不同音譯,這些語言保留或消除SCHWA:
- 梵語:Mahābhārata,Rāmāyaṇa,Śiva,sāmaveda
- 印地語:Mahābhārat,Rāmāyaṇa,Śiv
有些單詞可能會保留最終A,因為沒有它,它們很難說:
- 克里希納,金杰拉,莫里亞
因此,某些以輔音簇結尾的單詞在各種現代指示語言中都會改變:Mantra = Mantar。 shabda =沙巴德。 Sushumna = Sushumana。
反射輔音
大多數印度語言都在牙齒輔音的反射和牙齒形式之間有所區別。在正式的音譯方案中,標準羅馬字母用於指示牙齒形式,並且反射形式由特殊標記或其他字母的使用表示。例如,在iAST音譯中,反射形式為δ,,ḍ和δ。
在大多數非正式抄寫中,未指示反射和牙齒輔音之間的區別。但是,許多人在非正式消息傳遞中將Qwerty鍵盤上的Retroflex輔音大寫。這通常消除了音譯的需求。
吸氣輔音
在Devanāgarī音譯中的s諧音後,字母“ H”出現,它總是表明願望。因此,“ pH”發音為“坑”中的p (據說釋放了一小片空氣),從來沒有像“ photo”中的pH( ipa /f /)中的pH 。 (另一方面,“ p”發音為“吐口水”中的p 。 )也不是“薄”(未配音的IPA /θ /)。
通常在正式和非正式音譯系統中表明願望。
計算機用作羅馬化的驅動器
由於英語在印度廣泛使用了專業和高等教育的語言,因此英語鍵盤使Devanagari鍵盤的可用性相形見war。同樣,在印度發布和推廣的軟件和用戶界面是英語,那裡的許多計算機教育也是如此。由於對Devanagari鍵盤佈局的意識較低,因此許多印度用戶在羅馬腳本中鍵入印地語。
在將Devanagari添加到Unicode之前,許多解決方法都被用於在互聯網上顯示Devanagari,儘管許多支持Devanagari的Unicode字體廣泛可用,但許多站點和服務仍在繼續使用它們。儘管有幾次關於將印地語音譯為羅馬的音譯慣例,但其中大多數依賴於變量。由於大多數印度人通過英語(傳統上不使用變音術)熟悉羅馬文字,因此這些音譯系統眾所周知。大多數這樣的“ romanagari”是任意的,以模仿英語拼寫,從而導致許多不一致之處。
它也不利於搜索引擎,這些引擎不會將印地語在羅馬腳本中分類為印地語。相同的文本也可能不會分類為英語。
無論物理鍵盤的佈局如何,都可以在大多數現代操作系統上安裝基於Unicode的印地語鍵盤佈局。有許多在線服務可以使用印地語詞典來準確地將羅馬文字譯為Devanagari,例如Google TrellliTration或Microsoft Indic語言輸入工具。該解決方案類似於輸入方法編輯器,傳統上用來以使用複雜字符(例如中文,日語或韓語)輸入文本。
梵語音譯的歷史
梵文早期的文字最初是通過記憶和重複傳輸的。直到哈拉普( Kharoshti )和婆羅門(Brahmi)腳本的創作(在公元前4世紀)創建(在公元前4世紀)之前,印度哈拉潘(Harappan India)才有編寫指示語言的系統。這些寫作系統雖然足以適合中間語言,但並未適應梵語。但是,後來對婆羅門的後代進行了修改,以便他們可以記錄梵語的語音細節。梵語中最早的物理文字是西方Kshatrapa統治者魯德拉達曼(Rudradaman)的岩石銘文,書面c。 150 CE在古吉拉特邦Junagadh 。由於中世紀不同品種的不同品種的顯著擴散,如今沒有用於編寫梵語的單一腳本。相反,梵語學者可以以任何用來編寫本地語言的腳本的形式編寫語言。但是,由於中世紀後期,人們一直傾向於使用Devanagari來編寫梵文文本,以進行廣泛的讀者。
19世紀的西方學者採用了梵文印刷版的Devanagari。 MaxMüller的Rigveda的Editio Princeps在Devanagari。穆勒(Müller)的倫敦排版者與他們在伯特林克( Böhtlingk )和羅斯(Böhtlingk)的詞典工作的彼得斯堡同齡人競爭,以削減所有必需的綁紮類型。
從一開始,西方的梵語語言學也感到需要對語言進行羅馬拼寫。弗朗茲·鮑普(Franz Bopp)在1816年與瓦納加里(Devanagari)一起使用了羅馬化方案,與iAST不同,與iAST通過繞元音長度表達元音長度(â,â,歧程) ,並通過spiritus asper(例如,iAST BH)的spiritus asper (例如BH)。他分別用Spiritus Asper和Lenis表達了sibinants g和Ś(Sʽ,S s)。 Monier-Williams在他的1899年詞典中分別使用了,ṡ和sh,分別用於iast c,Ś和g。
從19世紀後期開始,西方對排版Devanagari的興趣減少了。 Theodor Aufrecht published his 1877 edition of the Rigveda in romanized Sanskrit, and Arthur Macdonell 's 1910 Vedic grammar (and 1916 Vedic grammar for students ) likewise do without Devanagari (while his introductory Sanskrit grammar for students retains Devanagari alongside romanized Sanskrit).當代梵文文本的西方版本主要出現在iAST中。