空間(標點符號)
空間 | |
---|---|
U+0020 空間(注意:常規空間的表示形式) | |
也可以看看 | |
U+00A0 沒有破裂的空間(  ,&nonbreakingspace; ) 其他類型的空間 |
以書面形式,一個空間( )是一個空白區域,可將單詞,句子,音節(在音節中)和其他書面或印刷字形(字符)分開。間隔的慣例在語言之間有所不同,在某些語言中,間距規則很複雜。間詞空間可以緩解讀者識別單詞的任務,並避免諸如“現在”與“無處”之類的徹底歧義。他們還為人類或程序可能啟動新線條的方便指南提供了方便的指南。
排版可以使用不同寬度的空間,就像它可以使用不同寬度的圖形字符一樣。與圖形字符不同,通常會伸展排版空間以使文本對齊。另一方面,打字機通常只有一個字符(包括空格)的一個寬度。在廣泛接受打字機之後,一些打字機約定影響了印刷術和印刷作品的設計。
文本的計算機表示有助於以至少兩種方式解決機械和物理限制,例如角色寬度:
- 諸如Unicode之類的字符編碼提供了幾個寬度的空間,這些空間是使用不同數字代碼點編碼的。例如,Unicode U+0020是“正常”空間字符,但是U+00A0添加了不應在此處啟動新線路的含義,而U+2003代表一個固定寬度為一個EM的空間。總的來說,這樣的字符稱為Whitespace字符。
- 格式化和繪製語言和軟件通常在間距方面具有更大的靈活性。例如,SVG,PostScript和無數其他語言在屏幕或頁面上以特定(x,y)坐標為繪製字符。通過在特定的啟動坐標上繪製每個單詞,此類程序根本不需要“繪製”空格(這可能會導致在提取正確的文本時遇到困難)。同樣,文字處理器可以“完全證明”文本,拉伸詞間空間以使所有線長度相同(與機械Linotype計算機一樣)。精度受到輸出設備的物理功能的限制。
使用自然語言
在單詞之間
現代英語使用一個空間來分開單詞,但並非所有語言都遵循這種做法。直到大約600-800 AD之前,空間才用於在拉丁語中分開單詞。古代希伯來語和阿拉伯語確實使用空間來彌補缺乏元音的清晰度。最早的希臘文字也使用插詞來分割單詞而不是間距,儘管這種做法很快被聖經中的持續動物所取代。
後來,愛爾蘭人和盎格魯 - 撒克遜人的抄寫員使用了單詞間距,從約克(York)的阿爾庫因(Alcuin)創建了卡羅林格(Carolingian)的微小抄寫員,並採用了抄寫員。間距將成為意大利文藝復興時期和法國的標準,然後在16世紀末拜占庭;然後在17世紀進入西里爾語的斯拉夫語言,並且只有在現代進入現代梵語。
CJK語言在處理包含中文字符和KANA的文本時不使用空格。在日語中,有時可能會使用空間將人們的姓氏與給定名稱分開,表示省略的粒子(尤其是主題粒子wa ),以及某些文學或藝術效果。但是,韓文的現代韓語是其寫作系統的重要組成部分(由於西方的影響),鑑於需要單詞分隔器避免歧義的語音性質,而不是與每個人都非常有區別的漢字其他。在朝鮮語中,空間用於分離大量名詞,名詞和粒子,形容詞和動詞。對於某些化合物或短語,可以使用或不使用空間,例如,“大韓民國”的短語通常沒有空間為대한민국而而不是空間為대한민국 。
符文文本使用插接的類似或類似結腸的標點標記來單獨的單詞。為此,有兩個Unicode字符: u+16eb ᛫符文標點符號和u+16ec ᛬符文。
在句子之間
自15世紀可移動類型出現以來,具有拉丁字母的語言已經使用了各種句子間距的方法。
- 一個空間(有時稱為法語間距, QV )。在大多數國家使用ISO基本拉丁字母進行出版和最終書面作品以及數字(萬維網)媒體的國家中,這是一個共同的慣例。顯示文本時, Web瀏覽器通常不會區分源代碼中的單個和多個空間,除非文本獲得“白空間” CSS屬性。在沒有設置的情況下,將空間折疊到一個空間的折疊字符串使HTML源代碼可以更加可讀的方式間隔,但以控制渲染頁面的間距為代價。
- 雙空間(英語間距)。有時據稱該公約源於打字機上的單足字體。但是,指令在句子之間使用更多的間距比單詞的日期比幾個世紀更高,而打字機上的兩個空格是與排行機以前的規則最接近的近似值,該規則旨在提高可讀性。兩者和打字員都繼續使用更廣泛的間距,直到第二次世界大戰為止,然後排版逐漸轉換為已發表印刷品中句子之間的單詞間距,而打字員則繼續使用兩個空間。
- 一個擴大的空間,通常是三分之一到三分之一的寬度,是單詞空間的兩倍。這種間距有時用於19世紀之前的排版。它也已用於其他非類型排版系統,例如Linotype機和TEX系統。現代計算機的數字字體也可以在終端標點符號之後調整間距,從而創造出比標准單詞空間寬的空間。
關於排版材料中適當的句子間隔量存在一些爭議。印刷樣式的元素指出,句子間距只需要一個單詞空間。心理學研究表明,“讀者在經歷後有兩個空間中受益。”
單位符號和數字
國際單位系統(SI)規定了在數字和一個單位之間插入空間(被視為隱含乘法符號的空間)之間的空間,但從未在前綴和基本單位之間進行空間;還應在復合單元的單元之間使用空間(或乘法點)。
- 5.0厘米,而不是5.0厘米或5.0厘米或5.0厘米
- 45公斤,而不是45公斤或45公斤或45公斤
- 32°C,而不是32°C或32°C
- 20 kN m或20 kn·m,而不是20 knm或20 k nm
- π/2 rad,而不是π/2rad或π/2 rad
- 50%,而不是50%或50%(注意:%不是SI單元,許多樣式指南不遵循此建議;請注意,50%被用作形容詞,例如以50%的乙酸表示濃度。)
該規則的唯一例外是角度的傳統符號符號:度(例如30°), ARC的分鐘(例如22')和ARC的第二個(例如8英寸)。
SI還規定了需要在需要的地方使用空間(通常在印刷上是薄的空間)作為一千個分離器。點和逗號都保留為十進制標記。
- 1 000 000 000 000(薄空間)或1000000不是1,000,000或1.000.000
- 1 000 000 000 000(常規空間明顯更寬)
有時,建議分別使用狹窄的非破壞空間或非破壞空間(例如,例如IEEE標準和IEC標準),以避免由於自動線路包裝和化合物單元的分離,以避免分離化合物單位的分離單詞包裹。
編碼
Unicode定義了單個空格字符的許多變體,具有各種屬性;以下是常規空間的編碼。
預覽 | ||
---|---|---|
Unicode名稱 | 空間 | |
編碼 | 十進制 | 十六進位 |
Unicode | 32 | U+0020 |
UTF-8 | 32 | 20 |
數字字符參考 |   |   |
注意:常規空間的上述表示形式被供可見性的非破裂空間所取代。
在URL中,空格用其ASCII / UTF-8表示為百分比%20
.