空間(標點符號)

空間
U+0020 空間注意:常規空間的表示形式)
也可以看看
U+00A0 沒有破裂的空間 ,&nonbreakingspace;
其他類型的空間

書面形式,一個空間 )是一個空白區域,可將單詞句子音節(在音節中)和其他書面或印刷字形(字符)分開。間隔的慣例在語言之間有所不同,在某些語言中,間距規則很複雜。間詞空間可以緩解讀者識別單詞的任務,並避免諸如“現在”與“無處”之類的徹底歧義。他們還為人類或程序可能啟動新線條的方便指南提供了方便的指南。

排版可以使用不同寬度的空間,就像它可以使用不同寬度的圖形字符一樣。與圖形字符不同,通常會伸展排版空間以使文本對齊。另一方面,打字機通常只有一個字符(包括空格)的一個寬度。在廣泛接受打字機之後,一些打字機約定影響了印刷術和印刷作品的設計。

文本的計算機表示有助於以至少兩種方式解決機械和物理限制,例如角色寬度:

  • 諸如Unicode之類的字符編碼提供了幾個寬度的空間,這些空間是使用不同數字代碼點編碼的。例如,Unicode U+0020是“正常”空間字符,但是U+00A0添加了不應在此處啟動新線路的含義,而U+2003代表一個固定寬度為一個EM的空間。總的來說,這樣的字符稱為Whitespace字符
  • 格式化和繪製語言和軟件通常在間距方面具有更大的靈活性。例如,SVG,PostScript和無數其他語言在屏幕或頁面上以特定(x,y)坐標為繪製字符。通過在特定的啟動坐標上繪製每個單詞,此類程序根本不需要“繪製”空格(這可能會導致在提取正確的文本時遇到困難)。同樣,文字處理器可以“完全證明”文本,拉伸詞間空間以使所有線長度相同(與機械Linotype計算機一樣)。精度受到輸出設備的物理功能的限制。

使用自然語言

在單詞之間

現代英語使用一個空間來分開單詞,但並非所有語言都遵循這種做法。直到大約600-800 AD之前,空間才用於在拉丁語中分開單詞。古代希伯來語阿拉伯語確實使用空間來彌補缺乏元音的清晰度。最早的希臘文字也使用插詞來分割單詞而不是間距,儘管這種做法很快被聖經中的持續動物所取代。

後來,愛爾蘭人和盎格魯 - 撒克遜人的抄寫員使用了單詞間距,從約克(York)的阿爾庫因(Alcuin)創建了卡羅林格(Carolingian)的微小抄寫員,並採用了抄寫員。間距將成為意大利文藝復興時期和法國的標準,然後在16世紀末拜占庭;然後在17世紀進入西里爾語的斯拉夫語言,並且只有在現代進入現代梵語

CJK語言在處理包含中文字符KANA的文本時不使用空格。在日語中,有時可能會使用空間將人們的姓氏給定名稱分開,表示省略的粒子(尤其是主題粒子wa ),以及某些文學或藝術效果。但是,韓文的現代韓語是其寫作系統的重要組成部分(由於西方的影響),鑑於需要單詞分隔器避免歧義的語音性質,而不是與每個人都非常有區別的漢字其他。在朝鮮語中,空間用於分離大量名詞,名詞和粒子,形容詞和動詞。對於某些化合物或短語,可以使用或不使用空間,例如,“大韓民國”的短語通常沒有空間為대한민국而而不是空間為대한민국

符文文本使用插接的類似或類似結腸的標點標記來單獨的單詞。為此,有兩個Unicode字符: u+16eb 符文標點符號u+16ec 符文

在句子之間

自15世紀可移動類型出現以來,具有拉丁字母的語言已經使用了各種句子間距的方法。

  • 一個空間(有時稱為法語間距QV )。在大多數國家使用ISO基本拉丁字母進行出版和最終書面作品以及數字(萬維網)媒體的國家中,這是一個共同的慣例。顯示文本時, Web瀏覽器通常不會區分源代碼中的單個和多個空間,除非文本獲得“白空間” CSS屬性。在沒有設置的情況下,將空間折疊到一個空間的折疊字符串使HTML源代碼可以更加可讀的方式間隔,但以控制渲染頁面的間距為代價。
  • 雙空間(英語間距)。有時據稱該公約源於打字機上的單足字體。但是,指令在句子之間使用更多的間距比單詞的日期比幾個世紀更高,而打字機上的兩個空格是與排行機以前的規則最接近的近似值,該規則旨在提高可讀性。兩者和打字員都繼續使用更廣泛的間距,直到第二次世界大戰為止,然後排版逐漸轉換為已發表印刷品中句子之間的單詞間距,而打字員則繼續使用兩個空間。
  • 一個擴大的空間,通常是三分之一到三分之一的寬度,是單詞空間的兩倍。這種間距有時用於19世紀之前的排版。它也已用於其他非類型排版系統,例如Linotype機TEX系統。現代計算機的數字字體也可以在終端標點符號之後調整間距,從而創造出比標准單詞空間寬的空間

關於排版材料中適當的句子間隔量存在一些爭議印刷樣式的元素指出,句子間距只需要一個單詞空間。心理學研究表明,“讀者在經歷後有兩個空間中受益。”

單位符號和數字

國際單位系統(SI)規定了在數字和一個單位之間插入空間(被視為隱含乘法符號的空間)之間的空間,但從未在前綴和基本單位之間進行空間;還應在復合單元的單元之間使用空間(或乘法點)。

5.0厘米,而不是5.0厘米或5.0厘米或5.0厘米
45公斤,而不是45公斤或45公斤或45公斤
32°C,而不是32°C或32°C
20 kN m或20 kn·m,而不是20 knm或20 k nm
π/2 rad,而不是π/2rad或π/2 rad
50%,而不是50%或50%(注意:%不是SI單元,許多樣式指南不遵循此建議;請注意,50%被用作形容詞,例如以50%的乙酸表示濃度。)

該規則的唯一例外是角度的傳統符號符號:(例如30°), ARC的分鐘(例如22')和ARC的第二個(例如8英寸)。

SI還規定了需要在需要的地方使用空間(通常在印刷上是薄的空間)作為一千個分離器。點和逗號都保留為十進制標記

1 000 000 000 000(薄空間)或1000000不是1,000,000或1.000.000
1 000 000 000 000(常規空間明顯更寬)

有時,建議分別使用狹窄的非破壞空間或非破壞空間(例如,例如IEEE標準IEC標準),以避免由於自動線路包裝和化合物單元的分離,以避免分離化合物單位的分離單詞包裹

編碼

Unicode定義了單個空格字符的許多變體,具有各種屬性;以下是常規空間的編碼。


角色信息
預覽
Unicode名稱空間
編碼十進制十六進位
Unicode32U+0020
UTF-83220
數字字符參考  

注意:常規空間的上述表示形式被供可見性的非破裂空間所取代。

URL中,空格用其ASCII / UTF-8表示為百分比%20.

空間的類型

也可以看看