詞彙

詞彙(也稱為詞典)是一組單詞,通常是一種語言或個人已知的集合。詞彙一詞起源於拉丁文詞彙,意為“單詞,名稱”。它構成了語言和交流的重要組成部分,有助於傳達思想,思想,情感和信息。詞彙可以是口頭書面簽名的,並且可以分為兩種主要類型:主動詞彙(一個定期使用單詞)和被動詞彙(單詞一個識別但不經常使用)。一個人的詞彙量不斷地通過各種方法演變,包括直接教學獨立閱讀和自然語言暴露,但由於忘記創傷疾病,它也會收縮。此外,詞彙是各個學科的重要研究重點,例如語言學教育心理學人工智能。詞彙不僅限於單詞。它還包含稱為搭配成語和其他類型的措辭學的多字單元。獲得足夠的詞彙是學習第二語言的最大挑戰之一。

定義和用法

一般定義

一個人的詞彙通常是指個人在特定語言中知道和使用的單詞集。這是語言獲取和掃盲發展的基本方面。

語言學

在語言學中,詞彙指的是一種語言或人的詞彙曲目中的所有單詞。它既包括說話者的被動詞彙,其中包括他們認識或理解的單詞以及它們的主動詞彙,其中包括他們在語音和寫作中定期使用的單詞。

教育

在教育的背景下,詞彙是指學生學習和用途的單詞的含義和用法。詞彙獲取是語言教育的一個核心方面,因為它直接影響閱讀理解,表現力和接受語言技能以及學術成就。

心理學

在心理學,尤其是認知心理學中,詞彙被理解為對語言處理和認知發展的量度。它可以用作智力能力或認知狀況的指標,詞彙測試通常構成智力神經心理學評估的一部分。

計算語言學和人工智能

計算語言學和人工智能中,詞彙是一組預定的詞,用於自然語言處理任務,例如語音識別文本分析。在機器學習模型中,詞彙是訓練數據集中的一組獨特單詞,它構成了特徵提取模型訓練的基礎。

符號學

符號學中,詞彙是指符號系統或文本中的完整符號和標誌集,將定義擴展到純粹的口頭交流之外,以涵蓋其他形式的符號通信。

“單詞”的定義

單詞具有多種含義,我們對詞彙大小等思想的理解取決於所使用的定義。

最常見的定義將單詞等同於引理(彎曲或詞典形式;這包括步行,但不走路,步行或步行)。在大多數情況下,引理不包括適當的名詞(人,地點,公司等)。在詞彙大小的研究中經常使用的另一個定義是單詞家族的定義。這些都是可以從地面詞中得出的單詞(例如,毫不費力,毫不費力,努力,努力的單詞都是家庭努力一詞的一部分)。詞彙大小的估計值從高達20萬到1萬低至1萬不等。

類型的區別

類型的區別是語言學中的一個概念,與文本中單詞的計數或測量有關。它對於研究語言和話語,評估詞彙的複雜性和豐富性或某些計算應用非常有用。

文本中的令牌計數是單詞總數,而無需考慮其獨特性。每個單個單詞的出現都是單獨計數的,因此,如果一個單詞重複,則計數每個實例。例如,在您打電話給兒子時,我在句子中聽到您的聲音,有八個令牌。這是因為有八個單獨的單詞(聽到您的兒子)。

類型計數僅包含獨特的單詞,通常這是獨特的引理。如果引理在文本中多次出現,則僅在類型計數中計數一次。因此,在您打電話給兒子時,我聽到您的聲音,有六種類型。這是因為該句子中有六個獨特的引理(聽到何時兒子)。儘管句子中出現了三遍,但您還是只計算一次的引理。

一個人的詞彙

富有成效的知識

評估單詞知識時必須做出的第一個主要變化區別是知識是有效的(也稱為成就還是活躍)還是接受性(也稱為接收或被動);即使在那些相反的類別中,通常也沒有明確的區別。聽到或閱讀或看到時通常可以理解的單詞構成一個人的接受詞彙。這些詞可能從眾所周知到鮮明的範圍(請參見下面的知識程度)。一個人的接受詞彙通常是兩者中的較大的詞彙。例如,儘管一個小孩可能還不能說,寫或簽名,但他們可能能夠遵循簡單的命令,並且似乎了解了他們所暴露的語言的很大一部分。在這種情況下,孩子的接受詞彙可能是數十個,即使不是數百個單詞,但是他們的主動詞彙量為零。但是,當孩子學會說話或簽名時,孩子的主動詞彙開始增加。生產性詞彙也可能比接受性詞彙大,例如,在第二語言學習者中,他通過學習而不是接觸詞,可以產生它們,但很難在談話中認識到它們。

因此,生產性詞彙通常是指可以在適當上下文中產生的單詞,並符合說話者或簽名者的預期含義。但是,與接受詞彙一樣,在許多程度上,特定詞可能被認為是活躍詞彙的一部分。知道如何發音,簽名或寫一個單詞並不一定意味著已正確或準確使用的單詞反映了預期的消息;但這確實反映了最少的生產知識。

知識程度

在接受性生產的區別中,有一系列能力,通常稱為知識程度。這只是表明,隨著學會的更多方面,一個單詞在一段時間內逐漸進入一個人的詞彙。粗略地,這些階段可以描述為:

  1. 從來沒有遇到過這個詞。
  2. 聽到這個詞,但無法定義它。
  3. 由於語境或語氣而識別單詞。
  4. 能夠使用該單詞並理解一般和/或預期的含義,但無法清楚地解釋它。
  5. 流利的單詞 - 其使用和定義。

知識的深度

單詞知識的不同程度意味著知識的深度,但是該過程比這更複雜。知道一個詞的方面有很多方面,其中一些單詞不是層次結構,因此他們的獲取不一定遵循知識程度所建議的線性進步。已經提出了一些單詞知識框架,以更好地實現這一概念。一個這樣的框架包括九個方面:

  1. 拼字法- 書面形式
  2. 語音- 口語形式
  3. 參考- 含義
  4. 語義- 概念和參考
  5. 註冊- 使用或註冊
  6. 搭配- 詞彙鄰居
  7. 單詞關聯
  8. 語法- 語法功能
  9. 形態- 單詞部分

詞彙類型

按照最有限的最有限的順序列出:

閱讀詞彙

一個人的閱讀詞彙是閱讀時所識別的所有單詞。這類詞彙通常是最豐富的,因為在閱讀時,新單詞比聽時更常見。

聆聽詞彙

一個人的聆聽詞彙包含在聽言語時所識別的單詞。說話者的語氣和手勢,討論的話題以及對話的社會背景等提示可能傳達了一個不熟悉的詞的含義。

說詞彙

一個人的詞彙詞包含語音中使用的單詞,通常是聆聽詞彙的子集。由於言語的自發性質,言語通常會稍微無意間被濫用,但是面部表情和語氣可以彌補這種濫用。

寫詞彙

書面單詞出現在寄存器中,與正式論文和社交媒體提要不同。儘管許多書面單詞很少出現在語音中,但一個人的書面詞彙通常受到偏好和背景的限制:作者可能更喜歡一個代名詞,而不是另一個代名詞,他們不太可能使用與他們沒有興趣或沒有興趣或沒有興趣或沒有興趣或沒有興趣或沒有的主題的技術詞彙知識。

最終詞彙

美國哲學家理查德·羅蒂(Richard Rorty)描述了一個人的“最終詞彙”,如下所示:

所有人類都攜帶了一套單詞,以證明自己的行為,信仰和生活是合理的。這些是我們對朋友的讚美和對敵人的蔑視,我們的長期項目,我們最深切的自我懷疑和我們最高希望的話……我將這些話稱為一個人的“最終詞彙”。這些話是他能接受語言的範圍。除了他們之外,只有無助的被動或武力的訴訟。 (偶然性,諷刺和團結第73頁)

詞彙生長

在起步期間,一個孩子本能地建立了詞彙量。嬰兒模仿他們聽到的單詞,然後將這些單詞與對象和動作相關聯。這是聆聽詞彙講話的詞彙遵循,隨著孩子的思想變得更依賴他們在不依靠手勢或bab腳的情況下自我表達的能力。一旦閱讀寫作詞彙開始發展,通過問題和教育,孩子就開始發現語言的異常和不規則。

一年級時,一個可以閱讀的孩子學到了大約兩倍的單詞,一個單詞是不能的單詞。通常,此差距以後不會縮小。到五歲或六歲時,這會導致廣泛的詞彙,當時講英語的孩子將學到大約1500個單詞。

詞彙一生都在成長。在20至60歲之間,人們會學到更多的誘餌,或者每隔一天學習。一個平均20歲的年輕人知道來自11,100個單詞家庭的42,000張引理。人們通過EG閱讀,玩文字遊戲和參與詞彙相關的程序來擴展詞彙。接觸傳統印刷媒體教授正確的拼寫和詞彙,而接觸文本消息傳遞會導致更輕鬆的單詞可接受性約束。

重要性

  • 廣泛的詞彙表達和交流。
  • 詞彙大小與閱讀理解直接相關。
  • 語言詞彙是思考詞彙的代名詞。
  • 一個人可以根據他人的詞彙來判斷一個人。
  • 威爾金斯(Wilkins,1972)說:“沒有語法,幾乎無法傳達;如果沒有詞彙,就無法傳達任何東西。”

詞彙大小

本地語言詞彙

估計平均詞彙大小會帶來各種困難和局限性,這是由於所使用的不同定義和方法,例如單詞是什麼,知道一個單詞,使用了哪些示例詞典,如何進行測試等等。母語人士的詞彙量在一種語言中也有很大差異,並且取決於說話者的教育水平。

結果,估計從10,000-17,000個單詞家庭或年輕的成年人英語母語者的17,000-42,000個字典詞不等。

2016年的一項研究表明,20歲的英語母語人士平均認可42,000張引理,從最低5%的27,100次到51,700狐猴,最高5%。這些引理來自最低5%的6,100個單詞家庭和最高5%的14,900個單詞家庭。 60歲的年輕人平均更了解6,000張引理。

根據另一位研究,1995年前的研究大三學生將能夠認識到約10,000–12,000個單詞的含義,而對於大學生來說,這個數字長達約12,000-17,000,而老年人則達到約17,000或更多。

對於以德語為母語的人來說,平均絕對詞彙量從一年級的5,900張引理到成年人的73,000。

外語詞彙

詞彙大小對語言理解的影響

3000個最常見的英語單詞家庭或5000個最常見單詞的知識提供了95%的口語詞彙覆蓋範圍。為了最少的閱讀理解,建議了3,000個單詞家庭(5,000個詞彙項目)的閾值,為了閱讀以獲取5,000個單詞家庭(8,000個詞彙項目)。 8,000個單詞家庭的“最佳”閾值產生的覆蓋率為98%(包括專有名詞)。

第二語言詞彙獲取

學習詞彙是學習第二語言的第一步之一,但是學習者從未完成詞彙獲取。無論是母語還是第二語言,獲取新詞彙是一個持續的過程。有許多技術可以幫助您獲得新的詞彙。

記憶

儘管可以將記憶視為乏味或無聊,但用本地語言將一個單詞與第二語言相應的單詞相關聯,直到記憶被認為是詞彙獲取的最佳方法之一。到學生成年時,他們通常已經收集了許多個性化的記憶方法。儘管許多人認為記憶通常不需要增加保留率的複雜認知處理(Sagarra and Alba,2006),但它通常確實需要大量重複,並且使用抽認卡的間隔重複是一種既定的記憶方法,尤其是用於詞彙的方法在計算機輔助語言學習中獲取。其他方法通常需要更多的時間和更長的時間才能回憶。

某些單詞不能通過關聯或其他方法輕鬆鏈接。當第二語言的單詞在語音學上或視覺上與本地語言中的單詞相似時,人們經常假設它們也具有相似的含義。儘管經常是這種情況,但並非總是如此。當面對一個虛假的朋友時,記憶和重複是精通的關鍵。如果第二語言學習者僅依靠單詞關聯來學習新詞彙,那麼該人將很難掌握虛假朋友。當必須在有限的時間內獲取大量詞彙時,當學習者需要快速回憶信息時,當單詞代表抽象概念或在心理圖像中很難描繪出來,或者當歧視虛假朋友時,死記硬背是記憶是使用的方法。最近引入了一種跨拼字法的新單詞學習的神經網絡模型,該模型的L1特定記憶能力是L2-Learners的L1特定記憶能力(Hadzibeganovic and Cannas,2009年)。

關鍵字方法

一種學習詞彙的一種方法是使用助記符設備或在單詞之間建立關聯,這被稱為“關鍵字方法”(Sagarra和Alba,2006年)。實施也需要很長時間 - 需要很長時間才能回憶 - 但是因為它使一些新的奇怪想法連接起來可能有助於學習。而且,它大概與Paivio的雙重編碼系統沒有衝突,因為它使用了視覺和口頭的心理能力。但是,這仍然是代表具體事物的單詞,因為抽象概念更難記住。

單詞列表

已經開發了幾個單詞列表,以為人們提供有限的詞彙量,以快速語言水平或有效的溝通。其中包括基本英語(850個單詞),特殊英語(1,500個單詞),一般服務列表(2,000個單詞)和學術單詞列表。一些學習者的詞典開發了定義的詞彙,這些詞彙僅包含大多數常見和基本單詞。結果,即使詞彙有限的學習者也可以理解此類詞典中的單詞定義。一些發布者根據單詞頻率或主題組製作詞典。

Swadesh名單是在語言學上進行調查的。

局部詞彙

焦點詞彙是一組專業的術語和區別,對某個群體特別重要:具有特定經驗或活動重點的詞彙。詞典或詞彙是一種語言的詞典:它的事物,事件和想法的名稱集。一些語言學家認為,詞典會影響人們對事物的看法,即sapir – whorf假設。例如,蘇丹的努爾有一個精心製作的詞彙來描述牛。由於牛的特殊歷史,經濟和環境,努爾有數十個牛的名字。這種比較引起了一些語言爭議,就像“雪地雪”的數量。具有相關專業知識的英語說話者還可以在需要時顯示出詳盡而精確的詞彙。

也可以看看