語義學者

語義學者
Semantic Scholar logo.svg
站點類型
搜索引擎
由...製作艾倫人工智能研究所
URL語義cholar.org
發射2015年11月

語義學者是一個人工智能 - 科學文獻的能力研究工具艾倫AI研究所並於2015年11月公開發布。[1]它使用進步自然語言處理提供學術論文的摘要。[2]語義學者團隊正在積極研究人工智能的使用自然語言處理機器學習人機交互, 和信息檢索.[3]

語義學者始於圍繞主題的數據庫計算機科學地球科學, 和神經科學.[4]但是,在2017年,該系統開始包括生物醫學文學在其語料庫中。[4]截至2022年9月,它們現在包括來自所有科學領域的2億多名出版物。[5]

技術

語義學者提供了一句話的摘要科學文學。它的目的之一是應對閱讀移動設備上眾多標題和冗長摘要的挑戰。[6]它還試圖確保每年發表的三百萬個科學論文讀者,因為據估計,只有一半的文獻已被閱讀。[7]

人工智能用於捕獲論文的本質,並通過“抽象”技術生成它。[2]該項目結合了機器學習自然語言處理, 和機器視覺添加一層語義分析傳統方法引文分析,並提取相關數字,,論文的實體和場地。[8][9]

與...相比谷歌學術PubMed,語義學者旨在突出論文中最重要和最有影響力的元素。[10]AI技術旨在確定研究主題之間的隱藏聯繫和鏈接。[11]像以前引用的搜索引擎一樣,語義學者還利用圖形結構,其中包括微軟學術知識圖,施普林格大自然Scigraph和語義學者語料庫。[12]

語義學者託管的每篇論文都被分配了一個獨特的標識符稱為語義學者語料庫ID(縮寫為S2CID)。以下條目是一個示例:

劉,Ying;蓋爾(Albert A);Wilder-Smith,Annelies;羅克洛夫(Joacim)(2020年3月)。“與SARS冠狀病毒相比,COVID-19的生殖數量更高”。旅行醫學雜誌.27(2)。doi10.1093/jtm/taaa021.PMID 32052846.S2CID 211099356.

語義學者可以免費使用,並且與類似的搜索引擎不同(即谷歌學術)不尋找背後的材料付費牆.[13][4]

一項研究通過系統的方法比較了語義學者的搜索能力,並發現搜索引擎在嘗試發現數據時的準確性為98.88%。[13]同一項研究檢查了其他語義學者功能,包括調查工具元數據以及幾種引用工具。[13]

用戶和出版物的數量

截至2018年1月,在2017年的一個項目增加了生物醫學論文和主題摘要之後,語義學者語料庫包括超過4000萬篇論文計算機科學生物醫學.[14]2018年3月,發展機器學習倡議亞馬遜Alexa平台被雇用來領導語義學者項目。[15]截至2019年8月,包括的論文元數據數量(不是實際的PDF)已增長到超過1.73億[16]添加後Microsoft學術圖記錄。[17]2020年,語義學者與芝加哥大學出版社期刊在芝加哥大學出版社(University of Chicago Press)下發表的所有文章都在語義學者的語料庫中獲得。[18]在2020年底,語義學者索引了1.9億篇論文。[19]

2020年,語義學者的用戶每月達到700萬。[6]

也可以看看

參考

  1. ^Eunjung Cha,Ariana(2015年11月3日)。“保羅·艾倫(Paul Allen)的AI研究小組揭幕了旨在動搖我們如何搜索科學知識的計劃。嘗試一下”.華盛頓郵報.存檔從2019年11月6日的原始。檢索11月3日,2015.
  2. ^一個bHao,Karen(2020年11月18日)。“ AI可以幫助您總結AI中的最新信息”.麻省理工學院技術評論。檢索2021-02-16.
  3. ^“語義學者研究”.Research.semanticscholar.org。檢索2021-11-22.
  4. ^一個bc蘇珊娜(Suzanne)弗里克(Fricke)(2018-01-12)。“語義學者”.醫學圖書館協會雜誌.106(1):145–147。doi10.5195/jmla.2018.280.ISSN 1558-9439.S2CID 45802944.
  5. ^Matthews,David(2021年9月1日)。“淹沒在文獻中?這些智能軟件工具可以幫助”.自然。檢索9月5日2022....語義學者彙編的公開語料庫(由華盛頓西雅圖的艾倫人工智能研究所於2015年成立的工具,總計約2億篇文章,包括預印本。
  6. ^一個b畢業生,彼得(2020年11月24日)。“ AI工具總結了句子中的冗長論文”.技術Xplore。檢索2021-02-16.
  7. ^“艾倫學院的語義學者現在正在搜索1.75億個學術論文”.VentureBeat。 2019-10-23。檢索2021-02-16.
  8. ^Bohannon,John(2016年11月11日)。“計算機程序剛剛排名現代最具影響力的大腦科學家”.科學.doi10.1126/science.aal0371.存檔從2020年4月29日的原始。檢索11月12日2016.
  9. ^克里斯托弗·克拉克(Christopher Clark);Santosh Divvala(2016)。pdffigures 2.0:研究論文的採礦數字.第16屆ACM/IEEE-CS數字圖書館聯合會議論文集.ISBN 978-1-4503-4229-2.WikidataQ108172042。
  10. ^“語義學者”.國際語言與文學研究雜誌。檢索2021-11-09.
  11. ^Svetla Baykoucheva(2021)。在數字時代驅動科學信息發現。 Chandos出版。 p。 91。ISBN 978-0-12-823724-3.
  12. ^Jose,Joemon M。;Yilmaz,Emine;Magalhães,João;卡斯特爾,巴勃羅;費羅,尼古拉;Silva,MárioJ。;馬丁斯,弗拉維奧(2020)。信息檢索的進展:第42屆歐洲IR研究會議,ECIR 2020,里斯本,葡萄牙,4月14日至17日,2020年,第I部分。瑞士查特:施普林格。p。254。ISBN 978-3-030-45438-8.
  13. ^一個bc漢諾斯(Abdelhakim)(2021)。“搜索有關軟件工程二級研究的相關論文:語義學者的覆蓋範圍和識別角色”.IET軟件.15(1):126–146。doi10.1049/sfw2.12011.ISSN 1751-8814.S2CID 234053002.
  14. ^“ AI2擴展語義學者搜索引擎以涵蓋生物醫學研究”.Geekwire。 2017-10-17。存檔從2018-01-19的原始。檢索2018-01-18.
  15. ^“科技舉動:艾倫學院聘請亞歷克斯機器學習領導者;微軟主席擔任新的投資者角色;還有更多”。 Geekwire。 2018-05-02。存檔來自2018-05-10的原始。檢索2018-05-09.
  16. ^“語義學者”.語義學者.存檔來自2019年8月11日的原始。檢索8月11日2019.
  17. ^“ AI2與Microsoft Research聯手升級搜索工具進行科學研究”.Geekwire。 2018-12-05。存檔從2019-08-25的原始。檢索2019-08-25.
  18. ^“芝加哥大學出版社加入了500多家與語義學者合作的出版商,以改善搜索和可發現性”.RCNI公司有限公司。檢索2021-11-22.
  19. ^鄧恩,阿德里亞娜(2020年12月14日)。“語義學者在2020年通過新出版商合作夥伴關係增加了2500萬篇科學論文”(PDF).語義學者。檢索11月22日,2021.

外部鏈接