?

国产精品高潮呻吟久久AV无码,在线观看亚洲糸列,888奇米亚洲影视四色,中文字幕动漫精品第1页,国产大屁股视频免费区,半夜他强行挺进了我的体内,免费看国产曰批40分钟,国产女人片最新视频,要做AV在线播放,欧美韩日精品一区二区三区

大數(shù)據(jù)時代,語言學(xué)正經(jīng)歷一場“革命”

【數(shù)據(jù)猿導(dǎo)讀】 用數(shù)據(jù)密集型的范式來研究語言,不但有益于從各種相關(guān)中追尋因果,加深對語言與認知關(guān)系的認識,進而有助于更好地理解語言的結(jié)構(gòu)模式與演化規(guī)律,也有助于推進語言學(xué)研究的科學(xué)化與國際化

大數(shù)據(jù)時代,語言學(xué)正經(jīng)歷一場“革命”

語言學(xué)正在從傳統(tǒng)的藝術(shù)與人文學(xué)科轉(zhuǎn)向現(xiàn)代的認知與生命科學(xué),其研究方法也正在經(jīng)歷從內(nèi)省法到實驗方法的轉(zhuǎn)變。與此同時,正如舍恩伯格在《大數(shù)據(jù)時代》一書的開篇所說的那樣,“大數(shù)據(jù)正在改變我們的生活以及理解世界的方式”。在這個不斷變化、充滿數(shù)據(jù)的世界,語言學(xué)家該做什么?怎么做呢?

大數(shù)據(jù)的價值

大數(shù)據(jù)時代

語言學(xué)是研究語言的本質(zhì)、結(jié)構(gòu)和發(fā)展規(guī)律的學(xué)科?,F(xiàn)代語言學(xué)一般認為語言是一個復(fù)雜適應(yīng)系統(tǒng)。這也意味著,我們需要采用研究復(fù)雜適應(yīng)系統(tǒng)的一般方法來研究語言。這對于全面了解人類語言是極為必要的。

從系統(tǒng)的角度研究語言,目前可從以下兩方面展開:一是研究語言系統(tǒng)內(nèi)部各個組成要素之間的關(guān)系以及子系統(tǒng)之間的協(xié)同關(guān)系,二是研究語言系統(tǒng)的整體或涌現(xiàn)特征。

前者是現(xiàn)代計量語言學(xué),特別是協(xié)同語言學(xué)的主要目標,而采用語言復(fù)雜網(wǎng)絡(luò)方法則有助于發(fā)現(xiàn)語言的整體或涌現(xiàn)特征。無論是計量語言學(xué)還是復(fù)雜網(wǎng)絡(luò)方法,對研究對象特征進行量化分析都是必不可少的,都屬于數(shù)據(jù)密集型的語言研究。而大數(shù)據(jù)能夠改變?nèi)祟惿畹淖钪匾蚴瞧錇槿祟惖纳?ldquo;創(chuàng)造了前所未有的可量化的維度”。

從這個意義上說,以量化為主要手段的數(shù)據(jù)密集型語言研究是符合大數(shù)據(jù)時代的語言研究精神的。這是因為“大數(shù)據(jù)”最大的價值并不在于數(shù)據(jù)本身,而在于如何將數(shù)據(jù)與知識、社會、文化、行為、人聯(lián)系在一起,并通過數(shù)理統(tǒng)計方法,更科學(xué)地發(fā)現(xiàn)數(shù)據(jù)背后隱藏的有關(guān)人類認知、行為的模式以及人與社會、自然交互的規(guī)律。換言之,對于任何傳統(tǒng)方法中缺少量化手段的學(xué)科而言,首先可能要解決的是用數(shù)據(jù)來做什么的問題。如果我們找不到需要用數(shù)據(jù)解決的問題,也就只剩下大數(shù)據(jù)時代的美好愿望了。好在語言學(xué)中不難發(fā)現(xiàn)這樣的問題,這可能也從另一方面展現(xiàn)了人類語言所具有的系統(tǒng)特征。

助力語言規(guī)律研究

人類語言系統(tǒng)

我們團隊也采用數(shù)據(jù)密集型的研究范式,對人類語言系統(tǒng)的詞匯子系統(tǒng)主要特征之間的協(xié)同關(guān)系進行了研究。詞是構(gòu)成語言系統(tǒng)的基本單位之一。除了以上提及的不規(guī)則動詞的規(guī)則化之外,詞還有許多其他的屬性,如長度、使用頻度、多義的程度、與其他詞結(jié)合的能力等。根據(jù)對人類語言的考察可以得知,一個長詞如果其使用頻率突然增加,則會很快變短。在現(xiàn)代漢語中,所謂“短”的限值一般大約為3個漢字。這一點,我們很容易從 “美國職業(yè)籃球賽”變?yōu)?ldquo;美職籃”,“特立尼達和多巴哥”瞬間變?yōu)?ldquo;特多”等例子看出。詞的可計量的屬性以及它們之間的關(guān)系構(gòu)成了詞匯協(xié)同子系統(tǒng)。這些從大規(guī)模人類語言材料中得出的統(tǒng)計規(guī)律,不僅可以解釋人類語言詞匯子系統(tǒng)的運作機理,也可以對詞匯的演化做出科學(xué)的預(yù)測。而能否對所研究現(xiàn)象進行解釋與預(yù)測,是衡量一個研究領(lǐng)域是否科學(xué)的重要指標。

對語言的分類以及語言類型的研究,也是語言學(xué)家一直以來努力的方向。為了提高語言類型研究的科學(xué)化程度,我們在世界上首次提出了從人類語言真實語料(大數(shù)據(jù))中提取語言類型指標的方法,用句子中兩個具有語法關(guān)系的詞之間的相對位置(依存方向)解決了語序相對固定語言的分類問題,用復(fù)雜網(wǎng)絡(luò)方法解決了語序相對自由語言的分類問題,推動了語言分類(類型)研究的科學(xué)化。這說明,在研究某種語言的過程中所發(fā)現(xiàn)的方法與理論也可以用來研究其他人類語言,充分顯示了“大數(shù)據(jù)+專業(yè)”的方法的科學(xué)性與普適性。

語言學(xué)國際化

國際化語言

語言被視為洞察人類天性之窗。這是因為語言是人類認知機制的產(chǎn)物,語言的普遍規(guī)律在很大程度上體現(xiàn)了人類的認知規(guī)律,而語言多樣性則可能反映的是人類社會以及人類所生存的自然環(huán)境的多樣性。因此,探求語言的普遍性可能有助于發(fā)現(xiàn)人類認知的普遍性,而對語言多樣性的研究有助于理解語言與社會以及自然的關(guān)系。這也是語言學(xué)能成為認知科學(xué)的核心元素的重要原因之一。然而,長久以來,基于內(nèi)省的語言學(xué)研究雖然有過一些發(fā)現(xiàn)與成果,但由于方法與資源的限制,許多語言規(guī)律仍需要基于實證的科學(xué)驗證。大數(shù)據(jù)在發(fā)現(xiàn)語言結(jié)構(gòu)模式以及其與認知規(guī)律的關(guān)系方面,也可起到重要的作用。

2007年,我們采用20種語言的句法標注(真實)語料庫,對于人類語言受認知(工作記憶)約束而產(chǎn)生的詞在句中的線性排列規(guī)律進行了研究,結(jié)果發(fā)現(xiàn),依存距離(兩個有句法關(guān)系的詞之間的線性距離)最小化可能是人類語言的一種普遍特征。2015年麻省理工學(xué)院(MIT)的研究團隊,采用37種語言進行了類似研究,這項發(fā)表于《美國科學(xué)院院報》(PNAS)的研究,進一步支持了我們的發(fā)現(xiàn)。這些成果不但為探索語言與認知、語言與思維的關(guān)系提供了更加堅實的實證基礎(chǔ),也對從語言行為中發(fā)現(xiàn)人類的認知規(guī)律以及從人類認知的角度解釋語言行為具有啟示意義。此外,通過語言網(wǎng)絡(luò),我們可以更好地對語言系統(tǒng)的整體與涌現(xiàn)特征進行觀察與研究,彌補一般系統(tǒng)方法的不足。比如,我們構(gòu)建了12種斯拉夫語族語言和2種非斯拉夫語言的平行詞同現(xiàn)網(wǎng)絡(luò),經(jīng)對比研究表明,復(fù)雜網(wǎng)絡(luò)方法不僅能區(qū)別斯拉夫語言和非斯拉夫語言,而且能將斯拉夫語言正確地劃入各自的語支。這一數(shù)據(jù)密集型研究,展現(xiàn)了可揭示語言整體特征的復(fù)雜網(wǎng)絡(luò)方法在語言分類中的優(yōu)勢,從而拓展了復(fù)雜網(wǎng)絡(luò)在人文、社會與生命科學(xué)等領(lǐng)域中的應(yīng)用。

李國杰院士在為《可視化未來》所寫的序言中認為:“數(shù)據(jù)密集型科學(xué)研究已上升到與科學(xué)實驗、理論分析、計算模擬并列的科學(xué)研究‘第四范式’……大數(shù)據(jù)對社會科學(xué)的變革意義,與伽利略首次將望遠鏡指向太空對天文學(xué)的意義一樣重大。”實踐證明,用數(shù)據(jù)密集型(“大數(shù)據(jù)+”)的范式來研究語言,不但有益于從各種相關(guān)中追尋因果,加深對語言與認知關(guān)系的認識,進而有助于更好地理解語言的結(jié)構(gòu)模式與演化規(guī)律,也有助于推進語言學(xué)研究的科學(xué)化與國際化。


來源:社會科學(xué)報

聲明:數(shù)據(jù)猿尊重媒體行業(yè)規(guī)范,相關(guān)內(nèi)容都會注明來源與作者;轉(zhuǎn)載我們原創(chuàng)內(nèi)容時,也請務(wù)必注明“來源:數(shù)據(jù)猿”與作者名稱,否則將會受到數(shù)據(jù)猿追責。

刷新相關(guān)文章

旅游交通大數(shù)據(jù)——大眾旅游時代的“富礦”
旅游交通大數(shù)據(jù)——大眾旅游時代的“富礦”
#榜樣的力量#疾控AI分析平臺WDCIP——以科技力量貢獻“大數(shù)據(jù)”智慧丨數(shù)據(jù)猿新冠戰(zhàn)“疫”公益策劃
#榜樣的力量#疾控AI分析平臺WDCIP——以科技力量貢獻“大數(shù)...
張涵誠:大數(shù)據(jù)招商平臺可推動地方供給側(cè)改革
張涵誠:大數(shù)據(jù)招商平臺可推動地方供給側(cè)改革

我要評論

返回頂部