在全球抗擊新冠肺炎(Covid-19)疫情方面,各種各樣的高新科技都有望“大顯身手”,其中最突出的是自然語言處理技術(shù)。無論是在抗疫一線,還是在社區(qū)管控、疫苗研發(fā)等大后方,自然語言處理技術(shù)發(fā)揮的作用都不可忽視。目前世界上有多個(gè)研究團(tuán)隊(duì)使用該技術(shù)抗擊新冠疫情,并取得了可喜的成果。
在新冠疫情中,最早正式發(fā)出疫情警告的并不是世界衛(wèi)生組織或美國疾控中心,而是加拿大一家名為“藍(lán)點(diǎn)”(BlueDot)的健康監(jiān)測平臺;它早在2019年12月31日就向其客戶發(fā)出了提前疫情警告,避開危險(xiǎn)區(qū)域。該平臺設(shè)計(jì)了疾病監(jiān)測分析程序,使用自然語言處理技術(shù)來篩選65種語言的新聞報(bào)道,以及航空公司數(shù)據(jù)和動物疾病暴發(fā)的報(bào)道,在疫情暴發(fā)之初發(fā)揮了監(jiān)測功能。
前不久,美國艾倫人工智能研究所發(fā)布了“新冠肺炎開放研究數(shù)據(jù)集”(CORD-19)的資源管理器以及全文本搜索引擎,并表示希望它可以幫助人們探索數(shù)據(jù)集并確定潛在的研究成果。該機(jī)構(gòu)語言學(xué)家道格·雷蒙德博士說:“過去幾年,我們在自然語言處理方面取得了長足進(jìn)步,CORD-19這類數(shù)據(jù)集的實(shí)用性可能會比幾年前更大,因?yàn)楝F(xiàn)在我們有了更多可用的工具?!?/span>
美國政府曾經(jīng)宣布聯(lián)合艾倫人工智能研究所、微軟研究院、美國國立衛(wèi)生研究院等機(jī)構(gòu)共同發(fā)布有關(guān)新冠疫情的學(xué)術(shù)文獻(xiàn)的開放研究數(shù)據(jù)集CORD-19,并呼吁世界各地的人工智能專家采取行動,開發(fā)新的文本和數(shù)據(jù)挖掘技術(shù),以幫助科學(xué)界回答與新冠疫情相關(guān)的高優(yōu)先級科學(xué)問題。其目的是為醫(yī)學(xué)和自然語言處理研究人員發(fā)布疫情數(shù)據(jù)集,以獲得有助于對抗此次疫情的真知灼見。
美國哈佛大學(xué)醫(yī)學(xué)院的研究人員借助自然語言處理技術(shù)最近開發(fā)出了一種工具,可以評估新冠患者的病例、社交媒體和健康衛(wèi)生數(shù)據(jù)。他們率先努力通過使用機(jī)器學(xué)習(xí)和大數(shù)據(jù)分析查看來自各種來源的數(shù)據(jù)和信息來尋找新冠病毒的解決方案。借助自然語言處理工具,他們還可以搜索有關(guān)新冠病毒的在線信息,并了解爆發(fā)的當(dāng)前位置。
中國疾病預(yù)防控制中心的研究人員最近在使用科技巨頭阿里巴巴達(dá)摩院的自然語言處理技術(shù)開展病歷文本分析和流行病學(xué)調(diào)查工作,并取得了階段性成果。達(dá)摩院的研究團(tuán)隊(duì)通過自然語言處理回顧性數(shù)據(jù)、使用卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練CT影像的識別系統(tǒng),它可以快速鑒別新冠影像與普通病毒性肺炎影像的區(qū)別,最終識別準(zhǔn)確率高達(dá) 96%。
智能問診系統(tǒng)能夠在線為病患提供問診服務(wù),其使用應(yīng)用語義理解、情感分析等自然語言處理技術(shù),通過問題預(yù)判、意圖反問、分類識別、相似度匹配等方法,不僅能夠解答何種情況需要就醫(yī),還能實(shí)現(xiàn)疫情防控動態(tài)進(jìn)展、科學(xué)防護(hù)知識、謠言鑒別等問題精準(zhǔn)解答,并支持人機(jī)協(xié)作、自主學(xué)習(xí)、會話引導(dǎo)等功能。
在疫情防控期間,中國百度靈醫(yī)智惠推出的“智能咨詢助手”,包含新冠問題解答、標(biāo)準(zhǔn)化預(yù)問診路徑、在線醫(yī)生咨詢輔助三大模塊;它通過自然語言處理技術(shù)賦能在線健康咨詢平臺、政府疫情防控平臺、互聯(lián)網(wǎng)醫(yī)院等第三方平臺,助力其直接為公眾提供有關(guān)新冠的在線科普、在線咨詢,倍數(shù)級提升效率。
疫情發(fā)生至今,情況愈演愈烈,人們一邊要提防新冠肺炎的傳染,一邊又要不斷接受著海量的真假難辨的信息的轟炸。但對于后者,自然語言處理技術(shù)能夠幫助人們提取信息的主要觀點(diǎn),識別文章情緒甚至分析文章的可信度;這在抗疫信息戰(zhàn)中將“謠言”粉碎,促進(jìn)輿論生態(tài)良性循環(huán),從而為抗疫工作提供一份助力。
自然語言處理技術(shù)在對抗新冠疫情中發(fā)揮了重大作用。雖然自然語言處理技術(shù)不是萬能神藥,但可以幫助研究人員更快地從醫(yī)療數(shù)據(jù)中提取更有用的信息,挖掘其中的規(guī)律,從而加快疫苗研發(fā)進(jìn)程,也有助于進(jìn)行更有效的治療。自然語言處理技術(shù)在本次疫情中的應(yīng)用證明其在分析醫(yī)療和臨床數(shù)據(jù)中大有可為。
由上可知,自然語言處理可以在抗擊新冠疫情中大顯身手,為打贏這場疫情攻堅(jiān)戰(zhàn)提供了極為有效的技術(shù)支撐。有了自然語言處理技術(shù)相助,抗疫工作將變得更安全、更高效。正如中國著名學(xué)者周海中教授曾經(jīng)所言:“自然語言處理是極有吸引力的研究領(lǐng)域,它具有重大的理論意義和實(shí)用價(jià)值?!?/span>
文/李言(作者單位:德國人工智能研究中心[DFKI])