首頁>人物·生活>集·言論集·言論
王曉光 陳 靜:數(shù)字人文打開文化新視野
作者:王曉光 陳 靜
計算機可以幫助學者在紛繁龐雜的信息中快速發(fā)現(xiàn)和定位議題,,在宏觀的學科脈絡中把握關鍵問題,;學者又可以發(fā)揮個人學養(yǎng)所長,,深刻探究問題所在,,解釋背后的義理與規(guī)律
新興數(shù)字技術正在加速數(shù)字中國的構建進程,以數(shù)字媒介和人工智能為基礎的新興文化形態(tài)和知識生產(chǎn)體系正日見雛形,,數(shù)字人文正在積極引領文化時空的數(shù)字化轉(zhuǎn)換,,并展現(xiàn)出廣闊的發(fā)展前景
數(shù)字人文是一種將計算機方法與技術融入人文研究,進而提出并回答人文問題的新范式,。在傳統(tǒng)人文研究中,研究過程多表現(xiàn)為一種書齋式的,、針對典籍文獻的細讀和考據(jù),。隨著計算機和電子文本的發(fā)展,研究者開始利用數(shù)據(jù)庫查找資料,,并借助地理信息系統(tǒng),、機器學習、信息可視化等多種計算分析工具,,開展認知計算,、文本挖掘、情感分析,、圖像識別,、視覺分析、社會網(wǎng)絡分析,、數(shù)字記憶構建等研究,。在此過程中,一些新型研究方法,,如遠讀,、文本計量,、文化分析等陸續(xù)浮現(xiàn),并在文學,、史學,、文化研究等領域得到創(chuàng)新性應用。
為人文研究提供顯微鏡和望遠鏡
數(shù)字人文為人文研究開啟三種新維度,,分別是快讀,、遠讀、共讀,。
快讀,,指的是借助計算機技術,大大加快閱讀和利用文獻資料的速度,。隨著圖書文獻的數(shù)字化轉(zhuǎn)換,,高校、科研院所,、圖書館等機構建設了大量數(shù)字資源,。如果用傳統(tǒng)研究方式,以個人之力“窮盡”所有文獻資源,,根本不可能,。如何從海量數(shù)字資源中發(fā)現(xiàn)并獲取所需文獻,完成研究任務,,這就需要元數(shù)據(jù),、關聯(lián)數(shù)據(jù)、知識圖譜等數(shù)字技術支撐研究者實現(xiàn)“快讀”的需求,。比如《紅樓夢》中姓名稱謂有730多個,,想要從70多萬字的文本中找到這些人名,需要花費大量時間,。清華大學統(tǒng)計學研究中心團隊利用數(shù)據(jù)科學方法,,在不到1分鐘的時間內(nèi),得到按照詞頻排列的各類詞,,其中出現(xiàn)兩次以上的人名抓取準確率達93%以上,。這極大縮短了研究者的搜索查詢時間,同時還減少了手工篩選過程中的失誤,。再比如中國歷代人物傳記資料庫,,共收錄超過42萬條人物傳記資料,記錄了各方面的詳細數(shù)據(jù),,這些數(shù)據(jù)可以為各領域的人物關系和歷史事件研究提供基礎數(shù)據(jù)支撐,,檢索技術可以幫助研究者快速獲取所需數(shù)據(jù)。
遠讀具有兩重含義,第一重含義是指傳統(tǒng)的細讀方法導致大量文學作品從未被研究者閱讀,,如果要理解整個世界文學體系,,就必須采取遠讀方法,聚焦“比文本小很多或大很多的單位:手法,、主題,、修辭或文類和體系”。在該理論影響下,,研究者開始運用計算方法研究文學作品,。也有學者將社會網(wǎng)絡分析方法和信息可視化技術相結(jié)合,描繪小說的敘事結(jié)構,、情節(jié)發(fā)展和人物關系,。這些嘗試都為文學文本提供了一種新的解讀視角與研究路徑,凸顯了一種更為“宏大”的敘事邏輯,。
遠讀的第二重含義是指時間跨度上較大或素材數(shù)量較多的研究,,這在近年來數(shù)字文化遺產(chǎn)和數(shù)字博物館建設中體現(xiàn)得較為充分。在我國,,敦煌研究院和上海博物館率先引入數(shù)字人文理念,,并借助“數(shù)字敦煌”和“董其昌數(shù)字人文”書畫專題展覽,為文化遺產(chǎn)知識與數(shù)字資源的關聯(lián)性可視化呈現(xiàn)提供了示范,。以“數(shù)字敦煌”為例,,敦煌研究院在已經(jīng)完成的敦煌石窟數(shù)字化基礎上進行敦煌知識圖譜建設,借助更細粒度的敦煌壁畫圖像語義標注,,可以實現(xiàn)圖像片段的全球發(fā)布和鏈接,,研究者和大眾在看到特定主題圖像的同時,也能看到全球其他博物館中相同主題的圖像片段,。這為圖像學,、考古學以及文化研究學者提供了巨大的“閱讀”便利,也為公眾親近人類豐富的歷史文化遺產(chǎn)提供了更多可能,。
共讀則強調(diào)合作。盡管我們強調(diào)數(shù)字人文在人文研究方面的“快”與“遠”,,但并不意味著數(shù)字人文就以機器閱讀代替了人工閱讀,。數(shù)字人文強調(diào)人與機器的合作,遠讀與細讀的結(jié)合,。計算機可以幫助學者在紛繁龐雜的信息中快速發(fā)現(xiàn)和定位議題,,在宏觀的學科脈絡中把握關鍵問題;學者又可以發(fā)揮個人學養(yǎng)所長,,深刻探究問題所在,,解釋背后的義理與規(guī)律。比如有研究者在對中國近代“美”的觀念進行概念史研究時,借助大規(guī)模數(shù)據(jù)庫的文本資料,,以一億兩千萬字的文本為研究范圍,,對中國近代“美”觀念的發(fā)展軌跡進行遠讀式描繪,為傳統(tǒng)細讀研究提供了頗為有效的實證支撐,。
除了人與機器的合作,,共讀還意味著將多種閱讀模式結(jié)合,獲得全新知識圖景,。其中值得關注的是電子文本與數(shù)字地圖相結(jié)合形成的時空交互閱讀框架,。比如中南民族大學研究團隊就“唐宋詩人行旅路線”建立“唐宋文學編年地圖”,以地理信息系統(tǒng)為基礎架構,,在數(shù)字地圖上呈現(xiàn)唐宋著名詩人詞人的行旅蹤跡,,為讀者理解唐宋詩詞打開新視角。時空交互閱讀框架不僅以時空架構直觀展示時間,、地點,、人物、事件,、作品間的網(wǎng)絡關系,,還為深入解讀文本內(nèi)涵提供可能。
此外,,共讀還強調(diào)眾包協(xié)同,。借助開放眾包技術,上海圖書館開發(fā)“中國家譜知識服務平臺”,,允許用戶上傳和編輯自己家族的家譜,。中華書局建立的古籍整理平臺,也采取眾包模式,,組織高校學生,、出版社編輯、圖書館館員等社會力量進行底本校對,,日均工作量達100萬字,,大大提升了古籍電子文本的審校速度。
引領文化時空數(shù)字化轉(zhuǎn)換
進入新世紀以來,,以大數(shù)據(jù),、人工智能等為代表的新興數(shù)字技術正在加速數(shù)字中國的構建進程,以數(shù)字媒介和人工智能為基礎的新興文化形態(tài)和知識生產(chǎn)體系正日見雛形,。作為新一代人文學者認知世界和傳播文化的路徑,,數(shù)字人文正在積極引領文化時空的數(shù)字化轉(zhuǎn)換,并展現(xiàn)出廣闊的發(fā)展前景,。
數(shù)字人文可成為推動人文學術創(chuàng)新的重要力量,。與自然科學和社會科學相比,,人文學者對數(shù)字技術的采納相對滯后,甚至有一定誤解,。比如有人認為,,“將文學當作數(shù)據(jù)會失去文學本身豐富的意蘊”,這種觀點是對數(shù)據(jù)功能與意義的誤讀,。事實上,,凡是計算機可以處理的電子文本都可稱為數(shù)據(jù)。隨著數(shù)字社會的發(fā)展,,文本的主體形態(tài)早已轉(zhuǎn)換成計算思維下的數(shù)據(jù),,文學對“人本”和“文本”意義的追求并不會因其形態(tài)而改變,所以說文學與數(shù)據(jù)的關系是“道”與“器”的統(tǒng)一,,而非對立,。在利用新技術解決傳統(tǒng)人文問題的同時,數(shù)字人文也應更加關注新興人文議題,,比如新聞推薦算法和人工智能模型的倫理約束等,。數(shù)字人文在強調(diào)知識生產(chǎn)、表現(xiàn),、教學,、傳播數(shù)字化轉(zhuǎn)型的同時,應更加積極對接開放科學行動框架,,支持科研領域的開放獲取,、開放數(shù)據(jù)、開放創(chuàng)新,,并在學術活動中推動協(xié)同,、眾包、互聯(lián),、交互,、跨學科、跨國界,、跨專業(yè)合作等學術理念的普及與范式創(chuàng)新,。
數(shù)字人文可為優(yōu)秀傳統(tǒng)文化傳承發(fā)揮積極作用。目前,,數(shù)字人文正在引領文化生產(chǎn)體系的數(shù)字轉(zhuǎn)向,,已經(jīng)成為一個語言學、文學,、史學、哲學,、藝術學等傳統(tǒng)人文學科與圖書情報學,、計算機科學,、人工智能等信息科學共同關注的新興跨學科領域。數(shù)字人文不僅推動了大學與其傳統(tǒng)科研學科體系加速適應社會的數(shù)字化轉(zhuǎn)型,,還在公共文化機構中推動了人文知識向更大范圍的公眾開放,,使得普通人能夠更加便捷有效地學習傳承中華優(yōu)秀傳統(tǒng)文化。敦煌研究院,、上海圖書館,、中華書局等單位推出的一系列數(shù)字人文項目和成果,在推動優(yōu)秀傳統(tǒng)文化傳承和傳播方面具有很強的示范意義,。
數(shù)字人文應致力促進科技與人文的互動與融合,。過去幾年里,人工智能不僅是科技界熱點,,同時也是人文研究及藝術界熱點,。對人文學者來說,人工智能不僅是一種工具技術,,也是一種人類文明活動的參與主體,,由此帶來的文本生產(chǎn)問題、情感經(jīng)驗問題以及審美問題等都是難以回避的新興人文學術課題,。對于人工智能專家來說,,人文思考和倫理關懷也是研究過程必須引入的維度。在此背景下,,數(shù)字人文研究應以更加積極的姿態(tài)為科技與人文,、機器與文藝互動融合提供試驗場和方向標,面向未來打開文化新視野,。
(作者分別為武漢大學教授,、南京大學副教授)
編輯:董雨吉
關鍵詞:人文 數(shù)字 研究 文化