人民網
人民網>>經濟·科技

人工智能與口述史研究

楊祥銀
2025年07月12日08:50 | 來源:光明日報222
小字號

原標題:人工智能與口述史研究

作為二戰后興起的兼具學術研究意義、社會行動議程與公共歷史價值的研究方法與學科領域,口述史的興起與發展在相當程度上受益於科學技術的革新與應用。如今,隨著人工智能技術的迅猛發展,這一領域也正迎來前所未有的機遇與挑戰。人工智能在語音識別、自然語言處理、機器學習、計算機視覺、知識圖譜、機器翻譯、大數據挖掘與智能機器人等方面的突破與應用,顯著地影響著口述史的採集、整理、保存、分析、傳播與利用等全流程,為口述史實踐與研究注入新的生機與活力。人工智能不僅提高了口述史工作的效率和質量,更重要的是,它為書寫、理解和解釋歷史提供了新的視角和方法。

近年來,學術界已經開始探索人工智能與口述史的融合路徑。然而,這方面的系統性研究尚顯不足。大多數研究仍局限於技術的單點應用,缺乏對口述史全流程智能化的整體性思考﹔對人工智能賦能口述史的理論框架構建不夠完善,研究方法與路徑探索相對分散﹔對技術應用可能帶來的倫理挑戰與風險預警關注不夠充分。本次講座旨在系統分析人工智能在口述史各個環節的具體實踐,探索二者深度融合的可能性與限制性,並對未來發展趨勢做出前瞻性判斷。

智能化採集:打破傳統採集模式的局限

人工智能正以前所未有的廣度和深度嵌入口述史採集的各個環節,推動口述史採集模式從“面對面”走向“人機對話”、從被動式“提問—回答”走向主動式“沉浸體驗”。傳統口述史採集主要依靠訓練有素的訪談者,通過面對面訪談來記錄個人經歷。這種模式高度依賴訪談者的能力和經驗,同時受制於時間、空間、人力等現實條件的限制。

人工智能正在徹底改變口述史採集的全過程,包括訪談前的准備工作。傳統口述史准備需要花費大量時間查閱資料、了解受訪者背景、設計訪談提綱和進行模擬訓練等等。而人工智能在准備階段可發揮多方面作用:在背景資料梳理方面,它能快速整合分析海量資料,提供全面背景信息﹔在訪談提綱設計方面,能根據受訪者經歷和相關歷史資料自動生成結構化提綱﹔在模擬訪談方面,能模擬不同類型受訪者的回答模式和情緒反應,為訪談者提供近乎真實的實踐環境,新手可在虛擬場景中練習提問策略、傾聽技巧和應對突發情況的方法。

在實際訪談過程中,虛擬訪談助理(Virtual Interview Assistant)等人工智能系統為口述史採集提供了更加智能、高效的解決方案。虛擬訪談助理是基於人工智能的交互式系統,通過多種技術實現與受訪者的智能對話。首先,它通過自然語言處理技術實現對人類語言的理解與生成,能夠根據訪談主題自動生成訪談提綱,並根據受訪者背景定制訪談內容。在訪談中,它能根據對話進展動態調整問題順序和深度,挖掘更豐富的歷史細節。其次,知識圖譜技術有助於進一步強化口述史的智能採集能力。它以結構化方式表達復雜的知識關系,當受訪者提到某一歷史事件時,系統可以基於知識圖譜補充相關背景信息,幫助受訪者進一步回憶起當時的情境。再者,情感計算技術則賦予虛擬訪談助理感知和解讀人類情緒的能力。在訪談中,人工智能系統可以通過面部表情識別、語音分析等實時監測受訪者的情緒狀態,並據此調整訪談節奏和策略。

事實上,人工智能應用於口述史採集已經初現端倪。有學者正在探索使用對話式講故事助理(Conversational Storytelling Agent)來收集某些方面的口述史。該助理是基於機器學習的自然語言處理系統,通過自動化對話收集數字故事。系統採用預設腳本引導敘述者,提供肯定性回應和支持性話語來模擬人際訪談體驗。該系統採用“奧茲巫師”原型測試技術,設計傳統聊天機器人和創新美學兩種界面形式,支持文本、語音與視頻等多媒體格式和多語言功能,通過引導性問題促進敘述者講述並獲得即時反饋和情感支持。傳統方式依賴人工訪談,既耗時又耗力,難以擴展到大規模社會群體。而對話式講故事助理被視為擴展口述史收集范圍、提高效率並觸及更廣泛人群的有效工具。

除了口述史訪談智能化,人工智能與虛擬現實和增強現實等沉浸式技術的結合,也為口述史採集注入新的互動維度。虛擬現實技術能夠將受訪者帶回歷史場景,通過高度仿真的視覺、聽覺、觸覺等多維刺激激活深層記憶。增強現實技術則能在訪談過程中實時疊加歷史檔案、照片和地圖等輔助資料,幫助受訪者進行時空對照,提高口述內容的准確性。

可以預見,隨著人工智能技術的進一步發展,口述史採集將不斷突破時空限制。受訪者可以通過智能設備隨時隨地參與訪談,多語言支持和實時翻譯功能打破了語言障礙,使跨文化、跨語言的口述史採集成為可能。更重要的是,人工智能技術的普及使口述史不再局限於專業研究者的領域,而成為全社會共同參與的公眾實踐。

智能化整理:從煩瑣到高效的蝶變

人工智能正以前所未有的廣度和深度重塑口述史整理的各個流程,推動口述史整理從“人工操作”走向“智能處理”、從被動式“機械整理”走向主動式“深度加工”。傳統的口述史整理工作往往需要投入大量時間與精力,完成音視頻資料的手工轉錄、文本校對、目錄編制、索引構建、元數據創建、內容摘要撰寫等煩瑣任務。

隨著人工智能技術的突飛猛進,口述史整理的智能化已成為重要趨勢。在轉錄環節,語音識別技術已取得長足進步。目前一些自動語音識別系統已具備較高轉錄准確率,而且能進行智能標點、分段、生成時間戳和說話人標記等處理,在多語言、多口音、多說話人場景下展現出卓越適應性。雖然自動轉錄可能仍需人工校對,但整體效率提升顯著。

在編目與索引環節,人工智能同樣展現出強大能力。基於命名實體識別、關鍵詞抽取、主題建模等算法,人工智能系統能自動識別和提取人名、地名、事件、時間、主題等核心信息,生成標准化元數據,進而構建層次化的編目與索引結構。例如,通過知識圖譜技術,口述史文本中的人物關系、事件脈絡、地理信息等可以被自動解析,並以語義網絡形式組織起來。這不僅有助於提高編目工作的效率和准確性,還能通過深度語義分析,實現口述史資料的智能關聯和動態檢索,使研究者能夠迅速定位特定主題或事件的相關內容。

在摘要提取方面,自動文本摘要技術則有助於提升口述史信息獲取的便捷性。傳統摘要撰寫依賴人工閱讀和主觀判斷,耗時長且標准化程度低。而自動文本摘要技術通過深度學習與自然語言生成模型,能夠自動分析口述史文本並提取其中的核心觀點,生成精練摘要。

在實際應用中,已有一系列專業工具助力口述史整理。它們在自動化轉錄、關鍵詞提取、內容摘要生成、索引構建等方面發揮了重要作用,推動口述史資料處理向智能化方向發展。

人工智能的技術創新與應用拓展正推動口述史整理進入一個全新的智能化時代。這種變革並非意味著傳統人工處理模式將被完全取代,而是開創“人機協同”的新型工作范式。在這種范式下,人工智能系統將主要承擔自動轉錄、編目索引、關鍵詞提取、自動摘要等技術性任務,而人類研究者則專注於轉錄質量把控、編目索引結果優化、關鍵詞審核校正、摘要准確性驗証等專業判斷工作,確保口述史整理的專業性和准確性。

智能化保存:更安全、更高效的資料管理

人工智能正以前所未有的廣度和深度融入口述史保存的各個層面,推動口述史保存模式從“物理存儲”走向“智能存儲”、從靜態式“歸檔存放”走向動態式“智能管理”。傳統口述史保存方式主要依賴紙質載體與模擬介質,如紙質文字稿、錄音帶、錄像帶等。這些介質在長期存儲過程中容易發生物理損耗且存儲壽命有限,導致信息檢索困難。而且,隨著資料規模呈指數級增長,數字化保存也面臨諸多挑戰,如存儲空間急劇消耗、數據檢索效率下降以及信息安全隱患加劇等。人工智能技術的引入為破解這些難題提供了全新的解決方案。

首先,智能化的數據壓縮和存儲技術可以大幅降低口述史資料的存儲成本。傳統數字存儲往往採用非壓縮的原始格式(如WAV、MP4等),佔用空間大。基於深度學習的智能壓縮算法,如H.266/VVC編碼技術,能在保証質量的前提下大幅減小文件體積。相比傳統H.264或H.265編碼,H.266可將文件體積分別縮減至原來的1/4和1/2,從而節省存儲資源。

其次,區塊鏈技術可以為口述史資料提供更加安全和可信的存儲環境。口述史資料的數字化雖然提升了存儲、傳播與利用的便捷性,但同時也帶來數據篡改、版權侵權、隱私泄露等安全隱患。區塊鏈技術以其分布式賬本、密碼學驗証、去中心化共識機制等特性,為口述史資料構建起一套不可篡改、可追溯、安全可控的數據存儲和驗証體系。通過智能合約與時間戳機制,每一條口述史資料的存儲、訪問、修改等操作均可被精確記錄,並確保數據的完整性與真實性。

再者,雲計算技術為口述史資料提供彈性擴展、按需使用的存儲模式。傳統本地存儲需要預先部署大量硬件,隨著資料增長,存儲壓力增加,設備更新與維護成本高昂。而雲存儲使口述史資料的存儲模式從靜態配置轉向動態分配,機構可根據實際需求調整存儲資源,在降低前期投入成本的同時又能靈活應對未來數據增長的需求。雲存儲服務商通常結合人工智能技術,對存儲數據進行智能壓縮、重復數據刪除以及自動備份,從而進一步優化存儲效率並提升數據的安全性與可恢復性。

人工智能技術的深度融合正在推動口述史保存體系的智能化變革。智能壓縮技術讓資料存儲更高效,區塊鏈技術讓資料管理更安全,雲計算技術讓數據存儲更彈性。這些技術的協同作用不僅有助於提升口述史資料的存儲效率與利用水平,也開辟了未來數字化存儲與智能管理的廣闊前景。

智能化分析:重塑口述史研究范式

人工智能正以前所未有的廣度和深度賦能口述史分析的各個維度,推動口述史研究范式從“主觀解讀”走向“數據驅動”,從單一的“文本細讀”走向多模態的“智能解析”。傳統的口述史分析主要依賴研究者的主觀解讀和經驗判斷,通過文本細讀、歸納總結等方式探究口述史資料的深層意義。然而,這種以研究者主觀認知為核心的研究模式不可避免地存在分析效率低、研究視角有限、難以充分挖掘大規模口述史資料的潛在結構性規律等局限性。面對這些問題,人工智能技術為口述史分析提供了全新的研究工具、方法論以及范式轉變的可能性,使研究者能夠以更加系統高效的方式對口述史資料進行深度研究。

首先,自然語言處理技術有助於實現口述史資料的智能化解析。通過分詞、詞性標注、句法分析與語義理解等處理,自然語言處理系統能夠自動提取口述史資料中的關鍵信息(如人物、事件、時間、地點等),並對其進行結構化表示和關聯分析,幫助研究者更准確、全面、快速地把握其基本內容和脈絡。例如,命名實體識別技術可以自動識別出口述史文本中的重要實體,並將其歸類為“歷史人物”“地理位置”“重大事件”等相應類別,幫助研究者更直觀地理解口述史敘述的基本框架﹔句法分析和語義理解技術則能識別因果關系、時間順序、事件關聯等邏輯結構,使研究者能夠更加精准地把握敘述邏輯和歷史脈絡。這些技術有助於大幅提升信息提取效率,幫助研究者更全面系統地挖掘與分析海量口述史資料中的豐富信息,從而提升研究的科學性和客觀性。

其次,知識圖譜和語義網絡技術有助於發現口述史資料中的隱性知識和深層關系。知識圖譜是一種基於實體—關系模型的結構化知識表示方式,能夠通過命名實體識別、關系抽取與屬性標注等技術手段,將口述史資料中的人物、事件、地點等元素進行系統性關聯。而語義網絡則側重於概念間的關聯表達,兩者結合構建出可視化的知識體系。借助這些技術,研究者可以直觀地觀察人物之間的關系網絡、事件的因果鏈條以及歷史發展的多重路徑,從而揭示口述史資料中隱含的知識結構。例如,在分析某一重大歷史事件的口述史資料時,研究者可利用知識圖譜技術自動構建該事件的敘事框架,同時通過語義網絡分析不同敘述者如何描述事件的關鍵節點,以及這些敘述之間的共性與差異。

再者,數據挖掘和機器學習技術有助於從海量口述史資料中發現有價值的模式、趨勢與結構。在傳統口述史研究中,研究者往往需要通過大量文本閱讀、歸納總結,才能識別出某些歷史現象的規律。而數據挖掘技術可以幫助研究者從海量口述史資料中自動發現潛在模式、趨勢與結構,進而揭示個體敘述背后的社會動態與集體記憶演變規律。例如,通過聚類分析,研究者可以對口述史資料進行主題劃分,識別不同歷史時期、不同社會群體的敘述主題與關注焦點﹔通過情感分析,研究者可以探究敘述者在不同事件背景下的情感傾向,分析社會情緒的演變趨勢﹔通過觀點提取,研究者可以自動識別不同敘述者對某一事件的多元態度,並分析這些態度如何受到社會、政治、文化等因素的影響。

當前,市場上已有諸多先進的生成式人工智能大模型(如DeepSeek、ChatGPT、Gemini、Claude等),它們在自然語言處理、多模態數據分析以及知識推理等方面展現出強大能力。這些模型不僅能高效處理大規模口述史資料,還能夠進行定制化調整,以滿足不同研究主題的需求。由於這些人工智能模型具備強大的語義理解和知識生成能力,研究者可以利用它們對多模態的口述史資料進行深度分析,如主題分析、內容分析、敘事分析、話語分析、情感分析等,從而提供更加系統化和結構化的研究視角。

人工智能技術不僅僅革新了口述史的研究工具和方法,更推動了該領域研究范式的深刻轉型:從傳統的人文解釋學范式向數據密集型和技術驅動型的新范式轉變。這一轉變為口述史研究注入新的活力和想象力,也使其在數字人文乃至更廣泛的跨學科研究中佔據更加重要的位置。

智能化傳播與利用:口述史呈現多維度創新

人工智能正以前所未有的廣度和深度拓展口述史的傳播與利用方式,推動口述史呈現模式從傳統的“靜態展示”走向沉浸式的“交互體驗”、從單一式的“文本記錄”走向智能化的“多維應用”。傳統的口述史在呈現形式與傳播方式上長期受到技術限制,主要依賴於文本、音頻與視頻等靜態媒介,因缺乏互動性和沉浸感而難以引發廣大公眾尤其是年青一代的興趣。人工智能與數字人文的深度融合正在開辟口述史傳播與利用的新路徑、新方式與新格局,通過智能展示、智能推薦與智能應用等多重技術,有助於創造更加大眾化、交互性和沉浸式的口述史體驗。

首先,人工智能驅動的智能展示技術正在全面革新口述史的呈現方式,為其注入前所未有的沉浸感和交互性。以沉浸式現實為例,這項技術通過增強現實、虛擬現實和混合現實等手段,將原本局限於文字或影像的口述史內容轉化為可感知、可交互的沉浸式場景。增強現實技術可以將口述史內容無縫嵌入現實場景中,例如,當用戶進入某一歷史遺址或特定空間時,系統能夠基於定位技術觸發相關的口述史片段,仿佛置身於特定的歷史情境中,直接與過去對話。更進一步,通過混合現實技術,還可以實時疊加虛擬的歷史場景,使用戶能夠在真實與虛擬交織的空間中體驗歷史的多重維度。

虛擬人技術則為口述史的傳播注入了鮮活的生命力。基於口述史資料,人工智能能夠重建口述者的聲音、面容、表情等生理特征,並以數字人的形式呈現這些記憶的主人公。用戶不僅可以聆聽數字人口述者的故事,還能通過自然語言處理技術與其進行實時對話,提出問題並獲得即時回答,從而實現真正的交互式體驗。

虛擬現實與體感交互技術的結合進一步拓展了口述史沉浸體驗的邊界。體感交互技術通過捕捉用戶的肢體動作、手勢和表情,使用戶能夠以更加自然的方式與虛擬場景中的口述史內容進行互動。目前已經有機構利用虛擬現實技術再現某一歷史場景,幫助參觀者在虛擬引導下“探訪”相關遺址。

隨著目前文生視頻技術的不斷發展,基於口述史文本自動生成對應的動態影像場景成為可能,從而使抽象的口述記憶得以具象化、可視化,並在時空環境的數字重構中實現沉浸式再現。在博物館展覽與文化遺產展示領域,文生視頻技術的引入進一步拓展了沉浸式體驗的可能性,使歷史敘事超越傳統的靜態文物、文字說明和音頻導覽,轉向更具互動性和情境感的動態呈現。

其次,人工智能驅動的智能推薦技術可以實現口述史資源的精准傳播。傳統的口述史傳播往往採用單向模式,缺乏對受眾興趣和需求的精准把握。人工智能系統可以採集用戶的瀏覽行為與興趣偏好等數據,利用協同過濾與內容過濾等算法,自動為其推送相匹配的口述史內容,提高傳播的精准度和轉化率。同時,人工智能系統還能根據用戶反饋動態調整推薦策略,提升用戶接受度和參與度。

再者,人工智能技術為口述史資源的智能應用開辟了廣闊空間,推動其在教育、文化與社會生活中的深層次融合。通過自動問答、知識推理、智能分析與輔助決策等技術,人工智能系統能夠將口述史資源與其他數據資源進行深度整合,從而拓展其應用邊界。例如,在教育領域,將口述史資料嵌入智能教學系統,可以通過語音識別、自然語言理解與虛擬現實技術,為學生提供沉浸式、交互式的學習體驗。在輿情與社會研究領域,通過文本挖掘、社會計算與情感分析等技術,人工智能系統可以將口述史資料與社交媒體數據、新聞報道、學術研究等信息進行關聯分析,從而為社會輿論趨勢的研判提供歷史維度的參考。

人工智能與數字人文的深度融合正在推動口述史傳播與利用的革命性變革。從智能展示技術帶來的沉浸式體驗,到智能推薦技術實現的精准傳播,再到智能應用技術賦予口述史資源的跨領域價值,人工智能正在讓口述史從單純的歷史記錄轉化為具有情感共鳴的多維敘事載體。在這一過程中,人工智能不僅推動了口述史的形式創新,也在一定程度上重新定義了歷史記憶的保存、傳播與體驗方式,使其從靜態的歷史檔案轉變為動態的文化資產。

挑戰與展望:人機協作的口述史新紀元

上述討論勾勒了人工智能對口述史各環節的深遠影響,但其理想目標是構建一個集智能採集、整理、保存、檢索、分析、傳播與應用於一體的智能口述史系統。這一系統將推動口述史實踐與研究范式的深刻變革,使其在數字人文、公共史學、文化記憶等領域發揮更廣泛作用。

然而,人工智能應用目前仍面臨多重挑戰。在技術層面上,人工智能在語音識別、方言處理和隱喻理解等方面存在局限,可能導致歷史敘述失真或誤讀。在法律與倫理層面上,知識產權保護、隱私安全和算法偏見問題不容忽視。在社會層面上,數字鴻溝可能造成不同群體在口述史生產與傳播中的結構性不公。此外,過度依賴技術還可能削弱口述史的情感溫度與人文價值,偏離學科本質追求。

面對這些挑戰,人機協作而非單純技術替代是口述史發展的必由之路。人工智能的引入並非消解人類研究者的核心作用,而是重新定義學術勞動分工。人工智能可以高效處理大規模數據、識別表層模式和執行重復性任務,但研究設計、方法選擇、理論建構、情感理解與深度解讀仍高度依賴人類研究者的專業素養與批判思維。事實上,人類研究者的知識儲備與理論水平決定了人工智能應用的質量和深度,包括如何提出優化指令、評估生成結果的學術價值以及將技術創新與學科理論有機結合。這種協作模式是動態互動的:研究者指導人工智能的應用方向,人工智能則提供更加豐富的數據支持和分析視角,雙方在互動中不斷優化研究路徑與成果。

人工智能時代的口述史新紀元將以人機協同為核心特征,通過學科交叉與知識共享,構建由研究者、技術專家與公眾等共同參與的多元實踐共同體。口述史工作者需積極擁抱人工智能,提升數字化素養與智能應用能力﹔技術開發者則應深入理解口述史的多元屬性、特征與價值,開發符合特定需求的智能工具,同時也要充分認識到口述史作為承載豐富歷史信息、真實語言表達和深度人文內涵的高質量語料庫對於訓練人工智能大模型的重要價值。這種深度融合將使口述史突破傳統模式局限,以更加開放、多元的形態拓展研究廣度與深度,真正實現技術賦能下的人文價值傳承與創新探索,開創口述史智能化實踐、研究、應用的廣闊前景與全新境界。

(責編:楊曦、李楠樺)
關注公眾號:人民網財經關注公眾號:人民網財經

分享讓更多人看到

推薦閱讀
返回頂部