大數據解析宋詞 東風最常見

浙江大學CAD&CG國家重點實驗室新華網資料新聞部合作,以大資料技術分析唐詩宋詞,完成視覺化資料作品《宋詞繾綣,何處畫人間》。(新華網截圖)

位於江西省九江市湖口縣境內的石鐘山,北宋大文學家蘇軾夜泊山下,寫下《石鐘山記》。(中新社資料照片

李清照文化周在李清照故里山東章丘舉行,章丘市中學生在朗誦李清照的詞《如夢令》。(新華社資料照片)

北宋都城開封的盛景在《清明上河圖》中顯露無餘。詞人們格外偏愛這裡的煙火氣味,多次歌詠東京汴梁城。(新華網截圖)

唐詩、宋詞常用詞排行榜

東風」一詞,對兩岸民衆而言都不陌生,居然在《全宋詞》裡出現過上千次、高居冠軍寶座!近日在微信朋友圈刷屏的視覺化數據作品,《宋詞繾綣,何處畫人間》(下簡稱《宋詞》)、《唐詩人羣像》(下簡稱《唐詩》),用大數據統計出《全宋詞》裡用詞的前三名,分別爲「東風」(1264次)、「何處」(1157次)及「人間」(1061次)。

《宋詞》、《唐詩》由浙江大學CAD&CG國家重點實驗室與新華網資料新聞部合作,歷時半年才大功告成。《宋詞》以《全宋詞》爲樣本,團隊分析近2.1萬首詞作、1330家詞人及1300個詞牌名;《唐詩》則針對5.5萬首唐詩展開大數據分析,意外發現不少隱藏在唐詩宋詞裡的資訊

蘇軾足跡遍佈宋疆域

《宋詞》網頁版由詩人行跡圖、年代生平圖聯動的時空圖,以及宋詞詞雲圖意象情緒圖、韻律圖組成。以蘇軾爲例,年代生平圖除用折線體現出蘇軾一生的仕途起伏外,行跡圖上大小不同的褐點,用線條連接之後,也讓蘇軾的生命軌跡化爲點、線、面。由圖可見蘇軾足跡幾乎遍佈整個宋朝疆域,杭州城則是他造訪次數最頻繁的地方。

詞雲圖則根據宋詞詞語的使用次數,進行大數據分析後,使用次數越多的字型越大、顏色越深,位置也更居中。正中間的「東風」與緊追在後的「何處」、「人間」,堪稱宋朝詞人的「心頭好」,在《全宋詞》近2.1萬作品中,三者均被使用超過千次。

「何處」可謂唐詩、宋詞的共同最愛,再度登上《唐詩》的榜眼──透過大數據整理出5.5萬首唐詩用詞的前三名,分別爲「不知」(1551次)、「何處」(1258次)、「千里」(1188次);至於唐代女詩人常用之詞,則以「相思」(27次)、「不知」(17次),「今日」與「殷勤」(11次)居多。

值得一提的是,《唐詩》網頁版製作的「唐朝女詩人社交圖」,以交友最爲廣闊的薛濤爲中心,連同並列爲「唐代四大女詩人」的李冶、魚玄機劉採春等,直接與杜牧劉禹錫元稹溫庭筠白居易等男詩人產生連結,進而再擴及杜甫李商隱等名家。巧妙地以衆位女詩人爲軸心,重現出整個大唐男女詩人的社交圈

視覺化讓詩詞易懂

此外,《宋詞》的「意象情緒圖」選取30個類似「月」、「酒」等常見的字詞,並以蘇軾、李清照等24位「高產量」的詞人爲代表;在大數據分析下,得出這些意象詞彙在作品中所表達的情緒,再把情緒分爲「喜、怒、哀、樂、思」五類,然後用餅狀圖呈現出,各字詞所代表不同情緒的比例,讓造訪網頁的網友一目瞭然。

浙江大學CAD&CG國家重點實驗室設計主管張瑋表示,「我們之前瞭解宋詞唐詩,更多地是一首一首分開理解賞析,而這次的研究讓我們可以從大數據層面去尋找詩詞背後所隱藏的資訊。」他並強調,製作《宋詞》、《唐詩》並非爲求得出某一結論,而是提供人們一種「探索唐詩宋詞的有趣工具」。浙大電腦科學與技術學院副院長陳爲也說,「人是視覺性的,視覺化形式的科普手段,可以把晦澀的古詩詞變得通俗易懂,讓科普擺脫說教或者沈悶刻板印象,從而起到推廣傳統文化的作用。」