騰訊建全球最大甲骨文單字?jǐn)?shù)據(jù)庫:一個(gè)“?!庇?500種寫法

 人參與 | 時(shí)間:2024-12-23 07:59:00

12月10日消息,牛2016年,騰訊中國文字博物館曾向公眾發(fā)出懸賞令,建全承諾每破譯一個(gè)甲骨文字便獎(jiǎng)勵(lì)10萬元人民幣。球最然而直到2023年前,大甲單字僅有一位學(xué)者憑借對(duì)“蠢”字的骨文研究獲得了這份獎(jiǎng)金。

截至目前,數(shù)據(jù)已發(fā)現(xiàn)的有種甲骨數(shù)量接近16萬片,其中包含約4500個(gè)不同的寫法甲骨文字符。但遺憾的牛是,這些字符中只有大約1500個(gè)被成功解讀出來。騰訊

騰訊建全球最大甲骨文單字?jǐn)?shù)據(jù)庫:一個(gè)“?!庇?500種寫法

造成這一現(xiàn)象的建全主要原因包括:許多甲骨上的文字模糊不清、相似字形難以區(qū)分以及人工查找效率低下等挑戰(zhàn)。球最

為了加快甲骨文的大甲單字解碼速度,騰訊公司構(gòu)建了一個(gè)包含超過143萬個(gè)單字記錄的骨文世界最大甲骨文數(shù)據(jù)庫,并利用數(shù)字技術(shù)實(shí)現(xiàn)了相似形狀和相關(guān)甲骨之間的匹配與關(guān)聯(lián)功能。該數(shù)據(jù)庫已于近期開源。

通過這個(gè)平臺(tái),用戶可以快速檢索到相關(guān)信息。例如,在搜索欄輸入“牛”,系統(tǒng)將返回3504種與之形態(tài)相近或相關(guān)的甲骨文樣本及其對(duì)應(yīng)的原始材料。

除此之外,騰訊還發(fā)布了首個(gè)多模態(tài)甲骨文數(shù)據(jù)集(涵蓋一萬份甲骨拓片及摹本),詳細(xì)標(biāo)注了每個(gè)單字的具體位置及其所屬類別等信息,這一系列舉措有助于加速甲骨文被考釋的進(jìn)程。

頂: 1325踩: 7897