中国初步建成大规模藏语数据资源库
▓CPG大师赛▓GGPoker[—ggn178.com—]为亚洲最具备实力的一间国际扑克竞技赛事平台,提供一个正规安全有保障的扑克游戏环境,加入立即玩与GGPoker全球玩家一起同乐中国成功发射试验二十三号卫星
本文转自:中新网
【小新的Vlog】小新带你体验“滇味”与“港味”的奇妙交融
中新社西宁5月25日电 (记者 孙睿)记者25日从青海师范大学省部共建藏语智能信息处理及应用国家重点实验室获悉@*@@,该实验室已初步建成600TF算力的智算平台和面向多领域多用途的大规模藏语数据资源库%@%*。
青海师范大学省部共建藏语智能信息处理及应用国家重点实验室2021年2月经中国科技部批准建设#@@##,是中国唯一的藏语信息处理领域国家重点实验室%%%。实验室拥有5000平方米的科研用房和1.5亿元人民币的专业研发设备@@%。
该实验室主任赵海兴介绍%@@#@,近年来%*%#@,实验室构建了藏文百科知识、新闻、经济、文化艺术等多领域文本语料40G以上@#@%,藏语语音数据15000小时、各类文化资源近2万件%@,规模达到1600GB@#@@,是目前国内外最大的基于国标的大型标注语料库##%*,对中国涉藏地区教育、语言研究以及社会文化发展起到积极推动作用@#。
同时*%*,该实验室还构建了大规模藏汉平行语料库*%,并通过迭代式回译策略等进行数据增强及质量评价@%,训练了融合单语语言模型和注入双语词典信息的深度神经网络翻译模型@%%,在新闻、法律等领域准确率达90%以上%%*#*。
此外%@,该实验室还搭建藏文文献资源数字化协同工作平台*%%,构建文献图文对照数据150余万文本行#%%*,复杂场景图文资源220万个#**#*,开展藏文印刷字体、复杂场景藏文区域检测研究@#*,自动检测视频帧中的文字区域*#*,并将其分割成单个字符或行文本@#@。利用深度学习对分割处理后的文本进行识别@*%##,实现了藏文文献标准体和手写体扫描识别系统、藏语视频流复杂场景中的藏文识别@@%*%。(完)
分享让更多人看到
热门排行
- 1首尔举行“汉江发呆大赛”
- 2兴凯湖畔现“十里杏花海”
- 3俄别尔哥罗德市拉响导弹警报坍塌居民楼受伤人数上升
- 4南宁海关破获“套代购”走私案涉案金额约700万元
- 5男护士本杰加:用语言架起医患沟通桥梁
- 6法国遭遇沙尘暴滑雪胜地被沙尘覆盖
- 7国际护士节:他们是新生儿病房中的“临时妈妈”
- 8小新TalkShow:尔滨好像又要火起来了
- 9【百万庄小课堂】专家详解不同程度肥胖人群如何科学减重?
- 10港人返乡创业:从“90后”到“90岁”
- 11中国正能量|奋斗者,正青春
- 12兴凯湖畔现“十里杏花海”
- 13外媒聚焦习近平欧洲行:深化传统友谊拓展务实合作
- 14当科学与艺术相遇院士化身“导赏”为读者普及元典
- 15工信部:4月我国新能源汽车产销量同比增长均超30%
- 16工信部:4月我国新能源汽车产销量同比增长均超30%
- 17海南年轻人母亲节“花式宠妈”“年轻套餐”走俏
- 18工信部:4月我国新能源汽车产销量同比增长均超30%
- 19两岸青年驰骋卡丁车赛场以运动为媒增进友谊
- 20【凡人歌】这个冬天,冰球很“热”