中国初步建成大规模藏语数据资源库
▓德州奥马哈▓GGPoker[—ggn178.com—]为亚洲最具备实力的一间国际扑克竞技赛事平台,提供一个正规安全有保障的扑克游戏环境,加入立即玩与GGPoker全球玩家一起同乐新时代新机遇——跨国企业在中国
本文转自:中新网
上海采取“减少流动+核酸筛查”策略尽快实现社会面动态清零
中新社西宁5月25日电 (记者 孙睿)记者25日从青海师范大学省部共建藏语智能信息处理及应用国家重点实验室获悉###%,该实验室已初步建成600TF算力的智算平台和面向多领域多用途的大规模藏语数据资源库%#%%#。
青海师范大学省部共建藏语智能信息处理及应用国家重点实验室2021年2月经中国科技部批准建设#*##,是中国唯一的藏语信息处理领域国家重点实验室*#@。实验室拥有5000平方米的科研用房和1.5亿元人民币的专业研发设备*#%@%。
该实验室主任赵海兴介绍%*,近年来#*%*@,实验室构建了藏文百科知识、新闻、经济、文化艺术等多领域文本语料40G以上%#%,藏语语音数据15000小时、各类文化资源近2万件*@@*,规模达到1600GB%*,是目前国内外最大的基于国标的大型标注语料库***#,对中国涉藏地区教育、语言研究以及社会文化发展起到积极推动作用#*%**。
同时%#,该实验室还构建了大规模藏汉平行语料库*%@%*,并通过迭代式回译策略等进行数据增强及质量评价%*,训练了融合单语语言模型和注入双语词典信息的深度神经网络翻译模型*#@@,在新闻、法律等领域准确率达90%以上*@。
此外*#**@,该实验室还搭建藏文文献资源数字化协同工作平台@@%,构建文献图文对照数据150余万文本行%%%,复杂场景图文资源220万个%@*,开展藏文印刷字体、复杂场景藏文区域检测研究%%%,自动检测视频帧中的文字区域*@,并将其分割成单个字符或行文本#%%@。利用深度学习对分割处理后的文本进行识别#*@#%,实现了藏文文献标准体和手写体扫描识别系统、藏语视频流复杂场景中的藏文识别%****。(完)
分享让更多人看到
热门排行
- 1如何向世界讲好中国故事?上海侨界人士共探语言的重要性
- 2泰国湄南河堤坝部分垮塌威胁民居寺庙
- 3向森林要食物:“中国绿都”三明点“绿”成金
- 4安徽宣城通报两起群众身边腐败和作风问题典型案例
- 5南方雨势将总体减弱北方多地气温将连创新高
- 6新时代新机遇——跨国企业在中国
- 7让更多孩子享受普惠学前教育(让老百姓过上更好的日子)
- 8三餐并两餐少吃能减肥吗?
- 9味蕾中国什么是“好客山东”?吃一顿鲁菜就明白了
- 10当年轻人的烦恼“穿越”到养老院
- 11国际护士节:他们是新生儿病房中的“临时妈妈”
- 12江苏淮安:初夏时节荷花含苞待放
- 13(八闽千姿)厦门大嶝对台市场烟火气再起
- 145月13日央行开展20亿元7天期逆回购操作
- 15“寻味香港云南出发”活动昆明举行滇港美食碰撞出别样火花
- 16中国正能量|奋斗者,正青春
- 17广东普宁英歌舞助力中泰文化交流合作
- 18向森林要食物:“中国绿都”三明点“绿”成金
- 19法国遭遇沙尘暴滑雪胜地被沙尘覆盖
- 20巴西中企协发起巴西南部暴雨灾害赈灾倡议