中国初步建成大规模藏语数据资源库
▓GG扑克官方网址▓GGPoker[—ggn178.com—]为亚洲最具备实力的一间国际扑克竞技赛事平台,提供一个正规安全有保障的扑克游戏环境,加入立即玩与GGPoker全球玩家一起同乐5月24日人民币对美元中间价报7.1102元下调4个基点
本文转自:中新网
当年轻人的烦恼“穿越”到养老院
中新社西宁5月25日电 (记者 孙睿)记者25日从青海师范大学省部共建藏语智能信息处理及应用国家重点实验室获悉@@*@%,该实验室已初步建成600TF算力的智算平台和面向多领域多用途的大规模藏语数据资源库@@。
青海师范大学省部共建藏语智能信息处理及应用国家重点实验室2021年2月经中国科技部批准建设%*%,是中国唯一的藏语信息处理领域国家重点实验室*@。实验室拥有5000平方米的科研用房和1.5亿元人民币的专业研发设备##%*。
该实验室主任赵海兴介绍@*,近年来##@,实验室构建了藏文百科知识、新闻、经济、文化艺术等多领域文本语料40G以上#%@#,藏语语音数据15000小时、各类文化资源近2万件%@,规模达到1600GB##@,是目前国内外最大的基于国标的大型标注语料库%**%,对中国涉藏地区教育、语言研究以及社会文化发展起到积极推动作用@%@。
同时*###@,该实验室还构建了大规模藏汉平行语料库@*,并通过迭代式回译策略等进行数据增强及质量评价**%#@,训练了融合单语语言模型和注入双语词典信息的深度神经网络翻译模型#%@,在新闻、法律等领域准确率达90%以上#@%%%。
此外#*,该实验室还搭建藏文文献资源数字化协同工作平台%#@*%,构建文献图文对照数据150余万文本行@@@@,复杂场景图文资源220万个*%%,开展藏文印刷字体、复杂场景藏文区域检测研究@*#,自动检测视频帧中的文字区域#@%@*,并将其分割成单个字符或行文本@%#%%。利用深度学习对分割处理后的文本进行识别**%,实现了藏文文献标准体和手写体扫描识别系统、藏语视频流复杂场景中的藏文识别%#%。(完)
分享让更多人看到
热门排行
- 1三峡库区沿江小镇现平流雾壮美景观
- 2瞰中国我们走在大路上
- 3中山如何再塑制造业新优势
- 4第二十届藏传佛教“拓然巴”高级学衔授予仪式在京举行
- 5捷克总统骑摩托车受伤正在接受入院观察
- 6海南自贸港首票空港口岸“机坪直提”新模式业务落地
- 7上海地铁:一乘客鞋子被夹致扶梯运行受阻无人员受伤
- 8台学者分析陆方演习:“5·20”讲话让台海情势没有回旋空间
- 9瞰中国我们走在大路上
- 10荔枝涨价!产量或“腰斩”,都是天气惹的祸?
- 11常话短说|600元的防攀比鞋?少操点不该操的心
- 125月24日人民币对美元中间价报7.1102元下调4个基点
- 13新疆和田如何实现从“天然药仓”到“中医药之乡”的转变?
- 14法国遭遇沙尘暴滑雪胜地被沙尘覆盖
- 15甘肃凉州“90后”女村支书乡间逐梦
- 16新疆和田如何实现从“天然药仓”到“中医药之乡”的转变?
- 17郭有才直播间关闭打赏!此前陷侵权争议
- 18新疆尉犁夏日沙漠旅游热
- 19这两个数字,能看到中国经济的势
- 20中新教育|2024届高校毕业生就业促进周即将启动