中国初步建成大规模藏语数据资源库
▓GGPuke-中文版▓GGPoker[—ggn178.com—]为亚洲最具备实力的一间国际扑克竞技赛事平台,提供一个正规安全有保障的扑克游戏环境,加入立即玩与GGPoker全球玩家一起同乐一些“工二代”选择当蓝领,直言“里子”比“面子”更重要
本文转自:中新网
上海采取“减少流动+核酸筛查”策略尽快实现社会面动态清零
中新社西宁5月25日电 (记者 孙睿)记者25日从青海师范大学省部共建藏语智能信息处理及应用国家重点实验室获悉***,该实验室已初步建成600TF算力的智算平台和面向多领域多用途的大规模藏语数据资源库*%。
青海师范大学省部共建藏语智能信息处理及应用国家重点实验室2021年2月经中国科技部批准建设@%@*,是中国唯一的藏语信息处理领域国家重点实验室@#%@。实验室拥有5000平方米的科研用房和1.5亿元人民币的专业研发设备*@。
该实验室主任赵海兴介绍%@@,近年来%@#,实验室构建了藏文百科知识、新闻、经济、文化艺术等多领域文本语料40G以上#@#,藏语语音数据15000小时、各类文化资源近2万件%##*@,规模达到1600GB@*%#,是目前国内外最大的基于国标的大型标注语料库%*@@,对中国涉藏地区教育、语言研究以及社会文化发展起到积极推动作用*@%。
同时%*,该实验室还构建了大规模藏汉平行语料库#@#@,并通过迭代式回译策略等进行数据增强及质量评价%@@,训练了融合单语语言模型和注入双语词典信息的深度神经网络翻译模型*@,在新闻、法律等领域准确率达90%以上@*。
此外%%,该实验室还搭建藏文文献资源数字化协同工作平台#@#@,构建文献图文对照数据150余万文本行@@%#,复杂场景图文资源220万个#@%#,开展藏文印刷字体、复杂场景藏文区域检测研究###%@,自动检测视频帧中的文字区域*%,并将其分割成单个字符或行文本@%%。利用深度学习对分割处理后的文本进行识别@*#*,实现了藏文文献标准体和手写体扫描识别系统、藏语视频流复杂场景中的藏文识别%@%@。(完)
分享让更多人看到
热门排行
- 1“洋弟子”在中国丨体验蜡染艺术开启多元文化交融之旅
- 2全国各省份实现国家和省级集采药品数超450种
- 3东部战区持续位台岛周边开展“联合利剑—2024A”演习视频发布
- 4既是宿舍也是办公室,员工在其中猝死能否算工伤?
- 5东部战区持续位台岛周边开展“联合利剑—2024A”演习视频发布
- 6中国女足新主帅米利西奇:我们需要提升比赛强度
- 7浙江义乌防晒用品热销海内外
- 8海警2304舰艇编队位台岛以东海域开展综合执法演练
- 9中新教育|2024届高校毕业生就业促进周即将启动
- 10多家平台发布微短剧备案细则
- 11新时代新机遇——跨国企业在中国
- 12习言道|老百姓的幸福生活是干出来的
- 13南非自然保护区部分生物死亡疑与骚乱点燃化学品仓库有关
- 14云南金平拍摄到国家二级保护动物金裳凤蝶羽化全过程
- 15云南金平拍摄到国家二级保护动物金裳凤蝶羽化全过程
- 16英摄影师捕捉三只鹿张望瞬间角度完美一致好似重影
- 17中国女足新主帅米利西奇:我们需要提升比赛强度
- 18南非自然保护区部分生物死亡疑与骚乱点燃化学品仓库有关
- 19北京怀柔黄花城长城水库现瀑布景观
- 20AI创业,追逐风口但别轻信“红利”