让“无声世界”感受赛场魅力!带你看看冬奥手语数字人有哪些奥秘******
2022年2月4日,第24届冬季奥林匹克运动会在北京举行,让世界目光再次聚焦中国。本届北京冬奥会秉持绿色、共享、开放、廉洁的办赛理念,凝聚中国科技力量,面向世界、面向未来,向全球奉献了一场精彩、非凡、卓越的奥运盛会。
本届冬奥会运用最新科技手段,为全世界观众提供了惊艳的现场转播和全方位覆盖报道,北京冬奥会也成一场上科技含量高的奥运会。赛事活动期间,为了让各类人群都能平等地享受本届冬奥盛会,北京电视台上线了智能手语播报数字人,在《北京新闻》和《北京您早》等节目中进行冬奥专题手语播报,为听障人士带来精彩赛事报道。
最新数据显示,我国听障人群超过2700万,这部分人群与健听人一样,他们对教育、社交、娱乐等信息获取都有巨大的需求。但长期以来,传统人工手语翻译工作量大,且主持人和手语主持人配合难度极高。手语动作表情复杂,语序与正常语序差异大,正常情况下想要熟练掌握手语大约需要2年左右的时间,还要结合语境进行猜测。
受北京市科委科技冬奥专班委托,北京电视台联合凌云光、智谱AI等业内科技公司,在北京市残疾人联合会和市残联聋人协会等支持下,用3个多月时间,让手语播报数字人完成了近10万条手语语料学习,且翻译准确率高达90%。
在如此短的时间内实现这项高难度动作,智能手语数字人是如何做到,在这背后又有哪些技术创新难点?
在多位业内人士看来,近年来人工智能体系建设重点布局在算法层和应用层,数据层建设远远不足,并且针对数字人相关产业,底层数据库的数量、质量和开源程度还明显不足。尤其是国内现有的手语语料数据库数量少,且多以图像、视频等二维平面为主,无法满足AI(人工智能)训练的需求。
同时,因手语语序与中文语序差异大,方言分化更加复杂,且需要通过表情、口型、动作等方式来传达信息。除了传统的二维平面图像、视频采集,三维肢体运动、表情信息数据采集及结构化参数表达外,手语语料数据库建设对三维运动信息捕捉也十分重要。
凌云光手语数字人产品相关负责人介绍,在建设高质量手语语料库的同时,他们充分调研了2022北京冬奥专用手语术语,并联合北京市残联、聋人协会等相关组织机构,进行数据标注,建设手语语义映射关系,不仅完善了国内手语数据库的建设,也为手语推广和AI研究留下了宝贵的数据资产。
该负责人举例说,基于“悟道2.0”超大规模人工智能模型的技术支撑,手语数字脑用计算机模仿听障人士的大脑,将看到的中文文本信息转换成手语词汇序列,包括中文语义蒸馏模型和AI手语分词快编算法的研究。中文语义蒸馏模型用于从输入的文稿或文本中提取出关键的语义信息,将中文文本语义提炼和精简,形成精准匹配适合手语表达的文本;AI手语分词快编算法则用于将蒸馏得到的中文文本,根据冬奥手语语料库划分成相应的手语词汇序列,供数字人做表达输入。
该负责人还提到,数字人是冬奥手语播报的载体和展现形式,通过高精度写实数字人全流程制作方案,可实现一键数字建模,高度还原真人发肤,重新毛孔等细节,更加真实亲切。同时,通过跨模态拟人生成算法,还可以将手语词汇序列,生成相应的动作信息,驱动数字人模型做出相应的动作、手势和表情。(姚坤森)
数据交易如何更规范高效(经济时评)******
数据交易场所为解决交易过程中的效率、合规、安全、信任等问题提供了重要平台。统筹构建规范高效的数据交易场所,将进一步促进数据合规高效流通使用,赋能实体经济,助力全体人民共享数字经济发展红利。
上海数据交易所日前正式运营,2022年试运行期间,其交易额超过1亿元,2023年有望突破10亿元。
2021年以来,国家相关政策、法律法规等密集出台,各地积极探索,截至2022年8月,已有40多家数据交易场所成立。数据交易场所建设如火如荼,为解决交易过程中的效率、合规、安全、信任等问题提供了重要平台,但也面临数据产权不清、新技术支撑不充分、出现同质化竞争苗头等情况,对此还需各个击破。
确权是基础。从实践来看,公共数据和个人数据的权属问题相对清晰,企业数据方面则较为复杂。当前,一些数据交易场所已逐步形成数据登记等确权模式,迈开了破解“确权难”的第一步。从长远来看,根据数据来源和数据生成特征,国家层面的公共数据、企业数据、个人数据分类分级确权授权制度亟待建立,通过分别界定数据生产、流通、使用过程中各参与方享有的合法权利,为激活数据要素价值创造和价值实现提供基础性制度保障。
技术是支撑。数据需要流通才会产生价值,但由于数据具有可复制性等特点,在交易中容易发生所有权交接不清楚、隐私泄露等问题,反而阻碍了流通。破解两难,技术支撑必不可少。在清洗加工等环节,针对交易数据尤其是高敏感度和高价值数据,可通过隐私计算来进行分析、建模。在数据调用等环节,区块链技术有利于实现全链条监管,上海数据交易所已经采用联盟链将与交易有关的信息存储在区块链节点中,提高了交易的安全可信度。在对数据泄露的溯源和追责方面,数据水印技术可将标识信息隐藏在结构化数据中,对溯源取证提供了有力支持。下一步,还需加大这些技术的研发创新、标准完善和应用推广,为数据流通插上安全的翅膀。
布局需优化。目前,华东、华南、华中地区的数据交易场所占比达70%,有的单一省份已设立了5家。为了避免区域分割和同质化竞争,主管部门需加强数据交易场所体系设计,统筹优化规划布局,引导多种类型的数据交易场所共同发展,构建多层次市场交易体系,推动区域性、行业性数据流通使用。数据交易场所自身也有必要找准优势,错位发展,提高数据要素供给数量和质量,延展出市场所需的数据产品和服务。
2022年12月发布的《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》提出,“统筹构建规范高效的数据交易场所”。随着参与交易的数据类别逐步扩大,数据交易产业链生态雏形初现,统筹构建规范高效的数据交易场所,将进一步促进数据合规高效流通使用,赋能实体经济,助力全体人民共享数字经济发展红利。(林 琳)