向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
中新社70年 | 25年前,有这样一群中青年******
▲《中新将士出征图》,中新社“香港回归”报道组部分成员整装待发。从左至右依次为章新新、王晓晖、刘末利、周景洛、田惠明、谭宏伟、王瑶、杨瑞春、郭健、宗金柱
这是25年前的一张照片。摄于1997年6月30日下午四点多,距香港回归还有数小时。
香港回归,举世瞩目。精兵强将,齐聚港岛。现场报道,历史一瞬。
北京是第二战场,在时任社长郭瑞、总编辑郭健(又名郭建)的统一指挥下,抽调总社、分社的十几位中青年记者,组成了香港回归北京报道组。我当时担任总编辑助理,在报道组做些穿针引线的工作。
十年一剑,霜刃利否?
每逢大战,记者格外兴奋,北京报道组抓住百年一遇的机会,人人摩拳擦掌,个个跃跃欲试:十年一剑,霜刃利否?
▲首都各界庆祝香港回归晚会,中新社发 王瑶 摄下午四点,报道组将士欲出征天安门广场,去记录子夜零点香港回归那历史一瞬,去记录广场排山倒海般的欢声雷动。
郭健总编辑前来相送,大家站在办公楼前的老墙根下,一起合影留念。照片名为:《中新将士出征图》。照片中男女各半,共计十人。女士站中间,男士环周边,绅士风度也是中新风格不可或缺的。
照片中右侧第一位,肩扛“大炮”的年轻人是摄影部记者宗金柱。他人大文科毕业,喜写诗填词做文章,又生得“柱子”体格,偏好摆弄相机,30多斤重的照相器材包拎起就走,毫不费力。
他的摄影作品张弛有度,略带诗文意境,曾获奖无数,后来升任摄影部主任。正欲大展拳脚,孰料病毒侵袭,与之搏斗五年,五十岁不到的“柱子”倒下了,令人心痛!
站在“柱子”旁边的是总编辑郭健:条纹T恤,皮带横腰,斯文眼镜,儒将风范。哪里像个年过半百之人,分明是风度翩翩一帅哥。
郭健系赣南寒门子弟,自幼苦读经史,腹有诗书,功底深厚。60年代中期,他从江西大学新闻系毕业即进入中新社。他见证过文革的黑白颠倒,体会过干校的身心磨练。
蹉跎的日子里,他苦吟着普希金的《假如生活欺骗了你》,不要悲伤,不要忧郁。寒冬的岁月中,他坚信:昨夜杜鹃又啼血,不信东风唤不回。
▲庆祝香港回归祖国20周年文艺晚会 中新社记者 洪少葵 摄终于,东风来了!他像一只报春的布谷,键笔纵横,鼓呼神州改革开放;吐气扬眉,书写文化科技精英。捕捉新闻,才思敏捷,遣词造句,行云流水,他是中新风格的开创者之一。
令人惋惜的是,今年初,这位笔中一流的老总编驾鹤西去了。追忆往事,睹物思人,25年前,他是那样的英姿勃发!
照片中左起第一人,身材高猛,双手叉腰,衣着考究,英气外露。他是时任海外中心副主任的章新新。侧立一旁的弱女子,刘海齐眉,短发垂耳,肩挎书包,略显青涩,好像刚迈出校门的学生妹,她是时任政文部副主任的王晓晖。
十几年后,这俩人成了黄金搭档:男社长、女总编,率领中新社千余将士遨游在网络新媒体时代,成绩斐然。章新新社长功成名就,隐退江湖,专注美术创作,情趣高雅。王晓晖总编转战母校南开大学,开坛传道,解惑授业,非凡人可及。
▲庆香港回归活动微型艺术展开幕 中新社记者 李志华 摄照片中最年轻的女孩是摄影部记者王瑶(右四)。她五岁学摄影,十岁获大奖,20多岁又获世界级顶尖的“荷赛”金奖,这是中国摄影第一人获此殊荣,她后来升任摄影部主任、副总编,后转任中国摄影家协会主席一职,执棒多年。
王瑶右侧穿花裙子的女孩叫杨瑞春,是港台部记者。《中国新闻周刊》2000年创刊后,她请缨加盟,成为主笔之一。后被《南方周末》挖走,委以重任。新媒体浪潮中,她又跳到腾讯集团,成为高管。她说,东家换了好几个,而娘家就一个,永远是中新社。
王瑶左侧的姑娘叫谭宏伟,人大新闻系毕业后即投身中新社,从事时政报道。当年国务院新闻办人手短缺,将她借调一年,因其业务精湛,深得外宣办高层青睐,欲招揽,未果。只因小谭对中新社痴心不改,忠贞不二。她现在正外派美国分社,重任在肩。
照片中年龄稍长者是着黑裙的女士,时任上海分社采编主任的刘末利。60年代中期,她曾是复旦新闻系的“系花”,外貌沉鱼落雁,文笔柔中带刚,穿衣打扮,精致时尚,还会烧得一手“本帮菜”。
就是这位典雅的“上海小资”,当众人尚不知股票为何物时,她就捕捉到了“上海将建股票交易所”的独家新闻,发至海外,一片惊呼!足见“茉莉小姐”眼力、笔力了得!
照片后排悄然站立两中年男子,左侧的是福建分社长周景洛,他与老社长郭招金系福建师范的同门师兄,大学期间,两人均品学兼优,难分伯仲,后又双双选调入京,进入新华社中新组。唯一不同的是,同窗期间,周同学扬其诗文之特长,悄悄与“班花”鱼雁传书,最终抱得美人归,令同学羡慕。
退休后,景洛社长生活有滋有味。或临池泼墨,仿欧柳苏黄,书法了得!或品茗赋诗,文言现代兼收,意味隽永。
后排右侧那个就是我本人,一生经历四老:老三届,老知青,老工人,老记者。在中新社三十多年,没写过小书,没获过大奖,只留下了无数美好的回忆。
开启中新社全天候发稿先河
▲北京迎回归夜景,中新社发 杨佐桓 摄遥想当年,这些中青年记者个个身怀绝技,齐聚在“中新风格”大旗下,钟爱新闻事业,不为名缰利索所困,大胆创新,写了一条条独立、独创、独有、独到之独家新闻,为“中新风格”增光添色。
细看这张照片,将士出征,装备齐全,心态轻松,眼神淡定,举重若轻,志在必得,个个胸有成竹。透出了一股团结、拼搏之豪气,显出了一派进取、向上之风貌。
其实,北京报道组还有一些记者没有出现在照片里,当时他们还在五楼会议室里策划构思:如何以香港回归为主线,调动各分社力量,发挥通讯社的优势,滚动发布新闻,全方位报道各省市庆典盛况。
最后,我们决定做一组系列报道,题目为:《跨越九七的24小时》,将北京天安门倒计时牌前十万人集会,南京静海寺敲响了警世钟,福州林则徐故居前告慰林公,广州虎门销烟地、上海外滩前、天津海河边、山城重庆朝天门以及诸多省会城市串接起来,以香港回归庆典为纲绳,每隔一小时滚动发布一篇稿件,其形式新颖,内容丰富,绘制了一幅举国同庆香港回归的画卷。
▲庆祝香港回归25周年活动陆续展开 中新社记者 李志华 摄这组系列报道开启了中新社全天候发稿的先河。
这组系列报道荣获了1997年中国新闻奖大奖。
25年如一梦,至今忆起,恍如昨日。特写下此文字,以示存留。
作者:田惠明(中新社原副总编辑)
中国网客户端 国家重点新闻网站,9语种权威发布 |