墨西哥开始接种中国科兴新冠疫苗 综合消息:突尼斯变异新冠病毒系本土演化而来 中东多国加快疫苗接种进程 长春大众卓越女足昆明集中 开启第二阶段冬训备战新赛季 “春风行动”全面启动 研考初试成绩本月陆续发布 长春市文庙博物馆将举办元宵节线上公益文化活动 美失业率上升“新穷人”领救济 记者探访救济食品分发站 起步就是冲刺!牛年伊始长春多个项目火热开工! 吉林省全力抓好煤矿安全生产监管 全国大部分农区陆续忙碌起来 田间地头一派生机盎然 3天3夜跑了500公里!成都大叔完成极限超跑挑战 4天致8次高铁晚点:铁路部门提醒放风筝远离铁路电力网 26日天宇见证浪漫一幕:"元宵月"巧遇"黄帝星" 猜灯谜、做灯笼 长春市图书馆“闹春图”元宵节系列活动来了 重庆返岗复工农民工达260余万人 返岗率逾六成 美国新冠肺炎死亡人数超50万 超一战二战和越战美阵亡者总和 第五届联合国环境大会召开 中方呼吁采取全球行动应对环境问题 机场“逐鸟人”:黑脸蛋是我们的“标配” 吉林省人社厅发布通知,2021年社会保险缴费有新变化! 伊朗最高领袖:如有需要或将浓缩铀丰度提高至60% 国资委:支持央企加快国有资本的布局优化和结构调整 亚泰广州冬训先“瘦身”再“增肌” 内外援引进工作将全面展开 零距离!揭开天问一号火星环绕器神秘面纱 洮南:强化政务大厅疫情防控 确保群众办事安全 谭德塞:全球各地都进行新冠疫苗接种符合所有国家的利益 智利累计新冠确诊病例超80万例 外企看中国丨专访IBM大中华区首席执行官:我们期待在中国“云”端舞出新姿 嫦娥五号带回月壤 3月将在国家博物馆展出 牛年元宵节 十六月最圆 利益联结产业链上游,伊利全面助力东北地区乡村振兴 春节假期后文旅新风尚 开春如何玩得更尽兴? 长春新区:打造“升级版”营商环境 省运管局指导各地全面有序恢复道路旅客运输服务 游客捞取泉池内硬币引发争议 趵突泉景区回应 一派生机盎然!湖北武汉:开启“全城赏花”模式 澳大利亚学者认为比特币价值被高估 北京汤圆元宵抽检全合格 温馨提示:带冰霜的别买 刚果(金)总统谴责联合国车队遇袭事件 湖南两名男子爆竹炸6条小鱼被取保候审 同时段播放全国第一,实时收视率破1!电视剧《鲜花盛开的山村》,不一样的乡村戏! 挂着名校牌子,收费高,却很孬!有名无实的“冠名办校”值得警惕 联合国人权理事会第46届会议昨日开幕 中方代表发表视频致辞 注意!吉林省这5批次食品不合格! 非洲新冠确诊超383万例 多国持续推进疫苗接种 吉林省退役军人事务厅发布“清明•致敬英雄”主题征文、摄影征集评选活动的公告 @吉林人,坚持完今天,24日气温将回升了! 推动两国关系重回正轨 女童海洋公园爬凳摔伤 脸缝4针 家长要求园方赔偿合理吗? 为中国疫苗投下信任票 多国领导人“带头”接种 海外网评:50万条逝去的生命,美国无法治愈之痛
您的位置:首页 >理财 >

清华听障博士用AI赋能信息无障碍

2019-05-28 10:22:43来源:中国青年报
原标题:清华听障博士用AI赋能信息无障碍

  姚登峰

姚登峰是一位听障人士,但他在逆境中不断地创造传奇,获得了北京大学硕士、清华大学博士学位,现在是北京联合大学的副教授、硕士生导师。去年12月,他和另外两位清华博士一起创业。

他来自湖北天门,1岁时双耳失聪,却以优异成绩完成各阶段学业。作为全球首位人工智能聋人博士,姚登峰的博士课题是手语认知与计算,致力解决聋人与健全人的信息沟通问题。在李德毅院士的点拨下,姚登峰团队将手语计算研究扩展到行为语言计算研究,即理解全人类的行为语言。为了将最新科技成果转化为科技产品,他创业成立行语科技,成为一家行为语言整体解决方案的提供商,公司自主研发的行为语言计算技术,在理解除了语音语言之外的整个人类多样化行为方面,居于世界领先水平。

5月25日,在清华大学校长杯创新挑战赛中,行语科技脱颖而出,获得由众多顶级投资人和专家评出的企业创新奖。

面对坎坷“生气不如争气”

姚登峰从小就以残疾身体奔跑在人生马拉松赛场。他1岁时因为感冒发烧导致听力极重度损失,从此坠入了一片静寂的无声世界。

当时医生的判断是训练没有效果,但他的母亲没有放弃,日复一日对他进行听语康复训练。没有助听器,母亲就在他耳边大声“喊话”,彼此摸着对方的喉咙感觉声音的震动来发音,渐渐登峰学会说话和交流。上学后,他无法听到老师讲课的完整信息,自己就通过大量的阅读和自学来弥补,以顽强的毅力克服了求学中的种种困难和阻碍,他的成绩可以考入重点大学,却因耳聋被拒录,几经周折被录取到一所二本大学。

“生气不如争气!”姚登峰面对挫折激发斗志,更加努力证明自己不比健全人差。2003年他通过全国统考,以专业第一名的成绩考上了北大研究生,并以全优的成绩毕业。也正是在北大读研期间,他第一次接触到信息无障碍。“大部分人认为信息障碍只存在于残障人士之间,其实健全人也会有老的时候,也会有听不到声音、看不到东西的时候,也会有特殊场景下遇到信息障碍的时候。信息无障碍是全人类的事情”。

他在信息无障碍领域做了大量开创性的工作,也发现了手语背后计算领域的一片空白地带,为此他2012年考入清华大学在职攻读博士学位,希望用手语认知和计算技术,让有声世界的口语族与无声世界的手语族能够自由沟通。

在清华读博期间,在数以万计的代码编写和实验论证之后,2016年姚登峰团队在国际上首次提出手语计算的认知架构,一举解决了手语计算困扰多年的底层像素特征与逻辑语义输出的断层,汇合手势分词实验的数据宝库,手语计算的理论、技术与认知支撑首次形成了完整闭环。

担任中国人工智能学会理事长、北京联合大学机器人学院院长的李德毅院士,有一次点拨姚登峰:在自然语言交流效果中,有声语言占7%,语音音调占38%,面部表情、肢体语言及手势等行为语言占55%。过去30年来AI只关注占比45%的讲话内容的理解,但对于占比55%的表情、手势、肢体等行为语言并未关注。

姚登峰博士毕业后在手语计算的基础上,开始尝试破解行为语言的深层奥秘,由于两者本身在面部、手势、肢体的聚合感知上架构相通,再加上团队伙伴不懈地探索和研究,仅仅两年便在这一领域取得了突破性进展,2017年姚登峰被推荐为北京市卓越青年科学家。

调研发现各行各业都有行为语言计算需求

行为语言是从运算智能到达感知智能、认知智能重要的途径,基于动态影像的行为识别是AI的最前沿领域,全球科技巨头都在积极寻找刚需解决方案。

阿布都克力木、哈里旦木两位博士和姚登峰是从事小语种计算研究的清华同学,他们常常在一起讨论前沿科技,在一次次探讨中敏锐地认识到,如果对人类行为语言进行全方位无感识别与计算输出,机器智能便能理解各种行为语义并做出善解人意的反馈。这将是由传统运算智能上升至感知智能和认知智能的重要核心,并可以延伸出更多跨行业有价值的产品和服务。

2018年,姚登峰团队在湖北进行了智能领域的无人驾驶无感识别的实验,通过一周的数据采集,该技术在0~100米范围内可以准确在人群中识别出交警,识别率达到95%;在识别交警准确的8套手势时,识别率达到90%。这证明该技术已达商用标准,他们顺利拿到了国家知识产权证书。

一次,姚登峰与创业伙伴做市场调研,在一所监狱考察时发现其引入了最先进的监控系统,仅一个监控室安装了几十个显示器,对应500个房间外加各类场所通道。但负责这500个房间的状况监控的干警,每天轮班连续看显示器,人极度疲劳,监控效果也很难面面俱到。

如果有了行为语言智慧监控系统,就可以通过人工智能自动发现是否有违规行为,能够及时把违规动作等截图上传到监控室,让就近狱警及时干预,提高管理运行效率和安全防范水平。

团队在市场调查中得知很多场景、场合都需要应用行为语言计算,比如在照顾老人时,识别出老人是否摔倒;在跑步、游泳等体育运动时,识别动作是否标准;在炼油厂等敏感区域,识别出抽烟、没有戴安全帽等不安全行为……各行业的需求对接让团队意识到行为语言计算技术确实可以帮助很多人,使大家增添了开发贴近市场需求产品的紧迫感。

国内团队多在语音识别、图像识别、可穿戴设备识别方面下功夫,但是在行为语言计算方向上,姚登峰认为,未来世界行为语言计算是不需要任何设备的,识别是无感的,希望用超前的无感识别技术改变人类的生活,让技术尽快转化为应用产品。

在接受中国青年报·中青在线专访时,尽管姚登峰能听懂提问,但他还是打开手机语音识别软件,用标准普通话流畅地回答每一个问题。

姚登峰明白,创业是对一个人综合实力的考验,生活节奏“不断在加快加快再加快”,也不断地解决一个又一个难题。

行语科技在创办3个月后,国际某工业巨头主动寻求行语科技投资控股且计划在后续B、C轮融资时引入顶级平台资源。但因随后而来的经济危机搁浅了该计划。

紧接着,行语科技在部署炼油厂监控系统时,发现单体技术跟理想应用还存在着不少距离,很多场景应用不光是行为识别的问题,还需要结合图像识别的技术,比如抽烟动作最好结合识别香烟形状。这涉及底层技术架构的调整,否则就很难通过客户严苛的测试,此时研发主力程序员又因出国被迫退出。困难一个接一个,只能靠创始成员自己顶上,加班加点完成任务。

据了解,目前行语科技的团队有10多人,已与国内一线科创平台签署战略合作,落地智慧监狱和工业场景,同时在南京、杭州等地都有项目落地。(中国青年报·中青在线记者 陈璐)

免责声明:本网站所有信息仅供参考,不做交易和服务的根据,如自行使用本网资料发生偏差,本站概不负责,亦不负任何法律责任。涉及到版权或其他问题,请及时联系我们。

猜你喜欢