紫金财经-聚焦最头条的科技行业新媒体

小米AI实验室入选《麻省理工科技评论》中国“2021人工智能创新研究院”

小米于2014年成立小米AI研究院的前身小米探索实验室,2016年初正式成立小米AI实验室,研究方向包括计算机视觉、声学、语音、NLP、知识图谱、机器学习等多个领域。

紫金财经1月11日消息 近日,《麻省理工科技评论》中国发布了《2021人工智能创新研究院(AI Labs)报告》,多元且客观地描摹 AI 技术创新和未来技术趋势的年度图景,从而预见改变中国,甚至改变世界的技术力量。同时,报告遴选出10 家具有技术创新力和引领力的企业 AI 研究院,小米AI实验室成功入选。这是对小米技术实力的认可。

《麻省理工科技评论》中国公布了小米AI实验室的上榜理由:“小米围绕"手机×AIoT"战略与核心业务需求,为用户提供丰富的智能生活体验。其自研技术广泛应用于智能手机、音箱等智能硬件产品以及电商等互联网服务业务中,并打造了业内领先的智能生活助理小爱同学,将 AI 技术全面融入 C 端用户细分生活场景。”



小米于2014年成立小米AI研究院的前身小米探索实验室,2016年初正式成立小米AI实验室,研究方向包括计算机视觉、声学、语音、NLP、知识图谱、机器学习等多个领域。



报告指出,小米作为一家以智能手机、智能硬件和IoT平台为核心的消费电子及智能制造公司,关注基于硬件的AI技术支撑,将语音交互作为基础能力进行构建,优势体现在应用场景多样化、数据丰富度高。个性化、精细化、多模态和安全隐私性作为小米技术发展方向,AI技术将更多地融入C端用户细分生活场景,通过软硬件技术结合的方式,在保证用户隐私安全的情况下,提供精细化服务,更加理解生活、贴近生活。



作为小米AI技术的"试验田"和"弹药库",小米AI实验室旨在研发业内一流的AI技术,为公司的关键业务交付关键AI能力。与此同时,结合公司重大战略需求,开展探索性预研工作,为公司未来储备核心AI技术,提升公司技术品牌影响力。



小米AI自主研发技术,目前已经在计算机视觉、声学、语音、NLP、知识图谱、机器学习等研究方向取得一系列成果。



计算机视觉领域



小米AI实验室在手机相机和AIoT设备上已经落地了40多项视觉核心算法,为用户打造极致的拍照体验。其中,2021年有20多项算法落地10款以上机型,另20多项预研算法正在进行中,也将逐渐落地到旗舰手机上。在全球最权威的第三方评测机构DXO Mark榜单上,AI实验室的HDR、人像超清、边缘画质提升技术助力小米手机3次登顶。魔法系列如魔法换天、魔法分身等分割效果好,速度快,体验新奇有趣。此外,由AI实验室和相机部联合打造的小米12计算摄影技术“万物追焦”,拍照快、追焦稳,广获用户好评。



声学领域



小米AI实验室致力于人工智能声学技术的研究及工程落地,为小米手机及IoT全生态硬件产品打造业界领先的音频体验。目前AI通话降噪、协同唤醒、协同放音、空间音频等技术已在手机、电视、小爱、耳机等60余款产品中落地。2018年小米建成国内首家全自动远场声学实验室并成为中国人工智能产业联盟首批联合实验室,小米远场声学测试规范确立为联盟测试标准。近年来团队牵头发起国际标准1项、国家标准2项、行业标准2项、团体标准4项及企业标准2项,为小米在远场声学领域奠定了行业领先优势。



语音领域



小米AI实验室在语音识别、语音唤醒、声纹识别、口语评测、语音合成、歌唱合成、AI作曲与编曲等方面均取得了重大的突破。目前,小爱同学每日承接1.9亿次语音请求。小米AI实验室已经将AI语音技术落地到小米手机、平板、手表、手环、耳机、电视、音箱、手表、四足机器狗等产品上。与此同时,团队连续在Interspeech和ICASSP等国际语音顶级会议上发表了10多篇学术论文,并为公司夺得5项语音识别、语音唤醒和声纹识别技术的国际比赛冠军。



新一代KaIdi



新一代语音团队由集团首席语音科学家Daniel Povey博士领衔,在维护现有Kaldi项目的同时,致力于开发新一代Kaldi项目。Kaldi作为过去10来年业界最引人注目的开源语音项目,在科研界和产业界都取得了巨大成功。新一代Kaldi是小米纯自主研发的全新的面向未来的开源语音识别框架,该项目在推动语音识别技术发展的同时,也将提高小米语音识别技术的国际竞争力和影响力。经过一年多紧锣密鼓的开发,目前新一代Kaldi的三个子项目——K2、Lhotse和Icefall,基本开发完成,并且已经在2021年8月的InterSpeech会议上正式对外发布,这意味着新一代Kaldi项目已经布局完成。相信随着新一代Kaldi的发布和广泛使用,将会彻底改变人们实现语音识别的方式。



NLP领域



研发自然语言处理核心技术,打造领先的技术平台和创新产品。团队重点打造了搜索、推荐、广告、多模态、机器翻译、人机对话和文本创作等方向。



搜索、推荐、广告支持了小米商城、有品、新零售、广告推荐等业务。利用多模态技术自动生成广告创意,成功支持广告投放。机器翻译广泛应用到小爱同学、手机、MIUI传送门与网页翻译、小爱老师、小爱鼠标等设备。设备端翻译体验业界领先,同声传译已上线到小爱面对面同传、会议同传、AI字幕、通话翻译等场景,成为小米高端机型产品宣传页功能。人机对话方面重点研发了闲聊对话功能,是小爱同学在手机、音响等重要设备中用户最喜欢使用的功能之一。机器写作基于最新的预训练生成技术在对联、诗歌生成领域达到接近人类水平的效果,应用到小爱同学节日运营传播;语言风格转换技术成功支持了小爱同学多款自定义音色的语言风格定制。



知识图谱领域




此外,小米AI实验室在图谱构建和图谱应用领域均取得了重大突破。在图谱构建方面,小米AI实验室联合OpenKG进行了知识图谱的开源工作。另外在实体链接技术方面,2次获得了中文短文本实体链接比赛的第一名。在图谱应用方面,知识图谱广泛应用于小爱,每日承接数亿次query请求,并在2021年CCKS的知识问答比赛中揽得第一名。智能客服业务依托知识图谱平台,打造了在线客服机器人、智能外呼、智能IVR等产品,为公司每年节省上千名客服人力。



在报告的洞察部分,《麻省理工科技评论》中国指出,企业的 AI 研究院是打造业务新增长曲线的主要阵地,其无形当中酝酿着新的破局点和增长点。在相机方向,小米AI实验室通过应用计算机视觉相关算法技术,提升拍照清晰度、对焦精确度、操作趣味性。在语音交互方向,小爱同学从语音助手逐步升级为智能生活助手。而NLP和知识图谱则在互联网内容领域应用广泛。总体来说,围绕小米"手机xAIoT"的核心战略,小米人工智能已经在关键的AI产品和技术方面做好了完整布局。



技术创新只有与社会、行业、市场紧密结合,才能最大限度推动商业成果落地,从而真正做到改变人们的生产生活。未来,小米AI实验室将不断探索科技新高度,用人工智能的技术和产品,让更多人享受科技带来的美好生活。