三三文章网 - 科技知识大全是专业科技新媒体网站。网站著眼于新一代科技新闻的全面及时处理报导,让网民在外面第二时间交待全球新一代的科技资讯。内容涵括AI+、互联网、IT、创业投资、核定、区块链、智能硬件等领域

商汤科技71篇论文入选CVPR 2022创新高 引领AI技术与产业创新发展

  • 时间:
  • 浏览:0

6月19日-23日,全球人工智能计算机视觉领域顶级国际会议CVPR2022计算机视觉与模式识别,即国际计算机视觉与模式识别,在美国新奥尔良召开,同时举行在线会议。商汤科技及联合实验室共71篇论文入选本次CVPR,创新高,其中近四分之一被口头报告采用,涵盖三维视觉、自动驾驶等多个备受关注的前沿研究领域和方向,继续巩固其在全球计算机视觉研究领域的领先势头。自成立以来,商汤科技与联合实验室在每次科学会议上发表了700多篇论文,并在每次比赛中获得了70多项世界冠军。与此同时,Senseyu以前从未将论文数量作为衡量公司技术发展的标准。商汤科学家、研究院王晓刚博士说:“我们希望通过为科研人员提供良好的高效科研,鼓励年轻的科研人员,从实际做的角度,进行高水平、高质量的研究。”在此次CVPR中,商汤科技又参加了许多学术竞赛,取得了同样值得关注的成果。例如,商汤科技与中国科学院自动化研究所、上海人工智能实验室合作,参加了Embodied AI20222022身体智能挑战赛,并在RxR-Habitat赛道中获胜。作为全球Embbodied AI研究领域的权威竞赛,本次竞赛要求室内机器人通过自然语言控制来解决导航问题。SenseTime方法的效果提高了90%以上,导航准确率由24.08%提高到45.82%,导航保真度由37.39%提高到55.43%。同时,在推动基于深度学习的视觉编码技术的CLIC挑战赛上,SenseTime Technology团队在所有三个测试代码点上都取得了最高的主观评价分数,在所有深度学习方法中解码速度最快。推进技术力产业,创新引领行业突破商汤科技一直激励研究团队,关注产业需求和痛点,将研究工作与实际业务场景相结合。近年来,随着seCore商汤AI大装置等AI基础设施的发展,商汤在尖端研究领域有了更多的支持,并进一步引领了AI创新的发展。例如,在一篇题为“Bailando”的3D Dance Generation via Actor-Critic GPT with Choreographic Memory”的论文中,研究人员可以驱动3D角色并根据音乐进行舞蹈动作,不仅保证了动作的标准和美感。他提出了一个新的音乐到舞蹈框架,可以保持与不同音乐节奏的时间一致性。目前,在人工智能、云计算等技术能力不断提升的背景下,数字人的应用范围日益丰富,在社交、游戏、直播、虚拟偶像等领域逐渐融入我们的生活。这项研究无疑为数字化人类产业做出更加智能化、个性化的角色塑造,满足多样化的需求提供了一个潜在的方向。

点云跟踪框架PTTR示意图近年来,随着自动驾驶和激光雷达技术的发展,基于点云的目标跟踪越来越受到人们的关注。针对点云数据特有的问题和现有算法的缺陷,SenseTime研究团队在论文《PTTR Relational3D Point Cloud Object Tracking with Transformer》中提出了一种新的点云跟踪框架PTTR,它显著提高了多个数据集的对象跟踪的准确性,为自动驾驶安全驾驶奠定了基础.商汤科技还与北京航空航天大学刘翔龙教授团队合作,为复杂场景举办了“稳健模型走向开放世界分类”的鲁棒机器学习竞赛。竞赛的目标是推动安全可靠的AI模型的研究,鼓励创造更安全可靠的AI,并支持人工智能技术的更可持续发展。共有286支队伍和416名参赛者参加了比赛。获奖者于6月19日在CVPR2022Robustness艺术研讨会上宣布。加强基础设施和生态建设,支持成果生成商汤科技在学术研究和技术创新方面取得的显著成果,是领先软硬件基础设施整合的强大计算能力基础和领先的算法能力,以及商汤在学术生态和开源生态建设中的长期积累密不可分。商汤通过建设和不断完善以SenseCore商汤AI大装置为核心的基础设施,为技术研发和着陆提供重要的基础支撑。研究人员可以高效地进行科学研究,快速地实验和验证新思想,加速创新和迭代,促进高层次论文的生成,同时解决工业着陆过程中的问题。他强调了学术生态系统的发展。2017年以来,商汤科技陆续与上海交通大学、南洋理工大学、浙江大学分别成立了联合研究院或实验室,与清华大学成立了“感知计算”产学研深度融合专项项目,并推动了全球人工智能大学学术联盟的成立。通过与学术界的紧密联系,促进各种学术成果的产生和国际间的学术交流与合作。今年6月11日,商汤科技与全球大学人工智能学术联盟共同成功举办“无限研究―商汤论文共享会”活动,吸引了商汤科技及香港中文大学、浙江大学、南洋理工大学、北京大学等高校的学者嘉宾,共同举办3D视觉、姿势推断、底部视觉、表象学习等课程。在线解读CVPR2022口述论文在场景理解等领域,分享了宝贵的学术经验。此外,商汤继续巩固开源生态建设。OpenMMLab是一个基于视觉算法的开源项目,在GitHub上获得了超过50,000颗星,并成功地向研究人员和行业开源了数千个模型。基于决策智能的OpenDILab于去年在WAIC会议上宣布,并已向学术界和工业界开放源代码。在大模型方向上,商汤与上海人工智能实验室及高校共同发布了通用视觉技术体系书生INTERN,开源OpenGVLab,支持通用人工智能基础研究和生态构建.OpenMMLab还在CVPR期间举办了题为“OpenMMLab计算机视觉研究与生产基础设施平台”的研讨会,邀请学术界专家参与共享讨论,构建开源生态系统。随着基础设施建设、学术和开源生态的培育,人工智能技术研究的基础将更加坚实和广泛。商宇将以此为支撑,不断引领人工智能技术创新,深化人工智能产业落地,加快规模化应用,推动人工智能技术与产业发展,不断取得突破。