5月26日,AI训练数据龙头服务商海天瑞声正式公开了企业品牌焕新战略,并宣布将开放多模态数据集。
品牌焕新 从语音Speech到图像再到文本 实现AI数据Data全覆盖
(相关资料图)
海天瑞声企业品牌焕新战略将启用全新Logo,英文名称将从“SpeechoOcean”改成“DataOocean AI”,中文名“海天瑞声”不变。海天瑞声CEO王晓东表示:“此这次品牌升级并不仅仅是一个简单的改名,它还代表着海天瑞声将在数据科技和人工智能领域的进一步发展和探索壮大。”海天瑞声因优质海量强大的智能语音数据相关技术及产品被大家所熟知,但近些年来随着人工智能技术的不断迭代与发展,海天瑞声的业务已从单纯的语音领域服务,扩展至提供为覆盖语音、计算机视觉、自然语言处理和多模态的数据解决方案及成品数据集等领域,未来还将支持以数据驱动的生成式AI业务发展。海天瑞声不再局限于“语音Speech”而是更广阔的“数据Data”海洋。为更好地反映公司的业务范围和技术实力,海天瑞声对企业品牌进行了升级,以更好地满足客户全方位需求。
品牌升级背后,海天瑞声全新的战略布局也更清晰。据了解,自2005年成立以来,海天瑞声就一直在为AI产业链上的各类机构提供AI算法模型开发训练所需的专业数据集。目前这些数据集已经覆盖智能语音、计算机视觉、自然语言等多个AI核心领域。经过多年深耕,海天瑞声的产品和服务已获得阿里巴巴、腾讯、三星等国内外头部客户的认可,并在自动驾驶、虚拟主播、个人声纹识别、人脸姿态助手、智能音箱、语音导航等等众多种人工智能场景及产品相关算法模型的训练过程中获得应用。
随着数据要素作为国家级战略资源地位不断凸显,数据相关企业也肩负起未来数字化基建的重大责任。因此,无论是业务领域的自然扩展还是主动更名的品牌升级,都在证明着一点,即海天瑞声在保障基础数据业务稳健发展的同时已找到新的业绩增长点并不断发力。从近期其在智能自动驾驶业务的接连动作可以看到,海天瑞声正在发力聚焦自动智能驾驶赛道,通过平台、算法研发以及数据安全能力的持续建设,不断将之打造成为公司核心竞争力之一,使之成为公司第二增长曲线。
深入布局自动驾驶领域 开发全栈式自动驾驶数据标注平台
基于海量数据构建一套强大的数据链驱动系统,是自动驾驶技术发展过程中的必要环节。而要想推动该系统高效运转就少不了数据采集、管理、标注和、质检和仿真等环节的支持和相互配合。
自动驾驶领域是海天瑞声着重进行业务布局和彰显技术实力的核心领域之一。不久前,海天瑞声正式推出全栈式数据标注平台“DOTS-AD自动驾驶标注平台”。黄宇凯介绍,这是一款专为自动驾驶场景设计的全栈式数据标注平台,能够支持多维度、全方位的自动驾驶标注任务,数据标注效率提升高达8倍。支持万人同时作业,能够解决项目经理和标注员的使用痛点,提升标注效能,且支持多元化部署。
“DOTS-AD自动驾驶标注平台”具备四大核心功能:一是全面支持自动驾驶领域各维度2D/3D/4D点云或图像数据标注;二是能针对不同场景支持辅助标注/自动化标注;三是支持项目的柔性管理,支持流程/工具/标签的自定义;四是可实现对数据的智能化管理,确保客户的商业敏感数据安全合规。基于这些核心功能,海天瑞声正建立起在智能驾驶数据训练领域的核心壁垒,也将赋能自动驾驶技术迈向新高度。
开源数据集 助力AI开放生态构建
生态是全球人工智能发展的大势所趋,尤其是AI算法的优化和模型的训练需要足够优质和丰富的数据集支持,共享数据集就成为AI开放生态系统中非常关键的一环。海天瑞声宣布开放共享数据集对构建AI开放生态系统将产生积极的意义。
谈到为何开放数据集,王晓东表示,作为AI数据行业首家上市公司,海天瑞声天然肩负着开源开放、推进数据资源整合共享的社会责任。开源数据集可以帮助各领域的研究者和开发者快速获得更多高质数据样本,进而提高模型的精准度和鲁棒性,帮助他们更好地进行算法研究和模型训练。
据了解,海天瑞声此次即将开源的多模态数据集计划「DOTS-MM-0526」涵盖音频、语音、图像、语音、文本等多个维度。海天瑞声希冀通过这一计划,与全球AI开发者和研究人员建立更加紧密的合作关系,共同推动人工智能技术的发展和应用。同时,开源数据集计划亦是公司对于AI开放生态的一次有益尝试,是海天瑞声在数据智能化应用领域持续发力的体现。
当前,大模型方兴未艾,其实大模型也需要进行训练。在海天瑞声CTO黄宇凯看来,大模型训练过程中的数据发展与AI领域此前的数据相关工作并没有什么不同,还是需要先提出数据方案,然后进行设计,再执行采集、标注等一系列的工作流程,最终目标也是让客户能够基于所提供的数据,训练出效果良好的模型。其中,不一样的地方在于,不同企业关注的侧重点不同。比如,大模型主要分为预训练和强化学习两个阶段,这两个阶段对数据都有很高的要求。就前者而言,虽然大模型对应的是大数据,但却并不是数据越多越好,还要执行数据清洗的步骤。数据公司必须掌握如何清洗、向哪个方向清洗,才能更好地应用于大模型的基础能力。对于后者来说,进行强化学习需要撰写对应的提示词,这对数据标注人员的逻辑思维能力和表达能力也有较高的要求。