加速数据要素价值释放,用友打造高性能时序数据库
- 时间:
- 浏览:0
在数字化时代,数据作为一种新型的生产要素,是数字化、网络化、智能化的基础,并迅速融入生产、流通、消费、社会服务管理等各个方面。海量数据的存储和高速处理是实现数据元素价值的基础,而数据库作为组织、管理和存储数据的仓库,是实现数据元素价值的整个链条上不可或缺的环节。在制造业、电力、化学和气象等行业中,由基础设施设备收集和生成的数据通常具有快速生成频率它具有(每秒可产生多个数据)、高度依赖采集时间(每个数据对应一个唯一的时间)、多信息量(传统的实时监测系统有数千个监测点,一个监测点每秒产生数据,每天产生几十GB的数据)等典型特征。面对这种数据生成速度快、量大、时间依赖的数据特性,传统的关系数据库无法有效地存储和处理数据,因此迫切需要一个专门用于时间序列数据的数据库系统,即时间序列数据库。深化国内时间序列数据库自主研发当前,新一轮科技革命和产业转型正在快速推进,企业数字化进程正在加快。数据库是核心软件,实现本地化是必不可少的。UF积极推进软件国产化工作,并与清华大学(软件学院)合作建立了时间序列数据和物联网应用联合研究中心。在清华大学自主研发的国内第一个开源时间序列数据库Apache IoTDB的基础上,用友自主研发了具有专用企业服务能力的商用版时间序列数据库-TimensionDB。TimensionDB是一个轻量级、高性能且易于使用的时间序列数据管理引擎,可快速接收、存储和处理大量广泛使用的时间序列数据。(例如:智能电表、发电设备的实时监控)、石化(如油井、运输管道和运输车队的实时监控)、智能城市(如实时道路状况、刺刀数据和交叉路口交通的实时监控)、智能安全(如:建筑门禁、车辆管理、检修孔、电子围栏监控)、车联网(如速度、电机、动力电池、驾驶习惯等数据的实时监控)、金融(如ATM、POS机、交易记录等数据的实时监控)等行业。用友通过实现相关基础技术组件的自主、安全、可控,建立国产化数据库的创新模式,充分发挥国产化软件企业从数智化管理、数智化经营到数智化商业创新的替代价值,真正帮助大型企业实现价值化国产替代。性能卓越的高速处理海量数据的收集、存储、检索一直是数据库面临的难点,用友时间序列数据库可以实现高性能的数据读写,可以实时分析数据,高速处理海量数据,具有五大核心优势。基于tLSM算法的高写入性能结合两级LSM,在任何情况下都可以轻松实现每台机器1000万个数据点的高速写入能力,实现百万级智能物联网设备接入和高速写入。针对硬件成本低的时间序列数据设计和优化的TsFile存储格式,支持多种数据类型和相应的SNAPPY、LZ4、GZIP、SDT等压缩算法,可实现1150甚至更高的压缩比.高压缩比的硬盘存储将使十亿个数据点的存储成本降至1.4元以下,大大降低了硬件成本。查询速度快的友定时数据查询引擎采用列式存储、预计算和索引技术,有效减少了数据查询时读取的数据量,大大减少了磁盘I/O次数,轻松实现了10亿级数据量、千万数据点查询的毫秒级响应。分析能力强的分析引擎基于好友的深厚,自主研发高性能的原分析引擎和分析,提供方便的维管理和分析脚本管理能力;简洁的DSL语法,使零基础员工可以轻松执行业务数据的复杂多维分析。扩展能力好的弹性伸缩采用大规模并行处理(MPP)架构和火山模型进行数据处理,具有很高的扩展性,无需在秒级增加节点进行数据迁移,适应不同规模时间序列数据的存储和分析需求。五场景应用激发数据元素价值,促进业务发展UF时序数据库利用先进技术和分析引擎,创建轻量级、高性能的数据库,深入挖掘不同的应用场景,充分激发不同行业、不同场景下数据元素价值。使企业能够实现高质量的发展。场景1:物联网智能制造分析时间序列数据助力智能制造建设现代智能工厂在制造业中,数字化工厂需要IT系统与智能设备的集成与连接,通过终端设备和传感器,如生产数据的实时采集与分析,设备故障的预警处理等。实现对生产现场的实时监控。工业数据的收集需要时间戳,大量的工业数据建模、工业知识组件和算法组件都采用时间序列数据作为输入数据,对时间序列数据库的需求和应用更加多样化。用友时序数据库实现工业数据的高性能采集入库、高效数据分析,为企业管理层决策提供数据支持,帮助用户通过持续优化生产管理流程释放优质生产能力,实体制造业从粗放式经营模式出发,生产设备网络化、现场管理数字化、支持决策运营向集约型现代智能化工厂转型。场景2:应用运维监控集成应用运维实时监控,全球控制系统运维状态在互联网行业中,互联网企业一般对大型应用集群和机房设备进行监控,实时关注设备运行状态、资源利用率和业务趋势。必须实现数据操作和自动化开发操作维护。通过时序数据库,可实现每日1万亿条监测指标数据写入,并支持多种时序异常类型的检测报警,直观展示异常情况,运维人员易于识别异常,报警策略设定简单,业务人员易于掌握。场景3:物联网车联网分析物联网传感器时序数据分析帮助所有互联网在新能源汽车行业,制造商一般需要工厂车辆进行车辆性能分析,通过在车辆上安装传感器,实时收集车辆行驶过程中车辆的运行状态和其他监控信息。传感器数据通过窄带物联网传输到数据中心。(TimensionDB)通过多维分析引擎在数据中心服务器上进行复杂的计算和分析,实现数百万智能物联网设备访问和快速读写,每秒可写入超过1000万个数据点。情景4:企业低碳转型数字化能力支持低碳经济、绿色发展和产业转型在风电行业,企业一般都有多台风力涡轮机,每台发电机都有数百种传感器,收集发电机的工作状态、工作环境中的风速等信息。为了保证发电机的正常运行,及时对发电机进行监测分析,企业需要收集这些传感器信息,在发电机工作环境中进行部分计算分析,然后将收集到的原始信息上传到数据中心。UF时间序列数据库可以以极低的成本满足企业海量数据的高速存储,并以数字智能能力支持企业绿色发展。场景5:基于用户行为的行为分析,实时反馈的交付效果,优化交付策略在广告行业中,企业往往需要通过日志或其他方式对交付数据进行实时分析和监控,并将原始指标数据进行收集和实时计算,将实时计算的结果数据存储在时间数据库中。实现实时反馈的交付效果。通过多维时间序列预测算法,利用多个指标之间的相关性,与传统的预测算法相比,它大大提高了预测的准确性,帮助企业优化战略。数据库作为组织、存储、管理和分析数据的系统,在信息系统软硬件之间起着承开的作用,是IT行业的重要基础软件,随着国产化战略的深化,数据库国产化进程也在不断加快,用友时间序列数据库不断创新,持续投入,深化行业和场景应用,激发数据要素的潜力,为企业高质量发展、国家数字经济新格局注入强大动力。