没有找到合适的产品?
联系客服协助选型:023-68661681
提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
原创|行业资讯|编辑:陈俊吉|2016-05-30 10:32:17.000|阅读 213 次
概述:IBM Big SQL 是SQL on Hadoop 的方案,它的核心引擎沿用了DB2的技术,因此,Big SQL的优化与DB2类似。由于Big SQL本身不拥有数据(数据在HDFS),所以它自身的优化选项要比DB2少,但同时要注意优化Hadoop/HDFS。
# 界面/图表报表/文档/IDE等千款热门软控件火热销售中 >>
对于Big SQL的优化,您需要注意以下六个方面:
在进行集群的物理设计需要考虑数据节点的配置要一致,避免某个数据节点性能短板而影响整体性能。而对于管理节点,它虽然不保存业务数据,但作为管理服务和BigSQL系统包空间的存储,也需要配置一定数量的磁盘。另外,CPU/内存/磁盘的配比要合理,用户可以参考以下配置作为物理设计的基础:
CPU:16核
内存:128GB
硬盘:600GB * 2块(系统使用),数据节点3TB * 12块/管理节点3TB* 12块
为了达到更高的I/O吞吐量,您需要尽量将数据分到多块磁盘上。具体来说,您需要这样的设置:
注意bigsql_db_dir 目录在Big SQL的Head Node和Worker Node都需要具体同样的路径。
Big SQL支持多种格式,包括TEXT、SEQUENCE、RC、PARQUET、Avro、ORC等存储格式。BigSQL会自动根据文件格式选择相应的Reader以求最佳性能。选择存储格式需要在加载速度/压缩比/查询性能/收集统计信息速度之间折中。不同的存储格式之间对比请参考《BigSQL支持的存储格式和对应的建表语句》。
对于Big SQL,Parquet通常是最优的存储格式。
每个节点上Big SQL所需内存等同于DB2的INSTANCE_MEMORY,推荐的取值范围是系统可用内存的25%~75%。需要注意的是Big SQL和MapReduce之间是共用系统内存的,如果Big SQL分配内存较多,那么MapReduce可用内存就少了,就有可能影响MR作业的性能。
Big SQL的Buffer pool只用于缓存临时数据而不缓存用户数据,这点与DB2有很大差异,对于排序堆相关的管理则与DB2一致。建议开启STMM(自调优内存管理器)运行一段时间,然后在工作负载和STMM调优的参数稳定之后再关闭。
Big SQL沿用了DB2的SQL重写和基于成本的优化等功能。对于优化器选择成本最低的执行计划,统计信息起到关键作用。因此,每次数据发生较大变化时需要及时收集对应表的统计信息。
另外,Big SQL自身不管理用户数据,因此也不支持创建和维护索引。但是,Big SQL支持创建Primary Key,Foreign Key等约束。在不用考虑Index的时候,尽可能为数据表指定PK,FK等,这些约束有助于优化器对SQL的优化。
考虑对数据量大,具有合适的分区键(如查询条件中需要使用“日期”字段)的表使用Range Partition。
选择合适的数据类型,特别注意需要将Hive的string类型默认映射到Big SQL是VARCHAR(32,672),加上其它字段绝大多数情况都会超过32K的PageSize,从而导致性能下降。建议将Hive的string显式地转成较小的VARCHAR (n)。
如果并发查询很多导致了CPU和内存过分竞争和系统性能下降,则要考虑使用WLM(Workload Management)对并发的查询数据进行限制。
详情请咨询“”!
客服热线:023-66090381
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@obta.cn
在自动化GUI测试领域,面对日益复杂的动态Web界面和频繁变化的软件控件,传统的单一对象识别技术和脆弱易碎的测试脚本已成为效率提升的主要瓶颈。Web测试工具TestComplete通过完整的对象识别引擎以及AI驱动的自我修复来降低维护成本,保障大规模自动化测试套件的长期可靠运行。本文将介绍这些技术以及其在实际场景中的应用。
还在为脆弱的测试环境、强外部依赖和低效的测试复用拖慢交付而头疼?尤其在银行、医疗、制造等关键领域,传统的端到端测试常因环境不稳、接口难模拟、用例难共享而举步维艰。灰盒级SOA测试工具Parasoft SOAtest以可视化编排简化复杂测试流程,用环境虚拟化消除外部依赖,更通过组件复用实现跨国测试资产共享,让端到端测试从被动排查转变为主动防御。
作为面向工程软件开发者的高级渲染解决方案,HOOPS Luminate将先进的实时渲染与物理级光线追踪完美结合,助力开发团队打造超越预期的视觉体验与交互性能。
HOOPS SDK产品组合为船舶及海工软件提供从CAD数据访问、可视化到跨平台协作的全流程支持。
工业4.0优选产品 | 商业智能和绩效管理软件领导者,帮助企业成为业绩最佳的分析驱动型企业
SPSS Modeler工业4.0优选产品 | 在历史数据中发现规律以预测未来事件,做出更好的决策,实现更好的成效
DB2 with BLU Acceleration使用动态内存中列式技术加速分析数据
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@obta.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢