计算机论文
infobright适用于数据仓库场合
时间:2022-03-14 20:06 所属分类:计算机论文 点击次数:
一、技术特点。
SQL支持ANSISQL-92标准和SQL-99扩展标准中VIEW和存储过程的部分。
1.灵活的schema支持。支持所有schema设计;
2.行业标准接口。
支持ODBC、JDBC、本地连接等标准数据库接口;
3.API接口支持的API接口包括C、C++、C#、Borlanddelphi(viadbexpress)、Eifel、Smaltalk、Java(withanativeJavaderimplentation)、Lisp、Perl、PHP、Python、Ruby、Realbasic、Freeebasic、Andetcl;
4.DML支持。
5.并发用户数。支持最多500个数据库用户,32个并发查询(视CPU核心数和内存大小而定);
6.操作系统支持。Windowserver2003/2008(64-bit,32-bit),Solaris10(64-bit),Redhaterpriselinux5(64-bit),Noveliselinuxerprise10,redhaterpriselinux5advanerverver(64-bit),
7.处理器支持。Intel和AMDX86架构服务器至少4G内存(建议16G内存或以上)
8.数据导入支持。Infobright企业版支持两种数据导入方式。通过文本导入MySQL,或通过文本和二进制文件导入Infobright(最高280GB/小时)。
2.在线分析。
无论您的公司是在线广告网络、零售商、移动广告服务提供商还是任何其他制造业,分析的重要性日益增加,了解您的网站性能、客户访问行为、评估广告和营销活动的效果,并分析成功与失败之间的差异,这可以使您的企业与竞争对手之间的差距,取得最终的胜利。这需要您有效地利用大量来自网页和离线的数据。Infobright允许您以低成本轻松获得此能力。与其他类似的方案相比,Infobright成本低,管理简单,降低了您获得竞争优势的门槛。
3.数据集市(DataMart)
数据市场通常被定义为包含特定应用程序分析的数据仓库。其分析应用程序与用户的业务紧密相连,具有较强的专业特点,因此通常针对集团内的特定部门进行建设。在过去的几年里,数据市场系统的数量迅速增长,这是由商业用户快速查询的需求驱动的。
过去,数据市场项目由集团IT部门统一实施,但现在越来越多的集团内部用户部门实施数据市场项目,内部IT经理担任实施负责人,以确保数据市场的功能和需求一致。
二、Infobright有几个优点:
1.高压缩比,平均压缩比可达10:1,甚至40:1。我用infobright将3.1G数据存储到不到300m。
2.列存储,即使数据量很大,查询速度也很快。对于数据仓库,没有一套可以处理海量数据。
3.随着数据的扩展,无需构建索引,以避免维护索引和索引的问题。压缩和存储每列数据块,记录每个知识网格节点块中的统计信息,而不是索引,加速搜索。
4.一台服务器可以有效地读写30T数据。它是可扩展的,这意味着对于相同的查询,当数据量为10T时,它不应该比1T数据慢太多,基本上在一个数量级。
与mysql相比:
1.infobright适用于数据仓库场合,即非事务、非实时、非多并发;主要分析;存储既定事实(基本不变),如日志或大量数据总结。因此,它不适合处理网站用户的要求。事实上,它比mysql慢得多,但它比mysql快100W。
2.mysql的总数据文件通常比实际数据占用更多的空间,因为它有索引。infobright的压缩能力很强,按列按不同类型的数据压缩。
3.服务形式和接口与mysql一致。infobright服务可以通过类似mysql的方式启用,然后连接mysql的原始应用可以通过类似的方式连接和查询infobright。这是熟练mysql的福音,学习成本基本为0。
infobright有两个发布版:开源ICE和闭源商用IEE。ICE提供了足够的功能,但INSERT、DELETE、UPDATE只能LOADATAINFILE。据说IEE除了提供更充分的功能外,查询速度也更快。
三、缺点。
不支持数据更新:社区版Infobright只能通过LOADDATAINFILE导入数据,不支持INSERT、UPDATE、DELETE。
不支持高并发:只能支持10多个并发查询。