计算话题 栏目下的全部文章

Java 结构化数据处理开源库 SPL

分类:计算话题 标签:,

现代Java应用架构越来越强调数据存储和处理分离,以获得更好的可维护性、可扩展性以及可移植性,比如火热的微服务就是一种典型。这种架构通常要求业务逻辑要在Java程序中实现,而不是像传统应用架构中放在数据库中。

有什么 Spark 的替代技术

分类:计算话题 标签:

HANA是常见的内存数据库,理论上足以替代Spark,但不开源这一点劝退了很多人。Sqlite是开源的内存数据库,但只支持嵌入式调用,数据量和计算性能都受到极大限制。Redis既开源又支持高性能大数据量,但计算能力严重不足,必须大量硬编码才能完成内存计算。

开源的 OLAP 服务器有什么好用的?

分类:计算话题 标签:

当前开源 OLAP 服务器仅能满足多维分析一方面的需求,而且主要基于 RDB 体系。这对于广泛的 OLAP 业务来说存在诸多限制。

有什么轻量级的大数据技术

分类:计算话题 标签:

流行的大数据技术有Hadoop, Storm, Hive、Spark等,这些都是大集群方案,适合有海量规模数据的巨大企业。实际上,流行的大数据技术通常也源自这类头部互联网企业。很多场景下,数据虽然也很多,但小集群甚至无集群就足够处理,远没多到这些巨大企业的规模 …

存储过程都有什么替代方案?

分类:计算话题 标签:

关于存储过程的缺点讨论由来已久。这里我们不妨再盘点一下存储过程的主要缺点。 移植性差 移植性是指存储过程能否从原有数据库方便移植到到另一类数据库上。存储过程缺乏让存储过程语法变得很不通用,很难移植且成本高昂。 编辑调试困难 存储 …

除了 DBLink 还有啥可以做跨库运算的

和DBLink原理类似的有Federated Database和Linked Server,这类数据库组件的配置都很复杂,而且大多数计算要先把数据取到本地,不能充分利用远程数据库的计算能力。Calcite是支持跨库运算的JAVA计算库,优点是配置简单,集成方便,代码开源,缺点是成熟度 …

有什么支持跨数据库运算的开源库

分类:计算话题 标签:

有些数据库自带跨数据库运算功能,比如DBlink和Linked Server,但都不开源,配置也复杂,而且大多数计算要先把数据取到本地,性能比较差。对于支持跨数据库运算的开源库,Scala可以充分利用数据库的计算能力,性能足够优秀,缺点是架构沉重,代码冗长,数 …

实现数据冷热分离用什么技术合适?

分类:计算话题 标签:

随着业务的发展,在数据分析(OLAP)应用中,数据库 / 数据仓库存储的数据越来越多,承担的计算任务越来越重,就会出现响应速度越来越慢的情况。仅仅依靠数据库扩容的办法解决这个问题是不可取的,一方面横向或纵向扩容的成本都很高;另一方面,一旦达到 …

ClickHouse 到底有多神?

分类:计算话题 标签:

ClickHouse(简称 CH)是最近很受关注的开源分析数据库,据说挺神的,做 OLAP 计算很快。很多被性能问题折磨的用户都有兴趣尝试一下。

高并发查询用 Elastic Search 合适吗?

与 SQL 数据库 / 数据仓库相比,作为搜索引擎的 Elastic Search 更适用于高并发查询。比如帐户明细查询,从几千万甚至上亿条历史数据中,查找一个帐户的几条到几千条明细数据。其主要特点是数据总量巨大、并发数量很多,且要求秒级的响应速度。SQL 体系的 …