全部标签

博客

最新随机最多浏览最多喜欢最多评论

YugaByte DB 将企业版100%开源还不收费

在越来越多的数据库选择变更开源协议以防止被“滥用”的时候，这款数据库为何反其道而行之，选择将包括企业版在内的功能 100% 完全开源？ YugaByte DB 是一个高性能、云原生的分布式 SQL 数据库，包括企业版和社区版两个版本。相较于社区版，企业版提供了更丰富的功能，不过这些功能收费且闭源。但就在前两天，YugaByte DB 创始人兼 CTO Karthik Ranganathan 宣布 …
博客
- 0
- 0
- 205
summer19年7月26日
数据管理平台 Apache Geode 1.10.0 发布

Apache Geode 1.10.0 发布了。Geode 是一个数据管理平台，提供实时的、一致的、贯穿整个云架构地访问数据关键型应用，具有高并发处理能力。新版本包含许多改进和错误修复，更新内容如下：显著提高了连接池的性能，同时减少了套接字资源的数量。现在可以通过千分尺（micrometer）获得更多统计信息。使用 NIO 改善对等 SSL 连接的可伸缩性。启用实验性集群管理 API。…
博客
- 0
- 0
- 88
hunterho19年9月28日
DataWarehouse- 从面试定位自己的水平

1.讲一下什么是维度表和事实表。用户资料表算是什么类型表。 2. 维度建模属于第几范式，让你对维度建模改进，有什么思路吗。 3. 了解数据血缘分析吗，让你实现的话有什么技术方案，感觉难点在哪。 4. 了解数据分层吗，讲一下分四层或者五层各有什么优劣。自己摸你一个场景，给出不同的方案。 5. 数据口径不一致的问题一般在什么情况下会发生，怎么避免。
博客
- 0
- 0
- 76
牛肉丸没牛肉19年8月18日
PostgreSQL 13 Beta 1

PostgreSQL 13 中有许多新功能可以帮助提高 PostgreSQL 的整体性能，同时使开发应用程序变得更加容易。 B 树索引（PostgreSQL 的标准索引）在处理重复数据方面得到了改进。这些增强功能有助于缩小索引大小并提高查找速度，特别是对于包含重复值的索引。 PostgreSQL 13 增加了增量排序，当从查询的早期部分排序的数据已经被排序时，它可以加速数据的排序。此外，带有 OR…
博客
- 0
- 0
- 207
summer20年5月23日
MySQL 8.0.18 稳定版，Hash Join 如期而至

MySQL 8.0.18 稳定版(GA)已于昨日正式发布，Hash Join 也如期而至。快速浏览一下这个版本的亮点！ 1.Hash Join Hash Join 不需要任何索引来执行，并且在大多数情况下比当前的块嵌套循环算法更有效。 2.EXPLAIN ANALYZE EXPLAIN ANALYZE 将运行查询，然后生成 EXPLAIN 输出，以及有关优化程序估计如何与实际执行相…
博客
- 0
- 0
- 85
hunterho19年10月18日
分布式NewSQL数据库 TiDB 4.0.0-beta

该版本更新内容如下： Improvements Index Join通过考虑驱动表和从动表的行数来提高计算成本的准确性＃12085 当索引中可以完全覆盖查询中涉及的列时，提高性能＃12022 通过支持索引合并功能＃10121 ＃10512 ＃11245 ＃122248 ＃12248 ＃12305 ＃12305 ＃12305 ＃12248 ＃12248 ＃12305 ＃12305 ＃1…
博客
- 0
- 0
- 116
summer20年1月20日
MySQL- 用Navicat通过隧道连接到远程数据库

在企业中，为了安全地使用服务器，常常是用通过堡垒机才能连接到企业内部的服务器，当然也包括数据库。于是我们时时需要通过堡垒机打隧道连到数据库，下面展示如何使用xshell用Navicat通过隧道连接到远程数据库。 1.用xshell与堡垒机建立连接输入堡垒机的ip，你登陆的用户名及导入你的public key文件，pem或者是ppk后缀的文件 2.添加隧道信息点击隧道 ->…
博客
- 0
- 0
- 87
牛肉丸没牛肉19年8月18日
MySQL- 常用的MySQL函数，指令等

MySQL查看版本： status；或者 select version(); //select @@version MySQL昨天，一周前，一月前，一年前的数据这里主要用到了　　DATE_SUB(date,INTERVAL expr unit) select DATE_SUB(NOW(),INTERVAL 1 DAY); select DATE_SUB(NOW(),INTE…
博客
- 0
- 0
- 101
牛肉丸没牛肉19年8月18日
去中心数据库BigChainDB 2.0.0 发布

BigChainDB 2.0.0 发布了，主要内容如下：升级 Tendermint 到 0.31.5 版本Tymlez 和 RIDDLE&CODE 进行了更改BigChainDB 填补了去中心生态系统中的一个空白：是一个可用的去中心数据库。它具有每秒百万次写操作，存储PB级别的数据和亚秒级响应时间的性能。BigChai…
博客
- 0
- 0
- 89
hunterho19年10月9日
Sqoop- sqoop将mysql数据表导入到hive报错

sqoop将mysql数据表导入到hive报错 [root@ip-172-32-1-221 lib]# sqoop import --connect jdbc:mysql://54.223.175.12:3308/gxt3 --username guesttest --password guesttest --table ecomaccessv3 -m 1 --hive-import…
博客
- 0
- 0
- 132
牛肉丸没牛肉19年8月18日
流处理框架：Apache Flink 1.9.3

Apache Flink 是高效和分布式的通用数据处理平台。 Apache Flink 声明式的数据分析开源系统，结合了分布式 MapReduce 类平台的高效，灵活的编程和扩展性。同时在并行数据库发现查询优化方案。要求 Unix 类环境(Linux, Mac OS X, Cygwin) git Maven (at least version 3.0.4) Java 6, 7 or 8 (Not…
博客
- 0
- 0
- 90
summer20年4月28日
MySQL- SQL UNION 和 UNION ALL 操作符

在数据库查询中我们常常遇到这样一种情况，想把两个子查询的结果合并在一起变成一条 sql 去执行而不是多个sql分次执行。只是后我们就可以使用 UNION 和 UNION ALL 操作符来操作了。 SQL UNION 操作符 1 2 3 UNION 操作符用于合并两个或多个 SELECT 语句的结果集。请注意，UNION 内部的 SELECT 语句必须拥有相同数量的列。列也必须拥有相…
博客
- 0
- 0
- 67
牛肉丸没牛肉19年8月18日
物联网时序数据库：Apache IoTDB 0.10.0

IoTDB是针对时间序列数据收集、存储与分析一体化的数据管理引擎。它具有体量轻、性能高、易使用的特点，完美对接Hadoop与Spark生态，适用于工业物联网应用中海量时间序列数据高速写入和复杂分析查询的需求。主要功能与特点 IoTDB具有以下特点：灵活的部署方式云端一键部署终端解压即用终端-云端无缝连接（数据云端同步工具）低硬件成本的存储解决方案高压缩比的磁盘存储（10亿数据点硬盘成…
博客
- 0
- 0
- 519
summer20年7月1日
Hadoop 生态数据存储系统：Apache Kudu 1.12.0

Kudu 是一个支持结构化数据的开源存储引擎，具有低延迟随机读取与高效分析读取模式。它基于 Apache Hadoop 生态系设计，并支持与 Apache 软件基金会其它数据分析项目集成。此版本带来了一些新功能、改进、优化和错误修复：新功能 Kudu 现在通过集成 Apache Ranger 来支持原生细粒度认证 Kudu 的 Web UI 现在支持通过 Apache Knox 进行代理 Ku…
博客
- 0
- 0
- 234
summer20年5月25日
HoloClean：半自动数据修复框架

脏数据和错误数据是数据分析工作的主要瓶颈，数据清理和修复约占数据科学家工作的60％。最近出现一个新的开源项目 HoloClean ，这是一个半自动数据修复框架，依赖于统计学习和推理来修复结构化数据中的错误。HoloClean 建立在弱监督范式的基础上，利用各种信号，包括用户定义的启发式规则（如通用数据完整性约束）和外部词典，来修复错误的数据。HoloClean 关键特性：它是第一个整体数据清理框架…
博客
- 0
- 0
- 148
hunterho19年8月24日
华为将开源其AI 原生数据库 GaussDB，挑战 Oracle

7月23 日，有消息称在正在进行的鲲鹏计算产业论坛上，华为宣布将开源其 GaussDB 数据库。 GaussDB 数据库是今年 5 月 15 日华为在北京面向全球发布的，它被称为全球首个人工智能原生（AI-Native）数据库。根据华为的介绍，GaussDB 具有两大革命性突破：首次将 AI 技术融入分布式数据库的全生命周期，实现自运维、自管理、自调优、故障自诊断和自愈。在交易、分析和混合负载…
博客
- 0
- 0
- 211
hunterho19年7月27日
JAVA- 数据库连接池原理

第一次Java程序要在MySQL中执行一条语句，那么就必须建立一个Connection对象，代表了与MySQL数据库的连接通过直接发送你要执行的SQL语句之后，就会调用Connection.close()来关闭和销毁与数据库的连接。为什么要立即关闭呢？因为数据库的连接是一种很重的资源，代表了网络连接、IO等资源。所以如果不是用的话就需要尽早关闭，以避免资源浪费。 JDBC的劣势与不足…
Java
- 0
- 0
- 108
牛肉丸没牛肉19年8月18日
Redis- 内存数据库Redis之安装部署

内存数据库Redis之安装部署 Redis是一款非关系型，key-value存储的内存数据库，Redis数据库完全在内存中，使用磁盘仅用于持久性。Redis的速度非常快，每秒能执行约11万集合，每秒约81000+条记录。支持丰富的数据类型：Redis支持字符串、列表、集合、有序集合散列数据类型，这使得它非常容易解决各种各样的问题。把redis看成java的一个hashmap你就入门…
博客
- 0
- 0
- 129
牛肉丸没牛肉19年8月17日
Springboot- pagehelper使用

1.添加pagehelper依赖 <dependency> <groupId>org.github.pagehelper</groupId> <artifactId>pagehelper-spring-boot-starter</artifactId> <version>1.3.2</version>…
博客
- 0
- 0
- 87
牛肉丸没牛肉19年8月18日
分布式数据库Apache HBase 1.4.11

HBase – Hadoop Database，是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用 HBase 技术可在廉价 PC Server 上搭建起大规模结构化存储集群。这是一个维护版本，主要更新包括： HBASE-22784 副本拓扑中的集群仅具有来自副本的传入写入从未清除 WAL。 HBASE-23101 批量加载文件的副本必须处理循环拓扑，包括对 Region…
博客
- 0
- 0
- 99
summer19年10月27日
PostgreSQL 12 正式发布

PostgreSQL 12 已经发布，该版本在各方面都得到了加强，包括显著地提升查询性能，特别是对大数据集，总的空间利用率方面。这个版本为应用程序开发人员提供了更多的功能，比如对 SQL/JSON 路径表达式的支持，优化公共表达式（WITH查询）的执行，以及对生成列的支持等。 PostgreSQL 除了持续对 PostgreSQL 系统的可扩展性、稳健性进行开发外，还更多地在本地化、授…
博客
- 0
- 0
- 118
hunterho19年10月4日
数据仓库- 建模理念

数仓建模的目标访问性能：能够快速查询所需的数据，减少数据I/O 数据成本：减少不必要的数据冗余，实现计算结果数据复用，降低大数据系统中的存储成本和计算成本。使用效率：改善用户使用体验，提高使用数据的效率数据质量：改善数据统计口径的不一致性，减少数据计算错误的可性，提供高质量的、一致的数据访问平台大数据的数仓建模需要通过建模的方法更好的组织、存储数据、以便在性能、…
博客
- 0
- 0
- 80
牛肉丸没牛肉19年8月18日
世界上使用量最大的数据库引擎SQLite 3.31.0

SQLite 是一个 C 实现的 SQL 数据库引擎，它的特点是小型、快速、自包含、高可靠性和功能齐全。SQLite 嵌入在所有手机和大多数计算机中，也捆绑在为数众多的其它应用中，是世界上使用量最大的数据库引擎。作为 2020 年的第一个大版本，SQLite 3.31.0 已完成发布，该版本主要功能之一是对生成/计算列的支持。具体更新内容如下：添加对生成列的支持。添加 sqlite3_har…
企业应用
- 0
- 0
- 107
summer20年1月30日
最新数据库排行：Oracle 分数增长最多，Redis 持续下降

DB-Engines 数据库流行度排行榜 7 月更新已发布，排名前二十如下：总体排名依旧是没有什么变化，虽然分数基本都有所增加，但可以看到，和去年同时期的相比，今年增加的分数稍显疲软。哪怕是分数增长最多的 Oracle，在 6 月也只是增加了 22.04 分。至于其他数据库，分数方面没有亮眼的关注点，增长和下降的幅度都不大。不过值得关注的是 Redis，它已经连续几个月都呈现出下降的势头，分数…
博客
- 0
- 0
- 105
hunterho19年7月3日