全部标签

博客

最新随机最多浏览最多喜欢最多评论

基于SQL的开源BI软件Poli 0.9.0 发布

Poli 0.9.0 发布 Poli是一个简单易用的开源BI软件，专为SQL用户设计。 v0.9.0更新亮点用户自定义属性与动态查询语句连用，实现行级安全组件现可使用方向键调整位置新选项：点击过滤器，图表自动过滤新选项：开关table组件分页 Bug修复详情查看更新说明自托管，安装部署简便，5分钟内便可运行连接到任何支持JDBC驱动程序的数据库：PostgreSQL，Oracle，S…
博客
- 0
- 1
- 123
typhoon19年7月23日
Linux安装Scala(小白版)

一、下载Scala安装包从scala官方网站地址：http://www.scala-lang.org/download/下载scala二进制包，以2.12.6版本为例二、安装 1、将下载的二进制包移动到/usr/local目录，解压缩文件包 tar zxvf scala-2.12.6.tgz mv scala-2.12.6 scala //重命名目录 2、设置环境变量 vi /etc/pro…
博客
- 0
- 1
- 63
SparkGor19年8月1日
pyspark-pycharm本地运行pyspark程序报错org.apache.spark.SparkException: Python worker failed to connect back.

新配置的本地pyspark环境，本地运行pyspark程序报错，org.apache.spark.SparkException: Python worker failed to connect back. 解决办法1：在pycharm上运行时，Edit Configurations，配置环境变量 PYSPARK_PYTHON=${windows上安装的python路径}python.exe 解决…
博客
- 2
- 1
- 142
牛肉丸没牛肉24年3月2日
RISC-V 基金会批准 RISC-V 基础指令集架构与特权架构规范

近日，RISC-V 基金会宣布批准 RISC-V 基础指令集架构与特权架构规范，为 RISC-V 的可扩展性进一步奠定了基础。开源指令集 RISC-V 相比其它指令集可以自由地用于任何目的，允许任何人设计、制造和销售 RISC-V 芯片和软件，因为这些特点，其相继吸引来 IBM、NXP、西部数据、英伟达、高通、三星、谷歌、华为与特斯拉等 100 多家科技公司加入其阵营，行业也不断在围绕它构建生态…
博客
- 0
- 0
- 94
summer19年7月12日
Hadoop- HDFS的Safemode

Hadoop- HDFS的Safemode hadoop启动时，NameNode启动完后就开始进入安全模式，等待DataNode向NameNode发送block report ，当datanode blocks / total blocks = 99.99%，此时安全模式才会退出安全模式下的操作：可以查看文件系统的文件在安全模式期间我们有些操作是不能进行的，比如不能改变文件系统…
博客
- 0
- 0
- 100
牛肉丸没牛肉19年8月18日
CDH- 集群时间同步ntp问题解决

在CDH集群中发现有两台机器获取不到心跳（），导致监控不了机器状态，出现告警可以使用ntpstat检查与ntp 服务器的时间偏差状态使用 ntpstat 发现没有同步到ntp时间服务器，运行 ntpdate ip 添加时间同步服务器出现报错 the NTP socket is in use, exiting 网上搜了一下，大部分的建议是…
博客
- 0
- 0
- 67
牛肉丸没牛肉19年8月18日
Spark- 数据清洗

输入输出转化工具类 package com.rz.mobile_tag.log import org.apache.spark.sql.Row import org.apache.spark.sql.types.{LongType, StringType, StructField, StructType} /** * 访问日志转换（输入==>输出）工具类 */ object A…
博客
- 0
- 0
- 102
牛肉丸没牛肉19年8月18日
大数据- 自定义Log4j日记

1.新建一个java project，在src下新建一个lib文件夹和 rescources 文件夹，resources文件夹不能命名错误。点击File——》project Structure...打开根据下图操作把相关jar包放进lib文件夹里并绑定。新建一个java文件 Log4jTest.java 和 HadoopLog4j.java 1 2 3 4 5 6…
博客
- 0
- 0
- 49
牛肉丸没牛肉19年8月17日
Spark- 性能优化

由于Spark 的计算本质是基于内存的，所以Spark的性能城西的性能可能因为集群中的任何因素出现瓶颈：CPU、网络带宽、或者是内存。如果内存能够容得下所有的数据，那么网络传输和通信就会导致性能出现频惊。但是如果内存比较紧张，不足以放下所有的数据（比如在针对10亿以上的数据量进行计算时），还是需要对内存的使用进行性能优化的，比如说使用一些手段来减少内存的消耗。 Spark性能优化，其…
博客
- 0
- 0
- 78
牛肉丸没牛肉19年8月18日
Spark- Action实战

Spark- Action实战 package cn.rzlee.spark.core import org.apache.spark.rdd.RDD import org.apache.spark.{SparkConf, SparkContext} object ActionOperation { def main(args: Array[String]): Unit…
博客
- 0
- 0
- 69
牛肉丸没牛肉19年8月18日
数据探查与可视化平台Superset 0.34.1 发布

Superset 0.34.1 发布了。Superset 是一个数据探查与可视化平台（曾用名 Panoramix、Caravel ），该工具在可视化、易用性和交互性上非常有特色，用户可以轻松对数据进行可视化分析，目前已进入 Apache 孵化器。此版本更新内容包括：修复 Durid 中缺失时间序列数据点并在线表中显示为怪异值的问题注解添加对过滤器框的支持修复 tox lint…
博客
- 0
- 0
- 108
summer19年10月14日
Hadoop- 流量汇总程序之如何实现hadoop的序列化接口及代码实现

流量汇总程序需求统计每一个用户（手机号）锁耗费的总上行流量、下行流量、总流量。流程剖析阶段：map 读取一行数据，切分字段，抽取手机号，上行流量，下行流量 context.write(手机号，bean) 阶段：reduce 汇总遍历每个bean，将其中的上行流量，下行流量分别累加，得到一个新的bean context.write(手机号，新bean)；代码实现…
博客
- 0
- 0
- 82
牛肉丸没牛肉19年8月17日
Spark- 计算每个学科最受欢迎的老师

日志类型测试数据 http://bigdata.myit.com/zhangsan http://bigdata.myit.com/zhangsan http://bigdata.myit.com/zhangsan http://bigdata.myit.com/zhangsan http://bigdata.myit.com/zhangsan http://java.myit.c…
博客
- 0
- 0
- 93
牛肉丸没牛肉19年8月18日
Springboot- Spring缓存抽象学习笔记

Spring缓存作用准备： 1、准备数据（准备一个有数据的库和表/导入数据库文件，准备好表和表里面的数据） 2、创建javaBean封装数据 3、整合MyBatis操作数据库( 这里用MyBatis) 1，配置数据源信息 2、使用注解版的MyBatis； 1）、@MapperScan指定需要扫描的Mapper接口所在的包创建一个springboot项目 -》选择依赖(…
Java
- 0
- 0
- 109
牛肉丸没牛肉19年8月18日
基于 Python 的开源量化交易平台开发框架 VN.PY 2.1.2

vn.py - 基于 Python 的开源交易平台开发框架 vn.py 项目起源于国内私募的自主交易系统，2015 年初启动时只是单纯的交易 API 接口的 Python 封装。随着业内关注度的上升和社区不断的贡献，目前已经一步步成长为一套全面的交易程序开发框架，用户群体也日渐多样化，包括私募基金、证券自营和资管、期货资管和子公司、高校研究机构、个人投资者等。丰富的 Python 交易和数据 A…
Python
- 0
- 0
- 176
summer20年4月16日
GitHub|正在移除与色情应用 DeepNude 相关的仓库

DeepNude 是一款付费应用程序，官方对其描述是“AI X 光”。通过使用类似 deepfakes 的深度学习技术，DeepNude 使用女性裸照训练之后可将图像中女性身上的衣服替换掉，创造出几可乱真的合成裸照，也就是大家所说的“一键脱衣”。但由于此项目产生的效果过于低俗且导致的负面影响巨大，在引起广泛的争议后，官方团队选择将该项目关闭。虽然团队下架了此项目，但有人根据已下载的程序进行了逆…
博客
- 0
- 0
- 173
summer19年7月12日
Hadoop- MapReduce在实际应用中常见的调优

1、Reduce Task Number 通常来说一个block就对应一个map任务进行处理，reduce任务如果人工不去设置干预的话就一个reduce。reduce任务的个数可以通过在程序中设置 job.setNumReduceTasks(个数); ，也可在配置文件上设置reduce任务个数，默认为1，或者在代码config中配置 Configuration configura…
博客
- 0
- 0
- 79
牛肉丸没牛肉19年8月18日
CDH- CDH大数据集群运维

CDH前端CM监控不正常（未解决） Request to the Service Monitor failed. This may cause slow page responses. View the status of the Service Monitor. Request to the Host Monitor failed. This may cause sl…
博客
- 0
- 0
- 229
牛肉丸没牛肉19年8月18日
Hadoop- HDFS的API操作

1、引入依赖 <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-client</artifactId> <version>2.6.1</version> </dependency> 注：如需手动引入ja…
博客
- 0
- 0
- 134
牛肉丸没牛肉19年8月18日
Zookeeper- Error contacting service. It is probably not running解决方案和原理

搭建启动Zookeeper集群出现Error contacting service. It is probably not running解决方案和原理 1.关闭防火墙 1 2 3 4 [root@srv01 bin]# zkServer.sh start JMX enabled by default Using config: /usr/zookeeper/bin/../con…
博客
- 0
- 0
- 137
牛肉丸没牛肉19年8月17日
Hive- 表

在hive中表的类型：管理表和托管表（外部表）。内部表也称之为MANAGER_TABLE,默认存储在/user/hive/warehouse下，也可以通过location指定；删除表时，会删除表的数据以及元数据；外部表称之为EXTERNAL_TABLE。在创建表时可以自己指定目录位置（LOCATION），数据存储所在的目录；删除表时，只会删除元数据不会删除表数据；创建外部表实例…
博客
- 0
- 0
- 104
牛肉丸没牛肉19年8月18日
Spark- RDD持久化

官方原文： RDD Persistence One of the most important capabilities in Spark is persisting (or caching) a dataset in memory across operations. When you persist an RDD, each node stores any partitions …
博客
- 0
- 0
- 91
牛肉丸没牛肉19年8月18日
聚焦表单设计与数据交互 SpreadJS v13.0 发布，大幅提升工作效率

纯前端表格控件 SpreadJS，是一款成功应用于华为、招商银行、天弘基金、苏宁易购等国内外知名企业的前端开发工具，其带来的价值不仅体现在帮助开发人员在其Web应用程序中快速构建 Web Excel 、数据填报、在线文档、图表公式联动和类 Excel UI 设计等功能模块，更帮助企业大幅降低数据处理成本，提升企业信息化水平和项目交付能力。伴随着 SpreadJS V13.0 的发布，其…
博客
- 0
- 0
- 92
hunterho19年10月18日
Redis- 内存数据库Redis之安装部署

内存数据库Redis之安装部署 Redis是一款非关系型，key-value存储的内存数据库，Redis数据库完全在内存中，使用磁盘仅用于持久性。Redis的速度非常快，每秒能执行约11万集合，每秒约81000+条记录。支持丰富的数据类型：Redis支持字符串、列表、集合、有序集合散列数据类型，这使得它非常容易解决各种各样的问题。把redis看成java的一个hashmap你就入门…
博客
- 0
- 0
- 107
牛肉丸没牛肉19年8月17日