大数据 大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。 在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。 人工智能 人工智能(Artificial Intelligence),英文缩写为AI。是新一轮科技革命和产业变革的重要驱动力量,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 人工智能是智能学科重要的组成部分,它企图了解智能的实质,并生产出一种新的能以与人类智能相似的方式做出反应的智能机器。人工智能是十分广泛的科学,包括机器人、语言识别、图像识别、自然语言处理、专家系统、机器学习,计算机视觉等。 **人工智能大模型带来的治理挑战也不容忽视。**马斯克指出,在人工智能机器学习面具....
定时任务 通过时间表达式这一方式来进行任务调度的被称为定时任务。 在平常的业务场景当中,经常有一些场景需要使用到定时任务,比如:在某个时间点会发送优惠券、发送短信等等的一些业务操作。又比如:比如一些支付系统,需要在每天的凌晨1点来进行对前一天的清算。 分类 单机定时任务 单机的容易实现,但应用于集群环境做分布式部署,就会带来重复执行 解决重复执行的方案有很多,比如加锁、数据库等,但是增加了很多非业务逻辑 分布式调度(分布式定时任务) 把需要处理的计划任务放入到统一的平台,实现集群管理调度与分布式部署的定时任务 叫做分布式定时任务 支持集群部署、高可用、并行调度、分片处理等 常见定时任务 单机:Java 自带的 java.util.Timer 类配置比较麻烦,时间延后问题 单机:ScheduledExecutorService 是基于线程池来进行设计的定时任务类,在这里每个调度的任务都会分配到线程池里的一个线程去执行该任务,并发执行,互不影响 单机:SpringBoot 框架自带 SpringBoot 使用注解方式开启定时任务 启动类里面 @EnableSc....
为什么要序列化? 序列化:把对象转化为可传输的字节序列过程称为序列化。 反序列化:把字节序列还原为对象的过程称为反序列化。 如果光看定义我想你很难一下子理解序列化的意义,那么我们可以从另一个角度来推导出什么是序列化, 那么究竟序列化的目的是什么? 其实序列化最终的目的是为了对象可以跨平台存储,和进行网络传输。而我们进行跨平台存储和网络传输的方式就是IO,而我们的IO支持的数据格式就是字节数组。 因为我们单方面的只把对象转成字节数组还不行,因为没有规则的字节数组我们是没办法把对象的本来面目还原回来的,所以我们必须在把对象转成字节数组的时候就制定一种规则(序列化),那么我们从IO流里面读出数据的时候再以这种规则把对象还原回来(反序列化)。 如果我们要把一栋房子从一个地方运输到另一个地方去,序列化就是我把房子拆成一个个的砖块放到车子里,然后留下一张房子原来结构的图纸,反序列化就是我们把房子运输到了目的地以后,根据图纸把一块块砖头还原成房子原来面目的过程。 MQ 使用场景 跨平台 、多语言、分布式事务、最终一致性 RPC调用上下游对接,数据源变动->通知下属 解耦:订单系统....
日志注意事项 日志颗粒度:(级别:DEBUG、INFO、WARNING、ERROR等) 日志格式化:方便阅读分析(时间戳、日志级别、请求ID、模块名称、错误信息等,统一使用Log4j、logback等) 异常处理:(捕获异常错误信息、堆栈跟踪等,以便于日后排查) 日志存储和管理:输出到文件、数据库、日志服务器等,确保合理的日志轮转和备份策略,有效的日志管理和监控机制。 敏感信息保护:在日志输出时,注意敏感信息的处理,如密码、个人身份信息等,应进行脱敏处理或者在合适的级别下去除。 日志审计和安全:对于敏感操作或重要日志事件,可以考虑加入审计日志,记录相关的操作细节和安全事件,以便追踪和监控系统的安全性。 性能影响:日志输出可能对系统的性能产生一定的影响,要谨慎选择日志输出的频率和内容,避免频繁的输出大量冗余信息。 异步日志:尽量采用异步方式进行,避免阻塞主线程,可以利用线程池等机制一部处理日志消息。(Logback默认情况下是同步输出日志,可以调整配置) SpringBoot3.X整合logback配置示例 SLF4J(Simple Logging Facade for Java) 把不....
ShardingSphere Apache ShardingSphere 是一套开源的分布式数据库中间件解决方案组成的生态圈,它由 JDBC、Proxy 和 Sidecar(规划中)这 3 款相互独立,却又能够混合部署配合使用的产品组成。 它们均提供标准化的数据分片、分布式事务和数据库治理功能,可适用于如 Java 同构、异构语言、云原生等各种多样化的应用场景。 三大组件对比 ShardingSphere-Sidecar(规划中,简单知道就行) 定位为 Kubernetes 的云原生数据库代理,以 Sidecar 的形式代理所有对数据库的访问 通过无中心、零侵入的方案提供与数据库交互的啮合层,即 Database Mesh,又可称数据库网格 ShardingSphere-JDBC 它使用客户端直连数据库,以 jar 包形式提供服务 无需额外部署和依赖,可理解为增强版的 JDBC 驱动,完全兼容 JDBC 和各种 ORM 框架 适用于任何基于 JDBC 的 ORM 框架,如:JPA, Hibernate, Mybatis,或直接使用 JDBC 支持任何第三方的数据库连接池,如....
该文章已经加密。
分布式事务 在分布式条件下,相互关联的多个数据由于跨系统,彼此的事务之间不被感知,无法保证 如何实现分布式下的一致性 典型情况下是两个思路: 理想状态:直接像单机数据库事务一样,多个数据库自动通过某种协调机制,实现了跨数据库节点的一致性。 使用场景:要求严格的一致性,比如金融交易类业务。 强一致 : 数据库使用XA协议实现,不是所有数据库都支持XA协议 一般情况:可以容忍一段时间的数据不一致,最终通过超时终止,调度补偿,冲正等等方式,实现数据的最终状态一致性。 使用场景:准实时或非实时的处理,比如 T+1的各类操作,或者电商类操作。 弱一致 : 1) 不用事务,业务侧补偿冲正 2) 所谓的柔性事务,使用一套事务框架保证最终一致的事务 XA 分布式事务协议 基于第一个强一致的思路,就有了基于数据库本身支持的协议,XA 分布式事务。XA 整体设计思路可以概括为,如何在现有事务模型上微调扩展,实现分布式事务。 X/Open X/Open,即现在的 open group,是一个独立的组织,主要负责制定各种行业技术标准。X/Open 组织主要由各大知名公司或者厂商进行支持....