Products
GG网络技术分享 2026-04-17 06:41 0

太坑了。 测试可用性:访问生产者和消费者,测试连接。
差不多得了... 目前业界并没有公认的解决方案,各家都有各自的监控之道。
要确保Kafka在使用过程中的稳定性,需要从kafka在业务中的使用周期进行依次保障。主要可以分为:事先防范、运行时监控、故障时解决这三阶段,功力不足。。
根据具体场景区分kafka topic,避免挤占或阻塞实时业务消息的处理。
还有啊, 如果需要对于Kafka的一些基础知识进行补充、学习,可以参考这篇文章:https:///developer/article/2026555
太顶了。 还有啊,不平衡集群还面临一个风险:在一个 broker 出故障后出现更高的 MTTR,以及更高的数据丢失风险。
将数据库中的多个字段联合, 创建一个唯一约束, 挖野菜。 即使多次操作也能保证表里至多存在一条记录。
| 参数 | 推荐值 | 说明 |
|---|---|---|
| 容量 | 增加参数值,比如设置成1KB或更大 | |
| acks | 设置=lz4或zstd | 压缩在 Kafka 中并不新鲜 |
| retries | 设置=0 | |
| 批量大小 | 适当增加参数值,但不超过CPU核数 | 减少网络传输次数。 |
消息写入、 消费速率、集群网络进出;
一般会对当前服务自身的kafka集群做告警配置,但是如果是依赖自身消息的下游服务出现消费问题,我们是感知不到了;而且针对消费端服务不共用同一个集群的情况,出现消息重复发送的问题,服务自身是很难发现的。
需要重新评估你的实例类型决策:你的集群是否饱和?在什么情况下饱和?是否存在其他实例类型,可能比你第一次创建集群时选择的类型更合适?EBS 优化实例与 GP2/3 或 IO2 驱动器的混合是否真的比 i3 或 i3en 机器有更好的性价比,我惊呆了。?
但有调整时不会主动通知,但我们可以通过配置告警感知磁盘容量的变化,不忍直视。。
我们一起... 事先防范即以及一些针对紧急情况的临时开关功能。
| 功能/指标 | 详情 |
|---|---|
| 总存储空间、 已用存储空间、最大分区使用、集群资源、分区数量、主题数量; | 机器、存储和网络挂载文件系统时禁掉atime更新;选择ext4或XFS文件系统;swap空间的设置;页缓存大小。 |
| 流量 | 适当增加参数值,比如从默认的16KB增加到512KB或1MB。 |
| 延迟 | 消息写入、 消费耗时、主题消费延迟量。 |
| 调优类型 | 建议 |
|---|---|
| JVM | |
| 操作系统 | |
| 压缩 |
| 监控 | 操作 | 预期 |
|---|---|---|
| 检查实例 | ||
| 黑盒监控 |
| Kafka Monitor 优势: |
|---|
| 设计思路: |
|---|
方案:根因分析;消息补推;修改配置,重启服务;各种建立的消费组;事前检查是否有多个服务共用一个消费的情况,完善一下。。
Demand feedback