Kubernetes 理论与实践-5-搭建生产环境集群-kOps, AWSJuly 15, 2025 · 19 min read前文回顾 资源分配 服务质量合同 QoS (Quality of Service) 命名空间中的资源默认值和限制, 配额 ResourceQuota Kubernetes 理论与实践-4-资源管理
Kubernetes 理论与实践-4-资源管理-CPU, Memory, QoS, ResourceQuotaJuly 12, 2025 · 21 min read前文回顾 Kubernetes 理论与实践-3-安全与权限管理
Kubernetes 理论与实践-3-安全与权限管理-RBAC, Rules, Roles, RoleBindings, SubjectsJuly 11, 2025 · 12 min read前文回顾 Kubernetes 理论与实践-2-存储-Volumes, ConfigMaps, Secrets, Namespaces
Kubernetes 理论与实践-2-存储-Volumes, ConfigMaps, Secrets, NamespacesJuly 10, 2025 · 18 min read前文回顾 Kubernetes 理论与实践-1-基础-Pods, ReplicaSets, Services, Deployments
Kubernetes 理论与实践-1-基础-Pods, ReplicaSets, Services, Deployments, IngressJuly 9, 2025 · 19 min read一点历史 在物理服务器时代,基础设施管理和部署是合在一起的,因为所有的设置是不可变的,只要安装后基本不会改变;有了 VM 和 镜像后,基础设置管理和部署可以分开,这就能够让原本在福 wish 昂不可变的应用设置获得一定程度的可变性。 后来,Chef, Puppet, Ansible 陆续发展以支持基础设施管理(基础设施状态管理),但是却没有花更多到部署那块。为了支持可变性,Packer 应运而生;发展至今,现在的答案是 Terraform, Packer, CloudFormation。 部署流程中,在 Docker 和容器没有出现之前,我们有 Linux 和 cGroup,但是它很难用;再之前是一堆专注于基础设置管理的软件(Puppet, CFEngine, SALTSTACK, Chef, Ansible)。 Docker(容器运行时) 和容器的出现,保证了 容器景象是不可变的情况下,给部署流程带来拥抱可变性的可能;容器很好,不过直接运行容器并不会让你获得高容错和自愈功能,因此需要有一个东西充分利用和安排它们配置到合适的地点,从而体现出扩展性、高稳定性和高可用性。 有了容器之后,部署流程可变后,Schdulers 调度器程序 (MESOS, MARATHON, Docker Swarm, Kubernetes) 应运而生;调度器管理一个集群内多个应用之间的部署交互; Kubernetes 特性
Kubeflow 常用组件July 8, 2025 · 4 min readKubeflow 是一个基于 Kubernetes 的端到端机器学习平台,集成了多个开源工具和组件,覆盖了从数据准备到模型部署的全流程。以下是 Kubeflow 常用的核心组件及其作用,按功能模块分类整理:
如何保证和确定模型训练效果?July 4, 2025 · 3 min read在 Kubernetes + Kubeflow 环境中确保模型训练可靠,需贯穿 数据 → 训练 → 评估 → 部署 全链路的验证: 流程阶段 数据阶段: 自动化质量检查 + 特征一致保障 训练阶段: 实时监控 + 分布式协调 + 检查点容灾 评估阶段: 性能/可解释性/飘逸检测 (Drift detection) 三层次验证 运维层面: k8s 自愿隔离 + Kubeflow 流水线自动化测试
自注意力机制 Self-attention详解 - 原理、应用与比较July 2, 2025 · 5 min read解决的问题 之前的输入全部是以一个向量作为输入,如何处理输入是一排不定数量的向量呢? 可能的输入 文字输入句子,语音信号,关系图(人际关系,分子结构) 可能的输出 Each vector has a label (label: value type for regression problem, class type for classification problem) 应用: 分析文字的词性,分析声音信号里面的 phonetic,分析 social network 中每个节点的特性,比如电商环境里面分析某个人会不会购买某个商品。
Seq2seq 与 Transformer模型详解:架构、应用与优化技巧 | ML TransformerJuly 2, 2025 · 6 min readSequence-to-sequence model (Seq2seq) The output length is determined by model. 应用: Speech Recognition, Machine Translation, Speech Translation
卷积神经网络 CNN 详解:原理、结构与应用指南 | AI技术July 1, 2025 · 4 min readPresent version 1 - Convolutional Layer Image Classification 对电脑来说,一张图片是一个三维的 Tensor(维度大于 2 的矩阵 --> Tensor)。