什么是运维

术语名词

  • IDC--(Internet Data Center)互联网数据中心,主要服务包括整机租用、服务器托管、机柜租用、机房租用、专线接入和网络管理服务等。广义上的IDC业务,实际上就是数据中心所提供的一切服务。客户租用数据中心的服务器和带宽,并利用数据中心的技术力量,来实现自己对软、硬件的要求,搭建自己的互联网平台,享用数据中心所提供的一系列服务。
  • ISP--(Internet Service Provider)互联网服务提供商,即向广大用户综合提供互联网接入业务、信息业务、和增值业务的电信运营商。
  • ICP--(Internet Content Provider)互联网内容提供商,向广大用户综合提供互联网信息业务和增值业务的电信运营商。 根据中华人民共和国国务院令第292号《互联网信息服务管理办法》规定,国家对提供互联网信息服务的ICP实行许可证制度。从而,ICP证成为网站经营的许可证,经营性网站必须办理ICP证,否则就属于非法经营。因此,办理ICP证是企业网站合法经营的需要.
  • CDN--(Content Delivery Network)内容分发网络,依靠部署在各地的边缘服务器,通过中心平台的负载均衡、内容分发、调度等功能模块,使用户就近获取所需内容,降低网络拥塞,提高用户访问响应速度和命中率。CDN的关键技术主要有内容存储和分发技术。 CDN的基本原理是广泛采用各种缓存服务器,将这些缓存服务器分布到用户访问相对集中的地区或网络中,在用户访问网站时,利用全局负载技术将用户的访问指向距离最近的工作正常的缓存服务器上,由缓存服务器直接响应用户请求。
  • LVS--(Linux Virtual Server)的简写,意即Linux虚拟服务器,是一个虚拟的服务器集群系统。LVS集群采用IP负载均衡技术和基于内容请求分发技术。调度器具有很好的吞吐率,将请求均衡地转移到不同的服务器上执行,且调度器自动屏蔽掉服务器的故障,从而将一组服务器构成一个高性能的、高可用的虚拟服务器。整个服务器集群的结构对客户是透明的,而且无需修改客户端和服务器端的程序。为此,在设计时需要考虑系统的透明性、可伸缩性、高可用性和易管理性。
  • CGI--(Common Gateway Interface)通用网关接口。CGI规范允许Web服务器执行外部程序,并将它们的输出发送给Web浏览器,CGI将Web的一组简单的静态超媒体文档变成一个完整的新的交互式媒体

  • GSLB--(Global Server Load Balance,全局负载均衡)作为 CDN 系统架构中最核心的部分,负责流量调度.基于DNS的GSLB 绝大部分使用负载均衡技术的应用都通过域名来访问目的主机,在用户发出任何应用连接请求时,首先必须通过DNS请求获得服务器的IP地址,基于DNS的GSLB正是在返回DNS解析结果的过程中进行智能决策,给用户返回一个最佳的服务IP。用户应用流程与没有GSLB时未发生任何变化。这也是市场上主流的GSLB技术。

  • BOSS--(Business & Operation Support System,BOSS)是业务运营支撑系统。通常所说的BOSS分为四个部分:计费及结算系统、营业与账务系统、客户服务系统和决策支持系统。BOSS从业务层面来看就是一个框架,来承载业务系统、CRM系统、计费系统。实现统一框架中的纵向、横向管理。该系统最早由电信部门的计费系统发展演变而来,基本功能包括客户资料管理、产品管理、用户订购管理、计费、出帐、结算等,负责登记客户资料、管理用户订购服务的提供、实时的根据不同产品、套餐的资费标准计算业务(手机、固定电话用户通话时、点播收视、宽带流量与时间等)的消费金额,准实时及定期计算用户帐单,实时或定期结算用户各种消费费用。

管理

  • 配置管理
  • 事件管理
  • 问题管理
  • 成本管理
  • 容量管理
  • 资源管理
  • 需求管理

规划

  • 架构规划
  • IDC规划
  • 服务器规划
  • ISP规划
  • 预算规划

优化

  • 速度优化
  • 成本优化
  • ISP优化
  • CDN优化
  • 告警优化
  • 故障预案
  • 故障演习

安全

  • 漏洞扫描
  • 域名劫持扫描
  • 挂马扫描
  • CGI扫描
  • 网页篡改扫描

告警

  • 告警模型
  • 告警故障
  • 告警统计
  • 告警关联
  • 拨测

    定时curl一下某个url,有问题就告警.
    日志告警:5分钟Error大于xxx次告警。
    指标告警:cpu使用率大于xxx告警。
    

告警对象可以分为两种:

  • 业务规则监控
  • 系统可靠性监控

对于业务规则监控可以举一个游戏的例子。比如游戏角色在一定装备的情况下,单次打击的伤害输出应该是有一个上限,如果超过了就说明有作弊的情况。又比如斗地主游戏里一个人的连胜场次是有一定上限的,每天的胜率是有一定上限,如果超出平均值太多就可能是作弊。业务规则监控的不是硬件,也不是软件是否工作正常。而是软件是否按照业务规则实现的,是否有漏洞。也可以理解为对“正确性”的监控。

系统可靠性监控是最常见的监控形式,比如发现是不是服务器挂掉了,服务是不是过载了等等。对于大部分后台服务,系统可以抽象建模成这个样子:

监控

  • URL监控
  • LVS监控
  • IDC监控
  • 数据库监控
  • 模块监控
  • 站点监控
  • 响应监控

系统/平台

  • CDN平台
  • 静态应用平台
  • 动态应用平台
  • 点击流系统
  • 数据库平台
  • 下载平台
  • 网络健康系统
  • 经营分析系统
  • 存储平台
  • 流媒体平台
  • 质量监测系统
  • GSLB管理系统
  • BOSS系统
  • 立体监控系统
  • 自动发布系统
  • 站点分析系统
  • 统一告警系统
  • 运维工具系统

规范

  • 项目立项规范
  • 运营故障分级和处罚规范
  • 重大运营故障处理流程
  • 环境一致性规范
  • 运营资源申请流程
  • IDC变更流程
  • 预算管理规范

linux发行版

  • RedHat: Fedora, CentOS, Mandriva
  • SuSE: SLES, OpenSuSE
  • Debian: Ubuntu
  • Gentoo:
  • BackTrace/kali linux (黑客)

results matching ""

    No results matching ""