티스토리 뷰
1. SRE/DEVOPS의 개념과 SRE는 무엇을 하는가?
SRE는 클래스 DevOps는 구현
- 지표 정의와 모니터링
- 하드웨어 리소스 가용량 계획
- 형상 변경 관리
- 장애 처리
- 문화 확립
2. SRE는 어떻게 일하는가?
- 부서 간 단절 줄이기(오너쉽 공유)
- 정상적으로 실패받아들이기(에러 버짓 등의 개념 도입)
- 점진적인 변경 구현(작은 단위 변경으로 리스크 최소화)
- 자동화 및 툴링(수작업을 줄여서 리스크 최소화 및 업무 절감)
- 모든것을 수치화(지표뿐만 아니라, 수동 작업시간 장애시간 등 모든 것을 데이터화)
3. SRE의 주요 지표 SLI/SLO
SLI(Service Level Indicator)
- 서비스에 대한 수준을 측정하여, 정량적으로 정의한 지표
- 응답시간
- 에러율
- 처리량
- 가용성
- 내구성
SLO(Service Level Objective)
- SLI로 정의한 지표의 목표 지표
- 최소/최대 범위 지정
- 여유 값을 둘 것
- 과도하게 하지 말 것
4. 예제로 보는 SLI/SLO 정의 방법
5. Error budget
6. 운영에서 반복적인 노다다 Toil
'운영관리' 카테고리의 다른 글
어떻게 빨리 갈 수 있을까 (0) | 2020.02.23 |
---|---|
뛰어난 개발자는 뽑히는 게 아니라 길러집니다. (0) | 2020.02.23 |
미친놈과 안미친놈 차이 (0) | 2018.08.06 |
딜레마를 해결하는 방법 (0) | 2018.08.06 |
Managing 위계(상하관계) 조직 VS 역할(수평관계) 조직 (0) | 2018.02.14 |
댓글
warpmemory
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
페이지
TAG
- Linux
- deview
- 번역
- 명령어
- command
- Module
- error
- RESTful
- Windows
- code
- apache
- File
- Python
- Web
- example
- client
- engineering
- limits
- configuration
- check
- httpd
- MariaDB
- monitoring
- 예제
- 코드
- mysql
- 외부링크
- PowerShell
- Ansible
- 이슈처리
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
글 보관함