Tìm hiểu công việc của Kỹ sư SRE - quản lý độ tin cậy của trang web

Tìm hiểu công việc của Kỹ sư SRE – quản lý độ tin cậy của trang web

Chia sẻ kiến thức 20/06/2023

Kỹ sư quản lý độ tin cậy của trang web - kỹ sư SRE tạo ra cầu nối giữa hoạt động phát triển và CNTT bằng cách đảm nhận các nhiệm vụ thường được thực hiện bởi các tác vụ máy tính.

Kỹ sư SRE – Kỹ sư quản lý độ tin cậy của trang web (SRE) tạo ra cầu nối giữa hoạt động phát triển và CNTT bằng cách đảm nhận các nhiệm vụ thường được thực hiện bởi các tác vụ máy tính.

Thay vào đó, những nhiệm vụ như vậy được giao cho những Kỹ sư SRE , những người sử dụng các công cụ tự động hóa để giải quyết vấn đề bằng cách tạo ra các hệ thống phần mềm đáng tin cậy và có thể mở rộng.

Tiêu chuẩn hóa và tự động hóa là trọng tâm của những gì SRE thực hiện, đặc biệt là khi các hệ thống chuyển sang đám mây. Do đó, họ thường có nền tảng về kỹ thuật phần mềm hoặc hệ thống hoặc quản trị hệ thống với kinh nghiệm vận hành CNTT.

quản lý độ tin cậy
Một Kỹ sư SRE – kỹ sư quản lý độ tin cậy web phát triển hệ thống phần mềm và giải pháp tự động (ảnh: wahlandcase.com)

Kỹ thuật quản lý độ tin cậy trang web là gì?

Kỹ thuật quản lý độ tin cậy của trang web là một thuật ngữ được Google đặt ra lần đầu tiên, trong đó thuật ngữ này được mô tả là “khi bạn xử lý các sự cố phần mềm”.

Mục đích chính của SRE là phát triển hệ thống phần mềm và giải pháp tự động cho các tác vụ vi tính. Do đó, SRE thực hiện công việc được thực hiện theo cách truyền thống nhưng thay vào đó, sử dụng các kỹ sư có chuyên môn về phần mềm để giải quyết các vấn đề phức tạp.

Do đó, kỹ thuật quản lý độ tin cậy của trang web có thể được coi là một tập hợp các thực hành kết hợp các kỹ thuật phần mềm vào các hoạt động do đó làm tăng hiệu quả và độ tin cậy của hệ thống phần mềm và cải thiện quy trình làm việc.

SRE và DevOps

Kỹ thuật quản lý độ tin cậy của trang web có liên quan chặt chẽ với DevOps, một khái niệm khác liên kết hoạt động và phát triển phần mềm, đồng thời có thể được coi là sự khái quát hóa các nguyên tắc SRE cốt lõi. Do đó, SRE đóng một vai trò quan trọng trong việc triển khai thành công các phương pháp DevOps.

Ngoài ra, cả DevOps và SRE đều tìm cách thu hẹp khoảng cách giữa hoạt động và nhóm phát triển để cung cấp phần mềm nhanh hơn.

Tuy nhiên, một bài báo của Google đã phân biệt giữa hai thuật ngữ nói rằng SRE “tình cờ thể hiện các triết lý của DevOps, nhưng có cách đo lường và đạt được độ tin cậy hơn nhiều theo quy định thông qua công việc kỹ thuật và vận hành. Nói cách khác, SRE quy định cách thành công trong các lĩnh vực DevOps khác nhau.”

SRE và DevOps có nhiều điểm chung (ảnh: YouTube)

Một kỹ sư SRE – kỹ sư quản lý độ tin cậy trang web làm gì?

Vậy, kỹ sư SRE – kỹ sư quản lý độ tin cậy trang web làm gì?

Nhiệm vụ của một kỹ sư SRE – kỹ sư quản lý độ tin cậy trang web 

Một kỹ sư SRE – kỹ sư quản lý độ tin cậy của trang web (SRE) làm việc giữa phát triển và vận hành. Khi đó, SRE là nhà phát triển phần mềm có kinh nghiệm và kiến thức về hoạt động CNTT.

Phần lớn vai trò này xoay quanh việc viết và phát triển mã để tự động hóa các quy trình, chẳng hạn như phân tích nhật ký, thử nghiệm môi trường sản xuất và phản hồi mọi vấn đề, vì vậy kỹ sư này sẽ là chuyên gia viết mã.

Đổi lại, quá trình tự động hóa như vậy cho phép các nhà phát triển tập trung hoàn toàn vào phát triển tính năng cho phép họ đưa các tính năng mới vào sản xuất nhanh nhất có thể.

Từ đó, nhóm vận hành sẽ thấy khối lượng công việc của họ giảm đi vì SRE sẽ tự động hóa các giải pháp cho mọi sự cố lặp lại. Do đó, họ sẽ chuyển đổi giữa công việc phát triển và vận hành và duy trì sự cân bằng giữa chúng.

Bởi vì trọng tâm chính của kỹ sư SRE là tự động hóa, điều này có nghĩa là họ nâng cao hiệu suất, hiệu quả và giám sát các quy trình phát triển phần mềm.

Các kỹ năng cần thiết

Các SRE dành thời gian của họ để tạo phần mềm giúp cải thiện độ tin cậy của hệ thống, khắc phục sự cố và ứng phó với các sự cố và sự cố. Như vậy, họ sẽ cần các kỹ năng kỹ thuật khác nhau.

Họ sẽ cần có kiến thức về các công cụ tự động hóa khác nhau vì họ thường chịu trách nhiệm xây dựng và tích hợp các công cụ phần mềm để nâng cao độ tin cậy và khả năng mở rộng của hệ thống tổ chức.

Như đã đề cập ở trên, SRE sẽ yêu cầu kiến thức về mã hóa và hầu hết các ngôn ngữ lập trình phổ biến bao gồm Ruby, Javascript và PHP.

Họ cũng cần phải có kiến thức chuyên môn về các nhà cung cấp đám mây lớn như AWS và Google Cloud.

Kết luận

Kỹ sư SRE – kỹ sư quản lý độ tin cậy trang web đang trở thành một vai trò ngày càng quan trọng trong các tổ chức. Đó là một vai trò đầy thách thức đòi hỏi niềm đam mê viết mã và tự động hóa. Có những kỹ sư như vậy trong tổ chức của bạn sẽ giúp giảm chi phí vận hành đồng thời cải thiện độ tin cậy của hệ thống.

Quỳnh Anh (lược dịch từ Flagship.io)

Link bài gốc: https://www.flagship.io/glossary/site-reliability-engineer/

Tin liên quan:

ĐĂNG KÝ TƯ VẤN HỌC LẬP TRÌNH TẠI FUNiX

Bình luận (
0
)

Bài liên quan

  • Tầng 0, tòa nhà FPT, 17 Duy Tân, Q. Cầu Giấy, Hà Nội
  • info@funix.edu.vn
  • 0782313602 (Zalo, Viber)        
Chat Button
FUNiX V2 GenAI Chatbot ×

yêu cầu gọi lại