kt cloud의 기술 전문가들이 전하는 클라우드 서비스와 데이터센터 기술 이야기입니다. 인프라 구축부터 운영까지 실무 경험을 바탕으로 한 전문 인사이트를 공유합니다.

Tech Story 133

인공지능이 만드는 회사 홍보 영상! AI 최신 트렌드 체험하기

[kt cloud 서비스개발팀 강상구 님] 인공지능이 만드는 회사 홍보 영상! AI 최신 트렌드 체험하기 최근 GPT의 등장 이후 인공지능(AI)은 전 세계적으로 주목받고 있으며, 다양한 산업에 변화를 이끌고 있습니다. 'AI 분야는 자고 일어나면 신기술이 나와 있다'는 말을 들어본 적이 있으신가요? 한 회사가 새로운 모델을 공개하면 다음 날 경쟁적으로 다른 회사에서 또 새로운 모델을 공개하며 경쟁이 날로 치열해지고 있습니다.Notion, Adobe 등 기존 서비스 기업들 역시 AI가 적용된 기능을 하나둘 공개하고 있습니다. Adobe MAX Sneaks 2024에서 공개된 illustrator AI 기능대화형 인공지능 ‘AI는 ChatGPT다’라고 생각하고 계신가요?ChatGPT는 대화형 인공지능의 한..

Tech Story/etc. 2024.11.11

What is DevOps? - Github Action

[kt cloud DevOps팀 이효원 님] What is DevOps? - Github Action 1. Github 구성 요소Github은 소스 코드 관리를 넘어, 개발자와 팀이 협업하고 프로젝트를 관리하는 다양한 도구를 제공하는 플랫폼입니다.Github은 크게 Organization, Team, Repository로 구성됩니다. 1-1. OrganizationGithub Organization은 여러 팀과 프로젝트를 효율적으로 관리할 수 있는 Github의 그룹 단위입니다.기업이나 큰 팀의 경우, Organization을 생성해 프로젝트와 리소스를 통합 관리할 수 있습니다.Organization은 다음과 같은 기능을 제공합니다.중앙 관리: 조직 내 모든 사용자와 Repository를 중앙에서 관리할..

What is DevOps? - DevOps & CI/CD

[tk cloud DevOps팀 이효원 님] What is DevOps? - DevOps & CI/CD 1. DevOps란DevOps는 Development(개발)와 Operations(운영)의 합성어로,소프트웨어 개발과 IT 운영 팀 간의 협업을 강화하여 지속적인 통합(CI)과 지속적인 배포(CD)를 가능하게 하는 문화 및 철학을 의미합니다.개발 주기 동안 모든 팀이 같은 목표를 추구하고, 장애물 없이 빠르고 안정적인 배포를 위해 긴밀하게 협력하는 것을 목표로 합니다.  기존에는 개발팀과 운영팀이 서로 독립적으로 작업하는 경우가 많았습니다.하지만 DevOps는 이 두 팀이 소통과 협업을 통해 함께 문제를 해결하고,궁극적으로 더 높은 품질의 소프트웨어를 더 빠르고 안정적으로 제공할 수 있도록 합니다.2...

gRPC 라이브러리 배포 및 문서 자동화 프로세스 수립

[kt cloud 플랫폼Innovation팀 강솔 님]  gRPC 라이브러리 배포 및 문서 자동화 프로세스 수립  gRPC 기반 시스템에서는 서비스와 메시지가 개발 과정에서 자주 변화합니다. 이때 변경된 API 문서를 최신화하는 작업은 필수적이지만 반복 작업으로 인해 자동화가 필요합니다. 이번 글에서는 gRPC 서비스의 .proto 파일이 변경될 때마다 문서를 자동으로 생성하고 이를 별도 GitHub repository에 배포 및 관리하는 방법을 소개합니다.  1. 자동화 프로세스 정의하기 1.1. 자동화 목표 수준 정의자동화 프로세스는 다음의 목표를 달성하고자 합니다. 1. 자동화 목표라이브러리 자동 배포: .proto 파일이 변경될 때마다 라이브러리가 자동으로 업데이트됩니다.문서 자동 생성: .pro..

protoc-gen-doc으로 시작하는 gRPC 문서화

[kt cloud 플랫폼Innovation팀 강솔 님]   protoc-gen-doc으로 시작하는 gRPC 문서화  이번 포스팅에서는 gRPC 기반 API의 효과적인 문서화 방안에 대해 다뤄보겠습니다. 기존에 REST API는 주로 Swagger를 활용해 문서화했는데, gRPC에서도 유사한 수준의 명확하고 일관된 문서를 제공하기 위한 방법을 고민하게 되었습니다.gRPC 문서화를 설계하면서 특히 중점적으로 고려한 요소는 1) 편의성과 2) .proto 파일과의 호환성이었습니다. 내부 공유용으로 활용될 문서이기에, 큰 리소스를 투입하지 않고도 최신의 .proto 파일 내용을 반영할 수 있는 방안을 찾고자 했습니다.이와 같은 요구 사항을 충족하기 위해 protoc-gen-doc을 사용하여 .proto 파일 기..

GPU 1,000장 모니터링 하기: NVIDIA DCGM 활용 전략

[kt cloud AI플랫폼팀 최지우 님]  GPU 1,000장 모니터링하기: NVIDIA DCGM 활용 전략 AI 플랫폼을 운영하며 수천 장의 GPU를 다루는 일은 결코 단순하지 않습니다. 서버 수가 늘어날수록 관리와 모니터링의 복잡도도 기하급수적으로 증가하고, 그만큼 예상치 못한 문제가 발생할 가능성도 커집니다. 특히 AI 플랫폼을 통해 수많은 고객에게 안정적인 서비스를 제공하려면 GPU 서버의 상태와 성능을 지속적으로 모니터링하는 것이 필수적입니다. 그러나 서버 수가 수백 대에 이르면, 각 GPU의 상태를 일일이 확인하는 것은 사실상 불가능에 가깝습니다. kt cloud에서는 AI Train, AI SERV 등 GPU 서버를 제공하는 서비스들에서 수천 장의 GPU를 제공하고 있습니다. 저희는 AI ..

Tech Story/AI Cloud 2024.11.07

Kafka 이벤트 전송 최적화: Partitioner와 batch 설정 이해하기

[kt cloud 플랫폼Innovation팀 오준영] Kafka 이벤트 전송 최적화: Partitioner와 batch 설정 이해하기 Kafka에서 Producer는 기본적으로 Sticky Partitioner를 사용하여, 이벤트를 batch 단위로 묶어 효율적으로 전송할 수 있습니다.배치 설정은 batch.size와 linger.ms가 있으며, 각각 배치의 크기와 데이터가 쌓이는 시간을 설정해 전송 조건을 조절할 수 있습니다.본 포스팅에서는 Kafka를 활용한 이벤트 발행과 구독하는 과정에서, 겪은 이벤트 분산 이슈의 원인을 파악하기 위해 Kafka Partitioner, batch.size, linger.ms 설정을 분석한 내용을 공유합니다.  1.시나리오 테스트 환경 (Local) Kafka Clu..