하둡 보안 아키텍쳐와 Apache Knox의 역할 (New Features for Security and Apache Knox)

This article is based on Hortonworks Partner Contents and Expertise

빅데이터 및 하둡의 도입을 고려하는 데 있어서 가장 중요한 요소 중의 하나는 바로 데이터에 대한 보안에 대한 고려입니다.
두 가지 의미를 가진다고 볼 수 있겠습니다.
하둡 에코 시스템에서 하둡 클러스터 자체에 제공하고 있는 보안 기능과 이러한 보안 기능을 기업 내부의 보안 정책과 연동하는 부분이 그것입니다.

최근에 호튼웍스는 보안 업체의 인수를 포함하여 하둡 클러스터를 보안 측면에서도 안전한 시스템으로 만들기 위해서 많은 노력을 기울이고 있습니다.

기존의 하둡의 보안 논의에 대해서는 여러 기사를 통해서 소개를 드린 적이 있습니다.
하둡의 보안을 위한 체계
하둡에서 데이터 전송 시의 암호화

하둡의 보안 논의는 처음에는 주로 데이터 저장 및 전송 시의 암호화를 중심으로 논의가 되었다가 최근에는 하둡 클러스터의 전체 보안 체계를 구축하는 논의로 확대되고 있다는 점입니다.

그 중에서 핵심적인 역할을 하는 것이 Apache Knox라고 하는 일종의 API 게이트웨이 보안 솔루션입니다.

knox1
다이어그램에서 볼 수 있는 것처럼 Apache Knox는 하둡 클러스터와 의사소통하기 위한 ‘REST API Gateway’입니다.

이러한 게이트웨이를 통해서 하둡 클러스터에서 다음 네 가지의 중요한 역할을 담당합니다.
- Authentication (LDAP and Active Directory Authentication Provider)
- Federation/SSO (HTTP Header Based Identity Federation)
- Authorization (Service Level Authorization)
- Auditing

즉, 인증이나 권한 관리, 외부 인증 시스템과의 연동 및 ACL 등과 같은 보안 기능을 담당하는 요소가 되었습니다.

지난 주에 호튼웍스의 하둡 데이터 플랫폼 행사에서 Apche Knox에 대해 잘 설명이 되어 있는 슬라이드가 있어서 공유드립니다.
하둡의 보안에 대한 슬라이드

행사에서 나왔던 QnA 정리한 리스트가 있는 데 한 번 보시면 Knox의 역할에 대해서 참고하시기 바랍니다.

qna

그리고 호튼웍스 랩에서 보안 부분에 대한 정보를 모아서 소개하고 있으니 이 곳도 참조하시기 바랍니다.
Hortonworks Daba Lab

아파치 녹스는 하둡 클러스터의 보안은 물론이고 향후에 기업에 도입할 때 연동해야 할 보안 정책을 실행하기 위한 지점으로서도 중요하기 때문에 상세한 적용 방법과 연동 방법은 계속 업데이트하겠습니다.

———————————————————————————————————–
ASD Technologies는 호튼웍스(Hortonworks Inc)와의 Consulting Partnership을 통해서
빅데이터에 대한 도입 컨설팅 및 구축을 도와드리고 있습니다.

호튼웍스 파트너 홈페이지
ASD Technologies Korea 홈페이지

Contact Point : sunung@asdtech.co
———————————————————————————————————–