본문 바로가기
도서/프로그래밍

[03] 객체지향의 사실과 오해 - 타입과 추상화

by 신발사야지 2023. 12. 28.

 

NOTION AI

타입과 추상화는 프로그래밍에서 중요한 개념입니다. 타입은 데이터의 종류를 정의하고 제한하는데 사용됩니다. 추상화는 복잡한 개념이나 데이터를 단순화하고 일반화하는 과정을 의미합니다. 이러한 개념을 이해하면 프로그래밍에서 더 효율적이고 유지보수가 쉬운 코드를 작성할 수 있습니다.

타입은 변수, 상수, 함수 등에 적용됩니다. 각각의 타입은 특정한 속성과 동작을 가지며, 이를 토대로 프로그래밍 언어는 타입 검사와 타입 추론을 수행합니다. 타입은 컴파일 시간에 오류를 방지하고 코드의 안정성을 높이는 역할을 합니다.

추상화는 개념이나 데이터를 단순화하여 복잡성을 줄이는 과정입니다. 이를 통해 코드의 가독성을 높이고 개발자가 코드를 이해하고 관리하기 쉽게 만듭니다. 추상화는 객체 지향 프로그래밍에서 인터페이스, 클래스, 모듈 등을 통해 구현될 수 있습니다.

타입과 추상화는 프로그래밍에서 핵심적인 개념이며, 이를 잘 이해하고 활용하는 것은 좋은 소프트웨어를 개발하는 데 큰 도움이 됩니다.

 

일단 컴퓨터를 조작하는 것이 추상화를 구축하고, 조작하고, 추론하는 것에 관한 모든 것이라는 것을 깨닫고 나면 (훌륭한) 컴퓨터 프로그램을 작성하기 위한 중요한 전제 조건은 추상화를 정확하게 다루는 능력이라는 것이 명확해진다 .                                                                                                                      - 키스 데블린(Keith Devlin)[Devlin 2003]

 

최초 지하철 노선도는 실제와 유사한 물리적인 지형 위에 구불구불한 운행 노선과 불규칙적인 역 간의 거리를 사실적으로 묘사하고 있었다. 문제는 이렇게 사실적인 정보가 실제 지하철을 이용하는 승객들로 하여금 노선도를 이해하기 어렵게 만들었다는 점이다.

 

1933년에 영국의 헤리 벡(Harray Beck)은 지하철 노선도를 추상화하여 현대적이고 실용적인 지하철 노선도를 만들었다. 헤리 벡이 창조한 지하철 노선도의 핵심은 지도가 당연히 가져야 한다고 생각되는 ‘정확성’을 버리고 그 ‘목적’에 집중한 결과다. 지하철 노선도에서 중요한 것은 지형이 아니라 연결관계, 열차를 갈아타는 것이다.

 

추상화를 통한 복잡성 극복

 

현실은 너무나 복잡하다. 추상화란 현실에서 출발하되 불필요한 부분을 도려내가면서 사물의 놀라운 본질을 드러나게 하는 과정이라고 할 수 있다. 훌륭한 추상화는 목적에 부합하여야 한다.

 


추상화

어떤 양상, 세부 사항, 구조를 좀 더 명확하게 이해하기 위해 특정 절차나 물체를 의도적으로 생략하거나 감춤으로써 복잡도를 극복하는 방법이다.

복잡성을 다루기 위해 추상화는 두 차원에서 이뤄진다[Kramer 2007]

  1. 첫 번째 차원은 구체적인 사물들 간의 공통점은 취하고 차이점은 버리는 일반화를 통해 단순하게 만드는 것이다
  2. 두 번째 차원은 중요한 부분을 강조하기 위해 불필요한 세부 사항을 제거함으로써 단순하게 만드는 것이다.

 

> 객채지향 패러다임은 객체라는 추상화를 통해 현실의 복잡성을 극복한다.

 

객체 지향과 추상화

 

수 많은 트럼프 여왕, 병사, 정원사, 왕자와 공주들…

엘리스는 여왕을 쳐다보며 마음속으로 이렇게 속사였다.

‘기껏해야 트럼프에 불과해. 무서워할 필요 없어’

→ 첫 번째 차원의 추상화

 

그룹화를 통한 추상화

 

수 많은 트럼프와 토끼 → 트럼프와 토끼로 그룹화

개념

공통점을 기반으로 객체들을 묶기 위한 그릇을 개념(concept)이라고 한다. 개념이란 일반적으로 우리가 인식하고 있는 다양한 사물이나 객체에 적용할 수 있는 아이디어나 관념을 뜻한다.

개념을 이용하면 객체를 여러 그룹으로 분류(classification)할 수 있다. 그 분류의 일원을 그 개념의 인스턴스(instance)라고 한다.

개념의 세 가지 관점

  1. 심볼(symbol): 개념을 가리키는 간략한 이름이나 명칭
  2. 내연(intension): 개념의 완전한 정의를 나타내며 내연의 이미를 이용해 객체가 개념에 속하는지 여부를 확인할 수 있다.
  3. 외연(extension): 개념에 속하는 모든 객체의 집합

엘리스 세계의 트럼프 카드를 예로 들면,

  • 트럼프라는 이름은 심볼이다.
  • 두 손과 두 발이 네모난 몸 모서리에 달려있다는 트럼프에 대한 설명이 바로 내연이다. 내연은 개념을 객체에 적용할 수 있는지 여부를 판단하기 위한 조건이다.
  • 외연: 개념에 속하는 객체들의 집합 (정원사, 병사, 신하, 왕자와 공주, 왕과 왕비들…)

객체지향의 세계에서 가장 널리 알려진 유명인사가 클래스(class)라는 사실을 감안한다면 분류(classification)라는 개념이 얼마나 중요한지 실감할 수 있을 것이다.

객체를 적절한 개념에 따라 분류한 애플리케이션은 유지보수가 용이하고 변경에 유연하게 대처할 수 있다. 더 중요한 것은 적절한 분류 체계는 애플리케이션을 다루는 개발자의 머릿속에 객체를 쉽게 찾고 조작할 수 있는 정신적인 지도를 제공한다는 것이다.

분류는 추상화를 위한 도구다

추상화는 일반화와 단순화

객체를 분류하는 과정은 추상화의 두 가지 차원을 모두 사용한다.

분류하여 묶으려면 일반화하여 공통점을 찾아야하고, 공통점은 불필요한 세부사항을 제거하는 단순화를 하기 때문이다.

우리는 매 순간 세상에 존재하는 무수한 사물들을 개념의 틀로 걸러가며 세상을 추상화한다. 추상화를 사용함으로써 우리는 극도로 복잡한 이 세상을 그나마 제어 가능한 수준으로 단순화할 수 있는 것이다.

 

타입

 

타입은 개념이다

타입의 정의는 개념의 정의와 완전히 동일하다. 타입은 공통점을 기반으로 객체들을 묶기 위한 틀이다. 타입은 개념과 마찬가지로 심볼, 내연, 외연을 이용해 서술할 수 있으며 타입에 속하는 객체 역시 타입의 인스턴스라고 한다.

타입이 개념과 근본적으로 동일하다고 하더라도 일단 컴퓨터 내부로 들어오는 순간 좀 더 기계적인 의미로 윤색될 수밖에 없다. 그리고 기계적인 의미는 종종 개발자들의 머리를 혼란스럽게 만든다.

데이터 타입

컴퓨터가 다룰수 있는 타입은 비트밖에 없다.

그러나 0, 1로 표현된 프로그램을 이해 할 수 있는 사람은 없다. 그래서 비트에 타입을 지정하여 사람이 이해할 수 있게 했다. 컴퓨터에 있는 0과 1을 분류하기 시작하면서 프로그래밍 언어 안에는 서서히 타입 시스템(type system)이 자라나기 시작했다. 타입 시스템은 메모리 안의 모든 데이터가 비트열로 보임으로써 야기되는 혼란을 방지하는 것이다.

  1. 타입은 데이터가 어떻게 사용되느냐에 관한 것이다.
  2. 타입에 속한 데이터를 메모리에 어떻게 표현하는지는 외부로부터 철저하게 감춰진다.

데이터 타입은 메모리 안에 저장된 데이터의 종류를 분류하는 데 사용하는 메모리 집합에 관한 메타데이터다. 데이터에 대한 분류는 암시적으로 어떤 종류의 연산이 해당 데이터에 대해 수행될 수 있는지를 결정한다.

 

객체와 타입

 

객체와 타입은 언뜻 비슷해보인다.

  1. 어떤 객체가 어떤 타입에 속하는지를 결정하는 것은 객체가 수행하는 행동이다. 어떤 객체들이 동일한 행동을 수행할 수 있다면 그 객체들은 동일한 타입으로 분류될 수 있다.
  2. 객체의 내부적인 표현은 외부로부터 철저하게 감춰진다. 객체의 행동을 가장 효과적으로 수행할 수만 있다면 객체 내부의 상태를 어떤 방식으로 표현하더라도 무방하다.

두 가지 조언으로부터 객체지향 설계에 대한 중요한 원칙을 이끌어낼 수 있다.

행동이 우선이다

어떤 객체가 타입에 속한 다른 객체와 동일한 행동을 하기만 하면 같은 타입으로 분류할 수 있다.

타입이 데이터가 아니라 행동에 의해 결정된다는 사실은 객체지향 패러다임을 특징 짓는 중요한 몇 가지 원리와 원칙에 의미를 부여한다.

1 → 이것은 다형성에 의미를 부여한다. 다형성이란 동일한 요청에 대해 서로 다른 방식으로 응답할 수 있는 능력을 뜻한다.

2 → 캡술화를 의미한다.

행동에 따라 객체를 분류하기 위해서는 객체가 내부적으로 관리해야 하는 데이터가 아니라 객체가 외부에 제공해야 하는 행동을 먼저 생각해야 한다. 이를 위해서는 객체가 외부에 제공해야 하는 책임을 먼저 결정하고 그 책임을 수행하는 데 적합한 데이터를 나중에 결정한 후, 데이터를 책임을 수행하는데 필요한 외부 인터페이스 뒤로 캡슐화 해야 한다.

타입의 계층

트럼프 ⊃ 트럼프 인간

트럼프 인간은 트럼프보다 좀 더 특화된 행동을 하는 특수한 개념이다. 이 두 개념 사이의 관계를 일반화/특수화(generalization/sepcialization)관계라고 한다.

일반화/특수화 관계

객체지향에서 일반화/특수화 관계를 결정하는 것은 행동이다.

더 특수한 객체가 일반 객체보다 더 많은 수의 행동을 가진다. (상속?)

일반객체가 특수한 객체보다 할 수있는 행동은 적지만, 더 큰 외연 집합을 가진다.

슈퍼타입과 서브타입

일반화/특수화 관계는 좀 더 일반적인 한 타입과 좀 더 특수한 한 타입 간의 관계다. 이 좀 더 일반적인 타입을 슈퍼타입(suptertype)이라고 하고 좀 더 특수한 타입을 서브 타입(subtype)이라고 한다.

슈퍼타입과 서브타입은 행위적 호환성을 만족시켜야 한다. 트럼프 인간은 트럼프가 할 수 있는 행동을 다 할 수 있어야 한다.

일반화/특수화 관계 표기법

정적 모델

동적 모델과 정적 모델

객체를 생각할 때 우리는 두 가지 모델을 동시에 고려한다는 사실을 알 수 있다.

  1. 객체가 특정 시점에 구체적으로 어떤 상태를 가지느냐 ⇒ 객체의 스냅샷, UML에서 스냅샷은 객체 다이어그램이라고도 불린다. 스냅샷처럼 실제로 객체가 살아 움직이는 동안 상태가 어떻게 변하고 어떻게 행동하는지를 포착하는 것을 동적 모델(dynamic model)이라고 한다.
  2. 객체가 가질 수 있는 모든 상태와 모든 행동을 시간에 독립적으로 표현하는 것이다. 이런 모델을 타입 모델이라고 한다. 이 모델을 동적으로 변하는 객체의 상태가 아니라 객체가 속한 타입의 정적인 모습을 표현하기 때문에 정적 모델(static model)이라고도 한다.

여러분이 객체지향 프로그래밍 언어를 이용해 클래스를 작성하는 시점에는 시스템을 정적인 관점에서 접근하는 것이다. 그러나 디버깅 하는 동안은 객체의 동적인 모델을 탐험하고 있는 것이다.

클래스

클래스와 타입은 동일한 것이 아니다. 타입은 객체를 분류하기 위해 사용하는 개념이다. 반면클래스는 단지 타입을 구현할 수 있는 여러 구현 메커니즘 중 하나일 뿐이다. 클래스는 타입의 구현 외에도 코드를 재사용하는 용도로도 사용되기 때문에 클래스와 타입을 동일시하는 것은 수많은 오해와 혼란을 불러일으키곤 한다.

 

객체를 분류하는 기준은 타입이며

타입을 나누는 기준은 객체가 수행하는 행동이라는 사실만을 기억하기 바란다

 

객체를 분류하기 위해 타입을 결정한 후 프로그래밍 언어를 이용해 타입을 구현할 수 있는 한 가지 방법이 클래스

결국 객체지향에서 중요한 것은 동적으로 변하는 객체의 ‘상태’와 상태를 변경하는 ‘행위’다.

 

클래스는 타입을 구현하기 위해 프로그래밍 언어에서 제공하는 구현메커니즘이라는 사실을 기억하라.