Javascript/모던 자바스크립트

[모던 자바스크립트] 원시 값과 객체의 비교

Grace 2023. 2. 26. 15:40

자바스크립트가 제공하는 7가지 데이터 타입(숫자, 문자열, 불리언, null, undefined, 심벌, 객체 타입)은 크게 원시 타입과 객체 타입으로 구분할 수 있습니다. 원시 타입객체 타입은 근본적으로 다르다는 의미입니다. 원시 타입과 객체 타입은 크게 세 가지 측면에서 다릅니다.

  • 원시 타입의 값, 즉 원시 값은 변경 불가능한 값입니다. 이에 비해 객체(참조) 타입의 값, 즉 객체는 변경 가능한 값입니다.
  • 원시 값을 변수에 할당하면 변수(확보된 메모리 공간)에는 실제 값이 저장됩니다. 이에 비해 객체를 변수에 할당하면 변수(확보된 메모리 공간)에는 참조 값이 저장됩니다.
  • 원시 값을 갖는 변수를 다른 변수에 할당하면 원본의 원시 값이 복사되어 전달됩니다. 이를 값에 의한 전달이라 합니다. 이에 비해 객체를 가리키는 변수를 다른 변수에 할당하면 원본의 참조 값이 복사되어 전달됩니다. 이를 참조에 의한 전달이라 합니다.

원시 값

변경 불가능한 값

원시 타입의 값, 즉 원시 값은 변경 불가능한 값입니다. 다시 말해, 한번 생성된 원시 값은 읽기 전용 값으로서 변경할 수 없습니다.

변수와 값은 구분해서 생각해야 합니다. 변수는 하나의 값을 저장하기 위해 확보한 메모리 공간 자체 또는 그 메모리 공간을 식별하기 위해 붙인 이름이고, 값은 변수에 저장된 데이터로서 표현식이 평가되어 생성된 결과를 말합니다. 변경 불가능하다는 것은 변수가 아니라 값에 대한 진술입니다.

즉, “원시 값은 변경 불가능하다”는 말은 원시 값 자체를 변경할 수 없다는 것인지 변수 값을 변경할 수 없다는 것이 아닙니다. 변수는 언제든지 재할당을 통해 변수 값을 변경할 수 있습니다. 그렇기 때문에 변수라고 부릅니다.

변수의 상대 개념인 상수는 재할당이 금지된 변수를 말합니다. 상수도 값을 저장하기 위한 메모리 공간이 필요하므로 변수라고 할 수 있습니다. 단, 변수는 언제든지 재할당을 통해 변수 값을 변경할 수 있지만 상수는 단 한 번만 할당이 허용되므로 변수 값을 변경할 수 없습니다. 따라서 상수와 변경 불가능한 값을 동일시하는 것은 곤란합니다. 상수는 재할당이 금지된 변수일 뿐입니다.

// const 키워드를 사용해 선언한 변수는 재할당이 금지됩니다. 상수는 재할당이 금지된 변수일 뿐입니다.
const o = {}

// const 키워드를 사용해 선언한 변수에 할당한 원시 값(상수)는 변경할 수 없습니다.
// 하지만 const 키워드를 사용해 선언한 변수에 할당한 객체는 변경할 수 있습니다.
o.a = 1;
console.log(o); // {a: 1}

원시 값은 변경 불가능한 값, 즉 읽기 전용 값입니다. 원시 값은 어떤 일이 있어도 불변합니다. 이러한 원시 값의 특성은 데이터의 신뢰성을 보장합니다.

원시 값을 할당한 변수에 새로운 원시 값을 재할당하면 메모리 공간에 저장되어 있는 재할당 이전의 원시 값을 변경하는 것이 아니라 새로운 메모리 공간을 확보하고 재할당한 원시 값을 저장한 후, 변수는 새롭게 재할당한 원시 값을 가리킵니다. 이때 변수가 참조하던 메모리 공간의 주소가 바뀝니다.

변수가 참조하던 메모리 공간의 주소가 변경된 이유는 변수에 할당된 원시 값이 변경 불가능한 값이기 때문입니다. 만약 원시 값이 변경 가능한 값이라면 변수에 새로운 원시 값을 재할당했을 때 변수가 가리키던 메모리 공간의 주소를 바꿀 필요없이 원시 값 자체를 변경하면 그만입니다. 만약 그렇다면 변수가 참조하던 메모리 공간의 주소는 바뀌지 않습니다.

하지만 원시 값은 변경 불가능한 값이기 때문에 값을 직접 변경할 수 없습니다. 따라서 변수 값을 변경하기 위해 원시 값을 재할당하면 새로운 메모리 공간을 확보하고 재할당한 값을 저장한 후, 변수가 참조하던 메모리 공간의 주소를 변경합니다. 값의 이러한 특성을 불변성이라 합니다.

불변성을 갖는 원시 값을 할당한 변수는 재할당 이외에 변수 값을 변경할 수 있는 방법이 없습니다. 만약 재할당 이외에 원시 값인 변수 값을 변경할 수 있다면 예기치 않게 변수 값이 변경될 수 있다는 것을 의미합니다. 이는 값의 변경, 즉 상태 변경을 추적하기 어렵게 만듭니다.

문자열과 불변성

원시 값을 저장하려면 먼저 확보해야 하는 메모리 공간의 크기를 결정해야 합니다. 이를 위해 원시 타입별로 메모리 공간의 크기가 미리 정해져 있다고 했습니다. 단, ECMAScript 사양에 문자열 타입(2바이트)과 숫자 타입(8바이트) 이외의 원시 타입은 크기를 명확히 규정하고 있지는 않아서 브라우저 제조사의 구현에 따라 원시 타입의 크기는 다를 수 있습니다.

원시 값인 문자열은 다른 원시 값과 비교할 때 독특한 특징이 있습니다. 문자열은 0개 이상의 문자로 이뤄진 집합을 말하며, 1개의 문자는 2바이트의 메모리 공간에 저장됩니다. 따라서 문자열은 몇 개의 문자로 이뤄졌느냐에 따라 필요한 메모리 공간의 크기가 결정됩니다. 숫자 값은 1도, 1000000도 동일한 8바이트가 필요하지만 문자열의 경우 1개의 문자로 이뤄진 문자열은 2바이트, 10개의 문자로 이뤄진 문자열은 20바이트가 필요합니다.

// 문자열은 0개 이상의 문자로 이뤄진 집합입니다.
const str1 = '';      // 0개의 문자로 이뤄진 문자열(빈 문자열)
const str2 = 'Hello'; // 5개의 문자로 이뤄진 문자열

이 같은 이유로 C에는 하나의 문자를 위한 데이터 타입(char)만 있을 뿐 문자열 타입이 존재하지 않습니다. C에서는 문자열을 문자의 배열로 처리하고 자바에서는 문자열을 String 객체로 처리합니다.

하지만 자바스크립트는 개발자의 편의를 위해 원시 타입인 문자열 타입을 제공합니다. 이는 자바스크립트의 장점 중 하나입니다. 자바스크립트의 문자열은 원시 타입이며, 변경 불가능합니다. 이것은 문자열이 생성된 이후에는 변경할 수 없음을 의미합니다.

let str = 'Hello'
str = 'world'

첫 번째 문이 실행되면 문자열 ‘Hello’가 생성되고 식별자 str은 문자열 ‘Hello’가 저장된 메모리 공간의 첫 번째 메모리 셀 주소를 가리킵니다. 그리고 두 번째 문이 실행되면 이전에 생성된 문자열 ‘Hello’를 수정하는 것이 아니라 새로운 문자열 ‘world’를 메모리에 생성하고 식별자 str은 이것을 가리킵니다. 이때 문자열 ‘Hello’와 ‘world’는 모두 메모리에 존재합니다. 식별자 str은 문자열 ‘Hello’를 가리키고 있다가 문자열 ‘world’를 가리키도록 변경되었을 뿐입니다.

문자열은 유사 배열 객체이면서 이터러블이므로 배열과 유사하게 각 문자에 접근할 수 있습니다.

💡 유사배열 객체
유사 배열 객체란 마치 배열처럼 인덱스로 프로퍼티 값에 접근할 수 있고 length 프로퍼티를 갖는 객체를 말합니다. 문자열은 마치 배열처럼 인덱스를 통해 각 문자에 접근할 수 있으며, length 프로퍼티를 갖기 때문에 유사 배열 객체이고 for문으로 순회할 수도 있습니다.
const str = 'string'

// 문자열은 유사 배열이므로 배열과 유사하게 인덱스를 사용해 각 문자에 접근할 수 있습니다.
// 하지만 문자열은 원시 값이므로 변경할 수 없습니다. 이때 에러가 발생하지 않습니다.
str[0] = 'S'

console.log(str) // string​

원시 값인 문자열이 객체일 수도 있다니 혼란스러울 수 있겠지만 원시 값을 객체처럼 사용하면 원시 값을 감싸는 래퍼 객체로 자동 변환됩니다.

str[0] = ‘S’처럼 이미 생성된 문자열의 일부 문자를 변경해도 반영되지 않습니다. 문자열은 변경 불가능한 값이기 때문입니다. 이처럼 한번 생성된 문자열은 읽기 전용 값으로서 변경할 수 없습니다. 원시 값은 어떤 일이 있어도 불변합니다. 따라서 예기치 못한 변경으로부터 자유롭습니다. 이는 데이터의 신뢰성을 보장합니다.

그러나 변수에 새로운 문자열을 재할당하는 것은 물론 가능합니다. 이는 기존 문자열을 변경하는 것이 아니라 새로운 문자열을 새롭게 할당하는 것이기 때문입니다.

값에 의한 전달

let score = 80
const copy = score

console.log(score) // 80
console.log(copy) // 80

score = 100

console.log(score) // 100
console.log(copy) // ?

score 변수에 숫자 값 80을 할당했습니다. 그리고 copy 변수에 score 변수를 할당했습니다. 그 후, score 변수에 새로운 숫자 값 100을 재할당하면 copy 변수의 값은 어떻게 될까요?

이 질문의 핵심은 “번수에 변수를 할당했을 때 무엇이 어떻게 전달되는가?”입니다. copy = score에서 score는 변수 값 80이로 평가되므로 copy 변수에도 80이 할당될 것입니다. 이때 새로운 숫자 값 80이 생성되어 copy 변수에 할당됩니다.

이처럼 변수에 원시 값을 갖는 변수를 할당하면 할당받는 변수에는 할당되는 변수의 원시 값이 복사되어 전달됩니다. 이를 값에 의한 전달이라 합니다.

let score = 80

// copy 변수에는 score 변수의 값 80이 복사되어 할당됩니다.
const copy = score;

console.log(score, copy) // 80 80
console.log(score === copy) // true

이때 score 변수와 copy 변수는 숫자 값 80을 갖는다는 점에서 동일합니다. 하지만 score 변수와 copy 변수의 값 80은 다른 메모리 공간에 저장된 별개의 값입니다.

let score = 80

// copy 변수에는 score 변수의 값 80이 복사되어 할당됩니다.
const copy = score;

console.log(score, copy) // 80 80
console.log(score === copy) // true

// score 변수와 copy 변수의 값은 다른 메모리 공간에 저장된 별개의 값입니다.
// 따라서 score 변수의 값을 변경해도 copy 변수의 값에는 어떠한 영향도 주지 않습니다.
score = 100

console.log(score, copy) // 100 80
console.log(score === copy) // false

score 변수와 copy 변수의 값 80은 다른 메모리 공간에 저장된 별개의 값입니다. 따라서 score 변수의 값을 변경해도 copy 변수의 값에는 어떠한 영향도 주지 않습니다.

실제 자바스크립트 엔진의 내부 동작과 정확히 일치하지 않을 수 있습니다. ECMAScript 사양에는 변수를 통해 메모리를 어떻게 관리해야 하는지 명확하게 정의되어 있지 않습니다. 따라서 실제 자바스크립트 엔진을 구현하는 제조사에 따라 실제 내부 동작 방식은 미묘한 차이가 있을 수 있습니다.

변수에 원시 값을 갖는 변수를 할당하면 원시 값은 복사되는 것으로 표현했습니다. 하지만 변수에 원시 값을 갖는 변수를 할당하는 시점에는 두 변수가 같은 원시 값을 참조하다가 어느 한쪽의 변수에 재할당이 이뤄졌을 때 비로소 새로운 메모리 공간에 재할당된 값을 저장하도록 동작할 수도 있습니다. 참고로 파이썬은 이처럼 동작합니다.

또한 “값에 의한 전달”이라는 용어도 ECMAScript 사양에는 등장하지 않습니다. 타 언어에서 자주 사용하는 “값에 의한 전달”과 “참조에 의한 전달”이라는 용어를 사용하지만 “공유에 의한 전달”이라고 표현하는 경우도 있습니다.

“값에 의한 전달”이라는 용어는 자바스크립트를 위한 용어가 아니므로 오해가 있을 수도 있습니다. 엄격하게 표현하면 변수에는 값이 전달되는 것이 아니라 메모리 주소가 전달되기 때문입니다. 이는 변수와 같은 식별자는 값이 아니라 메모리 주소를 기억하고 있기 때문입니다.

식별자는 어떤 값을 구별해서 식별해낼 수 있는 고유한 이름입니다. 값은 메모리 공간에 저장되어 있습니다. 따라서 식별자는 메모리 공간에 저장되어 있는 어떤 값을 구별해서 식별해낼 수 있어야 하므로 변수와 같은 식별자는 값이 아니라 메모리 주소를 기억하고 있습니다

식별자로 값을 구별해서 식별한다는 것은 식별자가 기억하고 있는 메모리 주소를 통해 메모리 공간에 저장된 값에 접근할 수 있다는 것을 의미합니다. 즉, 식별자는 메모리 주소에 붙인 이름이라고 할 수 있습니다.

“값에 의한 전달”도 사실은 값을 전달하는 것이 아니라 메모리 주소를 전달합니다. 단, 전달된 메모리 주소를 통해 메모리 공간에 접근하면 값을 참조할 수 있습니다.

중요한 것은 변수에 원시 값을 갖는 변수를 할당하면 변수 할당 시점이든, 두 변수 중 어느 하나의 변수에 값을 재할당하는 시점이든 결국은 두 변수의 원시 값은 서로 다른 메모리 공간에 저장된 별개의 값이 되어 어느 한쪽에서 재할당을 통해 값을 변경하더라도 서로 간섭할 수 없다는 것입니다.

객체

객체는 프로퍼티의 개수가 정해져 있지 않으며, 동적으로 추가되고 삭제할 수 있습니다. 또한 프로퍼티의 값에도 제약이 없습니다. 따라서 객체는 원시 값과 같이 확보해야 할 메로리 공간의 크기를 사전에 정해 둘 수 없습니다.

객체는 복합적인 자료구조이므로 객체를 관리하는 방식이 원시 값과 비교해서 복잡하고 구현 방식도 브라우저 제조사마다 다를 수 있습니다. 원시 값은 상대적으로 적은 메모리를 소비하지만 객체는 경우에 따라 크기가 매우 클 수도 있습니다. 객체를 생성하고 프로퍼티에 접근하는 것도 원시 값과 비교할 때 비용이 많이 드는 일입니다.

따라서 객체는 원시 값과는 다른 방식으로 동작하도록 설계되어 있습니다.

💡 자바스크립트 객체의 관리 방식
자바스크립트 객체는 프로퍼티 키를 인덱스로 사용하는 해시 테이블(연관 배열)이라고 생각할 수 있습니다. 대부분의 자바스크립트 엔진은 해시 테이블과 유사하지만 높은 성능을 위해 일반적인 해시 테이블보다 더 나은 방법으로 객체를 구현합니다.
자바, C++ 같은 클래스 기반 객체지향 프로그래밍 언어는 사전에 정의된 클래스를 기반으로 객체(인스턴스)를 생성합니다. 다시 말해, 객체를 생성하기 이전에 이미 프로퍼티와 메서드가 정해져 있으며 그대로 객체를 생성합니다. 객체가 생성된 이후에는 프로퍼티를 삭제하거나 추가할 수 없습니다. 하지만 자바스크립트는 클래스 없이 객체를 생성할 수 있으며 객체가 생성된 이후라도 동적으로 프로퍼티와 메서드를 추가할 수 있습니다. 이는 사용하기 매우 편리하지만 성능 면에서는 이론적으로 클래스 기반 객체지향 프로그래밍 언어의 객체보다 생성과 프로퍼티 접근에 비용이 더 많이 드는 비효율적인 방식입니다.
따라서 V8 자바스크립트 엔진에서는 프로퍼티에 접근하기 위해 동적 탐색 대신 히든 클래스라는 방식을 사용해 C++ 객체의 프로퍼티에 접근하는 정도의 성능을 보장합니다. 히든 클래스는 자바와 같이 고정된 객체 레이아웃(클래스)와 유사하게 동작합니다.

변경 가능한 값

객체(참조) 타입의 값, 즉 객체는 변경 가능한 값입니다.

const person = {
	name: 'Lee'
}

원시 값을 할당한 변수가 기억하는 메모리 주소를 통해 메모리 공간에 접근하면 원시 값에 접근할 수 있습니다. 즉, 원시 값을 할당한 변수는 원시 값 자체를 값으로 가집니다. 하지만 객체를 할당한 변수가 기억하는 메모리 주소를 통해 메모리 공간에 접근하면 참조 값에 접근할 수 있습니다. 참조 값은 생성된 객체가 저장된 메모리 공간의 주소, 그 자체입니다.

객체를 할당한 변수에는 생서된 객체가 실제로 저장된 메모리 공간의 주소가 저장되어 있습니다. 이 값을 참조 값이라고 합니다. 변수는 이 참조값을 통해 객체에 접근할 수 있습니다.

원시 값을 할당한 변수를 참조하면 메모리 에 저장되어 있는 원시 값에 접근합니다. 하지만 객체를 할당한 변수를 참조하면 메모리에 저장되어 있는 참조 값을 통해 실제 객체에 접근합니다.

// 할당이 이뤄지는 시점에 객체 리터럴이 해석되고, 그 결과 객체가 생성됩니다.
const person = {
	name: 'Lee'
}

// person 변수에 저장되어 있는 참조 값으로 실제 객체에 접근합니다.
console.log(person) // {name: "Lee"}

일반적으로 원시 값을 할당한 변수의 경우 “변수는 O값을 갖는다” 또는 “변수의 값는 O다”라고 표현합니다. 하지만 객체를 할당한 변수의 경우 “변수는 객체를 참조하고 있다” 또는 “변수는 객체를 가리키고 있다”라고 표현합니다.

원시 값는 변경 불가능한 값이므로 원시 값을 갖는 변수의 값을 변경하려면 재할당 외에는 방법이 없습니다. 하지만 객체는 변경 가능한 값입니다. 따라서 객체를 할당한 변수는 재할당 없이 객체를 직접 변경할 수 있습니다. 즉, 재할당 없이 프로퍼티를 동적으로 추가할 수도 있고 프로퍼티 값을 갱신할 수도 있으며 프로퍼티 자체를 삭제할 수도 있습니다.

const person = {
	name: 'Lee'
}

// 프로퍼티 값 갱신
person.name = 'Kim'

// 프로퍼티 값 동적 생성
person.address = 'Seoul'

console.log(person) // {name: "Kim", address: "Seoul"}

원시 값은 변경 불가능한 값이므로 메모리에 저장된 객체를 직접 수정할 수 있습니다. 이때 객체를 할당한 변수에 재할당을 하지 않았으므로 객체를 할당한 변수의 참조 값은 변경되지 않습니다.

객체를 생성하고 관리하는 방식은 매우 복잡하며 비용이 많이 드는 일입니다. 객체를 변경할 때마다 원시 값처럼 이전 값을 복사해서 새롭게 생성한다면 명확하고 신뢰성이 확보되겠지만 객체는 크기가 매우 클 수도 있고, 원시 값처럼 크기가 일정하지도 않으며, 프로퍼티 값이 객체일 수도 있어서 복사해서 생성하는 비용이 많이 듭니다. 다시 말해, 메모리의 효율적 소비가 어렵고 성능이 나빠집니다.

따라서 메모리를 효율적으로 사용하기 위해, 그리고 객체를 복사해 생성하는 비용을 절약하여 성능을 향상시키기 위해 객체는 변경 가능한 값으로 설계되어 있습니다. 메모리 사용의 효율서오가 성능을 위해 어느 정도의 구조적인 단점을 감안한 설계라고 할 수 있습니다.

객체는 이러한 구조적 단점에 따른 부작용이 있습니다. 그것은 원시 값과는 다르게 여러 개의 식별자가 하나의 객체를 공유할 수 있다는 것입니다.

💡 얕은 복사와 깊은 복사
객체를 프로퍼티 값으로 갖는 객체의 경우 얕은 복사는 한 단계까지만 복사하는 것을 말하고 깊은 목사는 객체에 중첩되어 있는 객체까지 모두 복사하는 것을 말합니다.
const o = { x: { y: 1 } }

// 얕은 복사
const c1 = { ...o }
console.log(c1 === o) // false
console.log(c1.x === o.x) // true

// lodash의 cloneDeep을 사용한 깊은 복사 (Node.js 환경)
const _ = require('lodash')
// 깊은 복사
const c2 = _.cloneDeep(o)
console.log(c1 === o) // false
console.log(c1.x === o.x) // false​

얕은 복사와 깊은 복사로 생성된 객체는 원본과는 다른 객체입니다. 즉, 원본과 복사본은 참조 값이 다른 별개의 객체입니다. 하지만 얕은 복사는 객체에 중첩되어 있는 객체의 경우 참조 값을 복사하고 깊은 복사는 객체에 중첩되어 있는 객체까지 모두 복사해서 원시 값처럼 완전한 복사본을 만든다는 차이가 있습니다.

참조에 의한 전달

const person = {
	name: 'Lee'
}

// 참조 값을 복사(얕은 복사)
const copy = person

객체를 가리키는 변수(원본, person)를 다른 변수(사본, copy)에 할당하면 원본의 참조 값이 복사되어 전달됩니다. 이를 참조에 의한 전달이라 합니다.

원본 person을 사본 copy에 할당하면 원본 person의 참조 값을 복사해서 copy에 저장합니다. 이때 원본 person과 사본 copy는 저장된 메모리 주소는 다르지만 동일한 참조 값을 갖습니다. 다시 말해, 원본 person과 사본 copy 모두 동일한 객체를 가리킵니다. 이것은 두 개의 식별자가 하나의 객체를 공유한다는 것을 의미합니다. 따라서 원본 또는 사본 중 어느 한쪽에서 객체를 변경(변수에 새로운 객체를 재할당하는 것이 아니라 객체의 프로퍼티 값을 변경하거나 프로퍼티를 추가, 삭제)하면 서로 영향을 주고받습니다.

const person = {
	name: 'Lee'
}

// 참조 값을 복사(얕은 복사). copy와 person은 동일한 참조 값을 갖습니다.
const copy = person

// copy와 person은 동일한 객체를 참조합니다.
console.log(copy === person) // true

// copy를 통해 객체를 변경합니다.
copy.name = 'Kim'

// person을 통해 객체를 변경합니다.
person.address = 'Seoul'

// copy와 person은 동일한 객체를 가리킵니다.
// 따라서 어느 한쪽에서 객체를 변경하면 서로 영향을 주고받습니다.
console.log(person) // {name: "Kim", address: "Seoul"}
console.log(copy) // {name: "Kim", address: "Seoul"}

결국 “값에 의한 전달”과 “참조에 의한 전달”은 식별자가 기억하는 메모리 공간에 저장되어 있는 값을 복사해서 전달한다는 면에서 동일합니다. 다만 식별자가 기억하는 메모리 공간, 즉 변수에 저장되어 있는 값이 원시 값이냐 참조 값이냐의 차이만 있을 뿐입니다. 따라서 자바스크립트에는 “참조에 의한 전달”은 존재하지 않고 “값에 의한 전달”만이 존재한다고 말할 수 있습니다.

자바스크립트의 이 같은 동작 방식을 설명하는 정확한 용어가 존재하지 않습니다. 이런 이유로 “값에 의한 전달”이나 “참조에 의한 전달”이라는 용어를 사용하지 않고 “공유에 의한 전달"이라고 표현하는 경우도 있습니다. 하지만 이 용어 또한 ECMAScript 사양에 정의한 자바스크립트의 공식적인 용어는 아니며 자바스크립트의 동작 방식을 정확히 설명하지 못합니다.

전달되는 값의 종류가 원시 값인지 참조 값인지 구별해서 강조하는 의미에서 “값에 의한 전달”과 “참조에 의한 전달”로 구분하여 부르기도 하지만 자바스크립트에는 포인터가 존재하지 않기 때문에 포인터가 존재하는 다른 프로그래밍 언어의 “참조에 의한 전달”과 의미가 정확히 일치하지 않습니다.