Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Comment: Published by Scroll Versions from space ML1 and version 5.3
Sv translation
languageen

This section describes some of the advanced controls that are available for managing data distribution within Xpand.

Key Terms Used in this Section:

Relation - Each table in Xpand is referred to as a “relation”.

Representation - Each index is called a “Representation” in Xpand. Table data is stored in the “Base Representation”, the relational representation indexed by an internal key that that covers all of the columns of the base table. For tables keyed by a primary key, the data for the “Base Representation” is stored with the primary key.

Distribution Key - Each representation has all or a portion of its index hashed using a consistent hashing algorithm. A “distribution key” defines which columns of an index are used to construct that hash. The default distribution for indexes is 1, meaning the first column of an representation (index) will be hashed and become the distribution key for that representation.

Slices - Xpand breaks each representation into smaller, more manageable segments called “slices”. Slices are then distributed throughout the cluster to facilitate evenly distributed query processing.

Replicas - Xpand maintains multiple copies of each slice of data to provide fault tolerance and high-availability. Replicas are distributed throughout the cluster to optimize performance and to ensure all data is protected in the event of a node failure.


The default behavior for distribution, slices, and replicas is optimal for the majority of workloads. For more information please refer to the following:

DISTRIBUTE 

SLICES

REPLICAS  

On Xpand, the SHOW CREATE TABLE command will display information for key distribution, slices, and replicas defined for a table.

Xpand Support is available for recommendations regarding fine-tuning data distribution strategies.

Sv translation
languageko

이 섹션에서는 ClustrixDB 내의 데이터 분포를 관리하는 데 사용할 수 있는 몇 가지 고급 컨트롤에 대해 설명합니다.

이 섹션에서 사용되는 주요 용어

Relation - ClustrixDB의 각 테이블을 “relation”이라고 합니다.

Representation - 각 인덱스는 ClustrixDB에서 "Representation"이라고 합니다. 테이블 데이터는 기본 테이블의 모든 열을 커버하는 내부 키에 의해 인덱스 된 관계형 "Base Representation"에 저장됩니다. 기본 키(primary key)가 있는 테이블의 경우 "Base Representation'의 데이터는 기본 키와 함께 저장됩니다.

분산 키 (Distribution Key) - 각 representation은 일관된 해싱 알고리즘(consistent hashing algorithm)을 사용하여 인덱스의 전부 또는 일부를 가집니다. "분산 키"는 해당 해시를 생성하는 데 사용되는 인덱스의 열을 정의합니다. 인덱스의 분산 키 기본값은 1입니다. 즉, representation(인덱스)의 첫 번째 열이 해시 되고 해당 representation의 분산 키가 됩니다.

슬라이스 (Slices) - ClustrixDB는 각 representation을 "슬라이스"라고 하는 더 작고 관리하기 쉬운 조각으로 나눕니다. 슬라이스는 분산 쿼리 처리가 용이하도록 클러스터 전체에 분산됩니다.

복제본 (Replicas) - ClustrixDB는 각 데이터 슬라이스의 여러 복제본을 유지 관리하여 내결함성과 고가용성을 제공합니다. Replicas는 클러스터 전체에 분산되어 성능을 최적화하고 노드 장애 시 모든 데이터가 보호되는지 확인합니다.


분산, 슬라이스 및 replicas의 기본 동작은 대부분의 워크로드에 최적화되어 있습니다. 자세한 내용은 다음을 참조하십시오.

DISTRIBUTE

SLICES

REPLICAS

ClustrixDB에서 SHOW CREATE TABLE 명령은 테이블에 정의된 키 분산, 슬라이스 및 복제본에 대한 정보를 표시합니다.

데이터 분산 전략에 대한 세부적인 튜닝 방법은 Clustrix 지원팀에 문의하십시오.