728x90
중복도가 ‘낮으면’ 카디널리티가 ‘높다’고 표현하고
중복도가 ‘높으면’ 카디널리티가 ‘낮다’고 표현한다.
카디널리티는 전체 행에 대한 특정 컬럼의 중복 수치를 나타내는 지표이다.
이 카디널리티는 상대적인 개념으로 접근을 해야하는데
그 중에 한 예로 학교에서 한 반이 인원이 40명이라고 한다면 같은 이름을 가질 확률은 상대적으로
적으므로 이름이란 특성은 카디널리티가 높다고 할 수 있다. 하지만 한 지역이나 나라로 보자면
같은 이름은 많기 때문에 상대적으로 카디널리티가 상당히 낮다고 볼 수 있다.
'공부 > 새로 배운 상식들' 카테고리의 다른 글
임계값(threshold)이란? (0) | 2022.03.07 |
---|---|
회귀(Regression)와 분류(Classification)란? (0) | 2022.03.03 |
선형 회귀란(Linear Regression)? (0) | 2022.02.09 |
편차와 표준편차 정리 (0) | 2022.01.28 |
평균,기대값,중앙값 등 용어정리 (0) | 2022.01.28 |
댓글