데이터 마이닝 기술을 사용하면 사용자는 관계형 데이터베이스와 다차원 OLAP 큐브의 데이터를 분석하여 예측에 사용할 수 있는 패턴과 경향을 찾을 수 있습니다. SQL Server 2000의 데이터 마이닝 기능은 관계형 및 OLAP 데이터 원본과 밀접하게 통합됩니다.
SQL Server 2000에는 Microsoft Research에서 개발한 두 가지 클래스의 데이터 마이닝 알고리즘(Microsoft Decision Trees와 Microsoft Clustering)이 포함되어 있습니다. 또한, SQL Server 2000의 데이터 마이닝은 여러 협력 업체에서 개발한 알고리즘도 지원합니다.
| • | Microsoft Decision Trees 알고리즘. 이 알고리즘은 분류를 기반으로 하고 있습니다. 알고리즘은 팩트 테이블의 열을 기준으로 팩트 테이블의 다른 열의 값을 예측하는 의사 결정 트리를 작성합니다. 이 알고리즘은 특정한 배너 광고를 클릭하거나 전자 상거래 사이트에서 특정 제품을 구매할 것 같은 사람을 식별하는 데 사용할 수 있습니다. |
| • | Microsoft Clustering 알고리즘. 이 알고리즘은 레코드를 유사하거나 예측 가능한 특성을 나타내는 클러스터로 그룹화합니다. 하지만 가끔 이러한 특성이 나타나지 않거나 직관적으로 알아낼 수 없을 때도 있습니다. 클러스터링 알고리즘은 잠재력을 가진 자동차 구매자를 그룹화한 다음 각 자동차 구매 세그먼트를 대변하는 마케팅 캠페인 작성 방법을 결정하는 데 사용할 수 있습니다. |