最新的Microsoft Data Engineering on Microsoft Azure (DP-203 Korean Version) - DP-203 Korean免費考試真題
問題1
소매점 테이블에 대리 키를 구현해야 합니다. 솔루션은 판매 거래 데이터 세트 요구 사항을 충족해야 합니다.
무엇을 만들어야 합니까?
무엇을 만들어야 합니까?
正確答案: B
說明:(僅 VCESoft 成員可見)
問題2
참고: 이 질문은 동일한 시나리오를 제시하는 일련의 질문 중 일부입니다. 시리즈의 각 질문에는 명시된 목표를 충족할 수 있는 고유한 솔루션이 포함되어 있습니다. 일부 질문 세트에는 하나 이상의 올바른 솔루션이 있을 수 있지만 다른 질문 세트에는 올바른 솔루션이 없을 수 있습니다.
이 시나리오에서 질문에 답한 후에는 해당 질문으로 돌아갈 수 없습니다. 결과적으로 이러한 질문은 검토 화면에 나타나지 않습니다.
100GB의 파일이 포함된 Azure Storage 계정이 있습니다. 파일에는 텍스트와 숫자 값이 포함되어 있습니다. 행의 75%에는 평균 길이가 1.1MB인 설명 데이터가 포함되어 있습니다.
스토리지 계정에서 Azure SQL 데이터 웨어하우스로 데이터를 복사할 계획입니다.
데이터가 빠르게 복사되도록 파일을 준비해야 합니다.
해결 방법: 각 행이 1MB보다 크도록 파일을 수정합니다.
이것이 목표를 달성합니까?
이 시나리오에서 질문에 답한 후에는 해당 질문으로 돌아갈 수 없습니다. 결과적으로 이러한 질문은 검토 화면에 나타나지 않습니다.
100GB의 파일이 포함된 Azure Storage 계정이 있습니다. 파일에는 텍스트와 숫자 값이 포함되어 있습니다. 행의 75%에는 평균 길이가 1.1MB인 설명 데이터가 포함되어 있습니다.
스토리지 계정에서 Azure SQL 데이터 웨어하우스로 데이터를 복사할 계획입니다.
데이터가 빠르게 복사되도록 파일을 준비해야 합니다.
해결 방법: 각 행이 1MB보다 크도록 파일을 수정합니다.
이것이 목표를 달성합니까?
正確答案: B
說明:(僅 VCESoft 成員可見)
問題3
참고: 질문은 동일한 시나리오를 제시하는 일련의 질문의 일부입니다. 시리즈의 각 질문에는 명시된 목표를 충족할 수 있는 고유한 솔루션이 포함되어 있습니다. 일부 질문 세트에는 하나 이상의 올바른 솔루션이 있을 수 있지만 다른 질문 세트에는 올바른 솔루션이 없을 수 있습니다.
이 섹션에서 질문에 답한 후에는 다시 돌아올 수 없습니다. 따라서 이러한 질문은 검토 화면에 나타나지 않습니다. 준비 영역이 포함된 Azure Data Lake Storage 계정이 있습니다.
스테이징 영역에서 증분 데이터를 수집하고 R 스크립트를 실행하여 데이터를 변환한 다음 변환된 데이터를 Azure Synapse Analytics의 데이터 웨어하우스에 삽입하도록 유제품 프로세스를 설계해야 합니다.
솔루션: Azure Data Factory 일정 트리거를 사용하여 낮은 데이터 매핑을 실행하는 파이프라인을 실행합니다. 그런 다음 데이터를 데이터 웨어하우스에 삽입합니다.
이것이 목표를 달성합니까?
이 섹션에서 질문에 답한 후에는 다시 돌아올 수 없습니다. 따라서 이러한 질문은 검토 화면에 나타나지 않습니다. 준비 영역이 포함된 Azure Data Lake Storage 계정이 있습니다.
스테이징 영역에서 증분 데이터를 수집하고 R 스크립트를 실행하여 데이터를 변환한 다음 변환된 데이터를 Azure Synapse Analytics의 데이터 웨어하우스에 삽입하도록 유제품 프로세스를 설계해야 합니다.
솔루션: Azure Data Factory 일정 트리거를 사용하여 낮은 데이터 매핑을 실행하는 파이프라인을 실행합니다. 그런 다음 데이터를 데이터 웨어하우스에 삽입합니다.
이것이 목표를 달성합니까?
正確答案: A
問題4
Azure Event Hubs의 거의 실시간 데이터에서 사용자 지정 독점1 Python 함수를 사용할 통계 분석 솔루션을 설계하고 있습니다.
통계 분석을 수행하는 데 사용할 Azure 서비스를 권장해야 합니다. 솔루션은 대기 시간을 최소화해야 합니다.
무엇을 추천해야 할까요?
통계 분석을 수행하는 데 사용할 Azure 서비스를 권장해야 합니다. 솔루션은 대기 시간을 최소화해야 합니다.
무엇을 추천해야 할까요?
正確答案: D
說明:(僅 VCESoft 成員可見)
問題5
Azure Event Hub에서 스트리밍 데이터를 처리하고 데이터를 Azure Data Lake Storage로 출력하는 솔루션을 설계해야 합니다. 솔루션은 분석가가 스트리밍 데이터를 대화형으로 쿼리할 수 있도록 보장해야 합니다.
무엇을 사용해야 합니까?
무엇을 사용해야 합니까?
正確答案: D
說明:(僅 VCESoft 成員可見)
問題6
Azure Stream Analytics 창 기능을 구현하고 있습니다.
각 요구 사항에 대해 어떤 윈도우 함수를 사용해야 합니까? 대답하려면 대답 영역에서 적절한 옵션을 선택하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

각 요구 사항에 대해 어떤 윈도우 함수를 사용해야 합니까? 대답하려면 대답 영역에서 적절한 옵션을 선택하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

正確答案:

問題7
Azure Synapse Analytics 전용 SQL 풀에서 분할된 테이블을 만들어야 합니다.
Transact-SQL 문을 어떻게 완성해야 합니까? 응답하려면 적절한 값을 올바른 대상으로 드래그하십시오. 각 값은 한 번, 두 번 이상 사용되거나 전혀 사용되지 않을 수 있습니다. 콘텐츠를 보려면 창 사이의 분할 막대를 끌거나 스크롤해야 할 수 있습니다.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

Transact-SQL 문을 어떻게 완성해야 합니까? 응답하려면 적절한 값을 올바른 대상으로 드래그하십시오. 각 값은 한 번, 두 번 이상 사용되거나 전혀 사용되지 않을 수 있습니다. 콘텐츠를 보려면 창 사이의 분할 막대를 끌거나 스크롤해야 할 수 있습니다.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

正確答案:

Explanation:

Box 1: DISTRIBUTION
Table distribution options include DISTRIBUTION = HASH ( distribution_column_name ), assigns each row to one distribution by hashing the value stored in distribution_column_name.
Box 2: PARTITION
Table partition options. Syntax:
PARTITION ( partition_column_name RANGE [ LEFT | RIGHT ] FOR VALUES ( [ boundary_value [,...n] ] )) Reference:
https://docs.microsoft.com/en-us/sql/t-sql/statements/create-table-azure-sql-data-warehouse?
問題8
7개의 주요 지역에 분산된 2,500만 대의 장치에서 원격 분석 데이터를 위한 Azure Data Lake Storage Gen2 구조를 설계하고 있습니다. 1분마다 장치는 메트릭의 JSON 페이로드를 Azure Event Hubs로 보냅니다.
dat에 대한 폴더 구조를 권장해야 합니다.
ㅏ. 솔루션은 다음 요구 사항을 충족해야 합니다.
각 지역의 데이터 엔지니어는 해당 지역의 데이터에 대해서만 자체 파이프라인을 구축할 수 있어야 합니다.
Azure Synapse Analytics 서버리스 SQL 풀에 포함하려면 데이터를 15분마다 한 번 이상 처리해야 합니다.
구조 완성을 어떻게 권장해야 합니까? 응답하려면 적절한 값을 올바른 대상으로 드래그하십시오. 각 값은 한 번, 두 번 이상 사용되거나 전혀 사용되지 않을 수 있습니다. 콘텐츠를 보려면 창 사이의 분할 막대를 끌거나 스크롤해야 할 수 있습니다.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

dat에 대한 폴더 구조를 권장해야 합니다.
ㅏ. 솔루션은 다음 요구 사항을 충족해야 합니다.
각 지역의 데이터 엔지니어는 해당 지역의 데이터에 대해서만 자체 파이프라인을 구축할 수 있어야 합니다.
Azure Synapse Analytics 서버리스 SQL 풀에 포함하려면 데이터를 15분마다 한 번 이상 처리해야 합니다.
구조 완성을 어떻게 권장해야 합니까? 응답하려면 적절한 값을 올바른 대상으로 드래그하십시오. 각 값은 한 번, 두 번 이상 사용되거나 전혀 사용되지 않을 수 있습니다. 콘텐츠를 보려면 창 사이의 분할 막대를 끌거나 스크롤해야 할 수 있습니다.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

正確答案:

Explanation:
Box 1: {YYYY}/{MM}/{DD}/{HH}
Date Format [optional]: if the date token is used in the prefix path, you can select the date format in which your files are organized. Example: YYYY/MM/DD Time Format [optional]: if the time token is used in the prefix path, specify the time format in which your files are organized. Currently the only supported value is HH.
Box 2: {regionID}/raw
Data engineers from each region must be able to build their own pipelines for the data of their respective region only.
Box 3: {deviceID}
Reference:
https://github.com/paolosalvatori/StreamAnalyticsAzureDataLakeStore/blob/master/README.md
問題9
웹 사이트 분석 시스템에서 다운로드, 링크 클릭, 양식 제출 및 비디오 재생과 같은 사용자 상호 작용에 대한 데이터 추출을 받습니다.
데이터에는 다음 열이 포함됩니다.

데이터의 분석 쿼리를 지원하려면 스타 스키마를 디자인해야 합니다. 스타 스키마에는 날짜 차원을 포함하여 4개의 테이블이 포함됩니다.
각 열을 어떤 테이블에 추가해야 합니까? 대답하려면 대답 영역에서 적절한 옵션을 선택하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

데이터에는 다음 열이 포함됩니다.

데이터의 분석 쿼리를 지원하려면 스타 스키마를 디자인해야 합니다. 스타 스키마에는 날짜 차원을 포함하여 4개의 테이블이 포함됩니다.
각 열을 어떤 테이블에 추가해야 합니까? 대답하려면 대답 영역에서 적절한 옵션을 선택하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

正確答案:

Explanation:

Box 1: DimEvent
Box 2: DimChannel
Box 3: FactEvents
Fact tables store observations or events, and can be sales orders, stock balances, exchange rates, temperatures, etc Reference:
https://docs.microsoft.com/en-us/power-bi/guidance/star-schema
問題10
Azure 구독이 있습니다.
Azure Data Lake Storage Gen2 Premium 계정을 배포해야 합니다. 솔루션은 다음 요구 사항을 충족해야 합니다.
* 365일이 지난 Blob은 삭제해야 합니다.
* 관리자의 노력을 최소화해야 합니다.
* 비용을 최소화해야 합니다.
무엇을 사용해야 합니까? 대답하려면 대답에서 적절한 옵션을 선택하십시오. 참고 각 올바른 선택은 1점의 가치가 있습니다.

Azure Data Lake Storage Gen2 Premium 계정을 배포해야 합니다. 솔루션은 다음 요구 사항을 충족해야 합니다.
* 365일이 지난 Blob은 삭제해야 합니다.
* 관리자의 노력을 최소화해야 합니다.
* 비용을 최소화해야 합니다.
무엇을 사용해야 합니까? 대답하려면 대답에서 적절한 옵션을 선택하십시오. 참고 각 올바른 선택은 1점의 가치가 있습니다.

正確答案:

Explanation:

https://learn.microsoft.com/en-us/azure/storage/blobs/premium-tier-for-data-lake-storage
問題11
회사에는 Microsoft Azure에서 호스팅되는 실시간 데이터 분석 솔루션이 있습니다. 이 솔루션은 Azure Event Hub를 사용하여 데이터를 수집하고 Azure Stream Analytics 클라우드 작업을 사용하여 데이터를 분석합니다. 클라우드 작업은 120 SU(스트리밍 단위)를 사용하도록 구성됩니다.
Azure Stream Analytics 작업의 성능을 최적화해야 합니다.
어떤 두 가지 작업을 수행해야 합니까? 각 정답은 솔루션의 일부를 나타냅니다.
참고: 각 올바른 선택은 1점의 가치가 있습니다.
Azure Stream Analytics 작업의 성능을 최적화해야 합니다.
어떤 두 가지 작업을 수행해야 합니까? 각 정답은 솔루션의 일부를 나타냅니다.
참고: 각 올바른 선택은 1점의 가치가 있습니다.
正確答案: B,F
說明:(僅 VCESoft 成員可見)
問題12
GZRS(지역 중복 스토리지)를 포함하는 고가용성 Azure Data Lake Storage 솔루션을 설계하고 있습니다.
RPO(복구 지점 목표)에 영향을 줄 수 있는 복제 지연을 모니터링해야 합니다.
모니터링 솔루션에 무엇을 포함해야 합니까?
RPO(복구 지점 목표)에 영향을 줄 수 있는 복제 지연을 모니터링해야 합니다.
모니터링 솔루션에 무엇을 포함해야 합니까?
正確答案: A
說明:(僅 VCESoft 成員可見)

