Exam Certified Associate Developer for Apache Spark topic 1 question 75 discussion

Actual exam question from Databricks's Certified Associate Developer for Apache Spark

Question #: 75
Topic #: 1

[All Certified Associate Developer for Apache Spark Questions]

QUESTION NO: 75 -

Which of the following code blocks returns a DataFrame where column divisionDistinct is the approximate number of distinct values in column division from DataFrame storesDF?

A. storesDF.withColumn("divisionDistinct", approx_count_distinct(col("division")))
B. storesDF.agg(col("division").approx_count_distinct("divisionDistinct"))
C. storesDF.agg(approx_count_distinct(col("division")).alias("divisionDistinct"))
D. storesDF.withColumn("divisionDistinct", col("division").approx_count_distinct())
E. storesDF.agg(col("division").approx_count_distinct().alias("divisionDistinct"))

Show Suggested Answer

Suggested Answer: C 🗳️

by Sowwy1 at April 2, 2024, 1:05 p.m.

Comments

Submit Cancel

Sowwy1

9 months, 1 week ago

I think it's C https://spark.apache.org/docs/3.1.2/api/python/reference/api/pyspark.sql.functions.approx_count_distinct.html

upvoted 2 times

...