복붙노트

[SQL] 직교 제품에 SQL 쿼리 리드에서 UDF를 사용하는 이유는 무엇입니까?

SQL

직교 제품에 SQL 쿼리 리드에서 UDF를 사용하는 이유는 무엇입니까?

나는 Databricks-질문을보고 이해가 안 돼요

여기 Databricks-질문을 인용 :

해결법

  1. ==============================

    1.사용하여 UDF의 직교 제품을 필요로하는 이유는 매우 간단합니다. 당신은 가능성이 무한 도메인과없는 동작으로 그 값을 판단 할 수있는 유일한 방법은 임의의 기능을 전달하기 때문에 인수를 전달하고 평가하는 것입니다. 그것은 당신이 단순히 모든 가능한 쌍을 확인하는 것을 의미합니다.

    사용하여 UDF의 직교 제품을 필요로하는 이유는 매우 간단합니다. 당신은 가능성이 무한 도메인과없는 동작으로 그 값을 판단 할 수있는 유일한 방법은 임의의 기능을 전달하기 때문에 인수를 전달하고 평가하는 것입니다. 그것은 당신이 단순히 모든 가능한 쌍을 확인하는 것을 의미합니다.

    다른 손에서 간단한 평등은 예측 가능한 행동이있다. 당신이 t1.foo를 사용하는 경우 = t2.bar 조건 당신은 foo에 의해 간단하게 셔플 T1과 T2의 행과 예상 결과를 얻기 위해 각각 바 있습니다.

    그리고 단지 실제로 자연 조인을 사용하여 표현 조인 관계 대수의 외부에서 정확합니다. 그 이상 아무것도 단순히 최적화입니다.

    정말, 당신은 스파크 SQL 엔진을 수정하지 않으려면.

  2. from https://stackoverflow.com/questions/32952080/why-using-a-udf-in-a-sql-query-leads-to-cartesian-product by cc-by-sa and MIT license