복붙노트

[SCALA] 어떻게 스칼라에서 서로 다른 두 개의 dataframe 인쇄 열을 비교

SCALA

어떻게 스칼라에서 서로 다른 두 개의 dataframe 인쇄 열을 비교

우리는 여기서 두 개의 데이터 프레임을 가지고 :

예상 dataframe :

+------+---------+--------+----------+-------+--------+
|emp_id| emp_city|emp_name| emp_phone|emp_sal|emp_site|
+------+---------+--------+----------+-------+--------+
|     3|  Chennai|  rahman|9848022330|  45000|SanRamon|
|     1|Hyderabad|     ram|9848022338|  50000|      SF|
|     2|Hyderabad|   robin|9848022339|  40000|      LA|
|     4|  sanjose|   romin|9848022331|  45123|SanRamon|
+------+---------+--------+----------+-------+--------+

실제 데이터 프레임 :

+------+---------+--------+----------+-------+--------+
|emp_id| emp_city|emp_name| emp_phone|emp_sal|emp_site|
+------+---------+--------+----------+-------+--------+
|     3|  Chennai|  rahman|9848022330|  45000|SanRamon|
|     1|Hyderabad|     ram|9848022338|  50000|      SF|
|     2|Hyderabad|   robin|9848022339|  40000|      LA|
|     4|  sanjose|  romino|9848022331|  45123|SanRamon|
+------+---------+--------+----------+-------+--------+

두 dataframes의 차이는 지금 :

+------+--------+--------+----------+-------+--------+
|emp_id|emp_city|emp_name| emp_phone|emp_sal|emp_site|
+------+--------+--------+----------+-------+--------+
|     4| sanjose|  romino|9848022331|  45123|SanRamon|
+------+--------+--------+----------+-------+--------+

그러나 우리는이의 문제, 그것은 다른 전체 행을 반환, 기능 df1.except (DF2) 제외를 사용하고 있습니다. 우리가 원하는 것은 해당 행 내에서 다른 열을 참조하는 것입니다 (이 경우, "romin"와 "EMP_NAME"에서 "romino"는 다릅니다). 우리는 그것으로 엄청난 어려움을 겪고있다 및 도움은 좋은 것입니다.

해결법

  1. ==============================

    1.그 차이는 열이 아닌 행 사이에서 발견하는 것처럼 위의 질문에 설명되어있는 시나리오에서, 그것은 보인다.

    그 차이는 열이 아닌 행 사이에서 발견하는 것처럼 위의 질문에 설명되어있는 시나리오에서, 그것은 보인다.

    그래서, 우리는 우리에게 값과 함께, 다른 값을 가지고있는 열을 제공 할 것이다, 여기에 선택적 차이를 적용 할 필요가 그렇게하기 위해서이다.

    이제 선택의 차이를 적용하기 위해 우리는이 같은 코드 뭔가를 작성해야합니다 :

    그리고, 우리는 서로 다른 값을 포함에만 열을 얻을 것이다. 이 같이 :

    +--------+
    |emp_name|
    +--------+
    |  romino|
    +--------+
    

    이게 도움이 되길 바란다!

  2. from https://stackoverflow.com/questions/44338412/how-to-compare-two-dataframe-and-print-columns-that-are-different-in-scala by cc-by-sa and MIT license