[SCALA] 어떻게 스파크 SQL에서 내림차순으로 열을 기준으로 정렬하려면?
SCALA어떻게 스파크 SQL에서 내림차순으로 열을 기준으로 정렬하려면?
나는 (10)를 보여줍니다. df.orderBy ( "COL1")을 시도했지만이 오름차순으로 정렬. df.sort ( "COL1은"). 또한 내림차순으로 정렬 (10)를 보여줍니다. I에 유래에보고하고 내가 찾은 답은 모두 구식이었다 또는 RDDs 언급했다. 나는 불꽃 네이티브 dataframe를 사용하고 싶습니다.
해결법
-
==============================
1.할 수 있습니다 스파크 SQL 함수를 가져 와서도 일종의 열
할 수 있습니다 스파크 SQL 함수를 가져 와서도 일종의 열
import org.apache.spark.sql.functions._ df.orderBy(asc("col1"))
또는
import org.apache.spark.sql.functions._ df.sort(desc("col1"))
sqlContext.implicits._ 가져 오기
import sqlContext.implicits._ df.orderBy($"col1".desc)
또는
import sqlContext.implicits._ df.sort($"col1".desc)
-
==============================
2.그것은 정렬 방법에 대한 org.apache.spark.sql.DataFrame에있다 :
그것은 정렬 방법에 대한 org.apache.spark.sql.DataFrame에있다 :
df.sort($"col1", $"col2".desc)
정렬 열에 대한 참고 $ 및 .desc 내부 기준으로 결과를 정렬합니다.
-
==============================
3.PySpark 만
PySpark 만
PySpark에서 동일한 작업을 수행하고자 할 때이 게시물을 가로 질러왔다. 가장 쉬운 방법은 바로 상승이 False = 매개 변수를 추가하는 것입니다 :
df.orderBy("col1", ascending=False).show(10)
참조 : http://spark.apache.org/docs/2.1.0/api/python/pyspark.sql.html#pyspark.sql.DataFrame.orderBy
-
==============================
4.
import org.apache.spark.sql.functions.desc df.orderBy(desc("columnname1"),desc("columnname2"),asc("columnname3"))
-
==============================
5.
df.sort($"ColumnName".desc).show()
-
==============================
6.자바의 경우 :
자바의 경우 :
조인 적용하는 동안 우리는 DataFrames를 사용하는 경우 (여기에 내부 조인), 우리가 할 수있는 일종의 각 DF에서 고유 요소를 선택한 후 (ASC의) :
Dataset<Row> d1 = e_data.distinct().join(s_data.distinct(), "e_id").orderBy("salary");
E_ID 컬럼이다 ASC 급여으로 정렬되는 반면에인가 조인.
또한, 우리는 스파크 SQL을 같이 사용할 수 있습니다 :
SQLContext sqlCtx = spark.sqlContext(); sqlCtx.sql("select * from global_temp.salary order by salary desc").show();
어디
from https://stackoverflow.com/questions/30332619/how-to-sort-by-column-in-descending-order-in-spark-sql by cc-by-sa and MIT license
'SCALA' 카테고리의 다른 글
[SCALA] 어떻게를 java.util.List에 scala.List를 변환하는? (0) | 2019.11.11 |
---|---|
[SCALA] 스파크 dataframe로부터 NULL 값을 필터링하는 방법 (0) | 2019.11.11 |
[SCALA] Build.scala, %와 의미 %% 문자 (0) | 2019.11.11 |
[SCALA] 구문 분석 CSV 파일을 사용 스칼라 파서 콤비 (0) | 2019.11.11 |
[SCALA] 어떻게 스칼라의 하위 디렉토리에있는 모든 파일을 나열 하는가? (0) | 2019.11.11 |