deduplicate: different file contents found in the following:
build.sbt
assemblyMergeStrategy in assembly := {
//case PathList("META-INF", xs @ _*) => MergeStrategy.discard
case PathList("META-INF", xs @ _*) => MergeStrategy.discard
case x => MergeStrategy.last
}
reference: http://queirozf.com/entries/creating-scala-fat-jars-for-spark-on-sbt-with-sbt-assembly-plugin
'data engineering' 카테고리의 다른 글
Hive table partition의 조각 모음 (concatenate) (0) | 2021.07.31 |
---|---|
쉡스크립트에서 문자열을 배열로 바꾸고 n번째 항목 가져오기 (0) | 2021.07.21 |
Hive 테이블에서 각 partition의 파일 위치(location) 뽑아보기 (0) | 2021.07.21 |
zeppelin 에서 spark으로 데이터 조회할 때 테이블 뷰 (0) | 2019.08.01 |
Spark dataframe 여러 값으로 구성된 컬럼에서 짝을 맞춰 뽑아오기 (0) | 2019.06.21 |