Load Doris data failed, schema size of fetch data is wrong #30134

sunriseXDM · 2024-01-19T07:46:27Z

sunriseXDM
Jan 19, 2024

环境：
spark2.3
doris2.0.3

connector：spark-doris-connector-2.3_2.11-1.2.0

报错内容：
24/01/19 14:52:20 INFO BackendClient: Success connect to Doris BE{host='192.168.1.11', port=9060}.
24/01/19 14:52:20 INFO BackendClient: Success connect to Doris BE{host='192.168.1.11', port=9060}.
24/01/19 14:52:20 ERROR RowBatch: Schema size '1' is not equal to arrow field size '2'.
24/01/19 14:52:20 ERROR RowBatch: Schema size '1' is not equal to arrow field size '2'.
24/01/19 14:52:20 ERROR RowBatch: Read Doris Data failed because:
org.apache.doris.spark.exception.DorisException: Load Doris data failed, schema size of fetch data is wrong.
at org.apache.doris.spark.serialization.RowBatch.(RowBatch.java:99)
at org.apache.doris.spark.rdd.ScalaValueReader.hasNext(ScalaValueReader.scala:210)
at org.apache.doris.spark.rdd.AbstractDorisRDDIterator.hasNext(AbstractDorisRDDIterator.scala:56)
at scala.collection.Iterator$$anon$11.hasNext(Iterator.scala:409)
at org.apache.spark.sql.catalyst.expressions.GeneratedClass$GeneratedIteratorForCodegenStage10.agg_doAggregateWithKeys_0$(Unknown Source)
at org.apache.spark.sql.catalyst.expressions.GeneratedClass$GeneratedIteratorForCodegenStage10.processNext(Unknown Source)
at org.apache.spark.sql.execution.BufferedRowIterator.hasNext(BufferedRowIterator.java:43)
at org.apache.spark.sql.execution.WholeStageCodegenExec$$anonfun$10$$anon$1.hasNext(WholeStageCodegenExec.scala:614)
at scala.collection.Iterator$$anon$11.hasNext(Iterator.scala:409)
at org.apache.spark.shuffle.sort.BypassMergeSortShuffleWriter.write(BypassMergeSortShuffleWriter.java:125)
at org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:96)
at org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:53)
at org.apache.spark.scheduler.Task.run(Task.scala:109)
at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:345)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
at java.lang.Thread.run(Thread.java:748)

排查发现，在github上查到doris-flink-connector 1.5.1修复了这个问题。链接：apache/doris-flink-connector#261
请问spark-doris-connector也有这个问题吗？而生产在用spark2导入doris2.0.2没有这个问题

LemonLiTree · 2024-01-22T02:32:46Z

LemonLiTree
Jan 22, 2024

maybe not

0 replies

stillywud · 2025-06-07T05:59:25Z

stillywud
Jun 7, 2025

spark-doris-connector-spark-2
25.1.0
配合doris 1.2.4-1存在这个问题，如果表配置了UNIQUE KEY的话。
现在把doris升级到Version : doris-3.0.5-rc01 就没这个问题了

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Load Doris data failed, schema size of fetch data is wrong #30134

Uh oh!

{{title}}

Uh oh!

Uh oh!

{{editor}}'s edit

{{editor}}'s edit

Uh oh!

Replies: 2 comments

Uh oh!

{{title}}

Uh oh!

Uh oh!

{{title}}

Uh oh!

Select a reply

Uh oh!

Load Doris data failed, schema size of fetch data is wrong #30134

Uh oh!

Uh oh!

sunriseXDM Jan 19, 2024

Replies: 2 comments

Uh oh!

LemonLiTree Jan 22, 2024

Uh oh!

stillywud Jun 7, 2025

sunriseXDM
Jan 19, 2024

LemonLiTree
Jan 22, 2024

stillywud
Jun 7, 2025