apache · jkylling · Mar 16, 2025 · Mar 26, 2025 · Mar 26, 2025 · Mar 27, 2025
diff --git a/parquet/examples/read_with_rowgroup.rs b/parquet/examples/read_with_rowgroup.rs
@@ -129,6 +129,10 @@ impl RowGroups for InMemoryRowGroup {
             }
         }
     }
+
+    fn row_groups(&self) -> Box<dyn Iterator<Item = &RowGroupMetaData> + '_> {
+        Box::new(std::iter::once(&self.metadata))
+    }
 }
 
 impl InMemoryRowGroup {

diff --git a/parquet/src/arrow/array_reader/builder.rs b/parquet/src/arrow/array_reader/builder.rs
@@ -15,13 +15,13 @@
 // specific language governing permissions and limitations
 // under the License.
 
+use arrow_schema::{DataType, Field, Fields, SchemaBuilder};
 use std::sync::Arc;
 
-use arrow_schema::{DataType, Fields, SchemaBuilder};
-
 use crate::arrow::array_reader::byte_view_array::make_byte_view_array_reader;
 use crate::arrow::array_reader::empty_array::make_empty_array_reader;
 use crate::arrow::array_reader::fixed_len_byte_array::make_fixed_len_byte_array_reader;
+use crate::arrow::array_reader::row_number::RowNumberReader;
 use crate::arrow::array_reader::{
     make_byte_array_dictionary_reader, make_byte_array_reader, ArrayReader,
     FixedSizeListArrayReader, ListArrayReader, MapArrayReader, NullArrayReader,
@@ -39,9 +39,29 @@ pub fn build_array_reader(
     field: Option<&ParquetField>,
     mask: &ProjectionMask,
     row_groups: &dyn RowGroups,
+    row_number_column: Option<String>,
 ) -> Result<Box<dyn ArrayReader>> {
     let reader = field
-        .and_then(|field| build_reader(field, mask, row_groups).transpose())
+        .and_then(|field| {
+            build_reader(field, mask, row_groups, row_number_column.clone()).transpose()
+        })
+        .or_else(|| {
+            row_number_column.map(|column| {
+                let row_number_reader = build_row_number_reader(row_groups)?;
+                let reader: Box<dyn ArrayReader> = Box::new(StructArrayReader::new(
+                    DataType::Struct(Fields::from(vec![Field::new(
+                        column,
+                        row_number_reader.get_data_type().clone(),
+                        false,
+                    )])),
+                    vec![row_number_reader],
+                    0,
+                    0,
+                    false,
+                ));
+                Ok(reader)
+            })
+        })
         .transpose()?
         .unwrap_or_else(|| make_empty_array_reader(row_groups.num_rows()));
 
@@ -52,12 +72,13 @@ fn build_reader(
     field: &ParquetField,
     mask: &ProjectionMask,
     row_groups: &dyn RowGroups,
+    row_number_column: Option<String>,
 ) -> Result<Option<Box<dyn ArrayReader>>> {
     match field.field_type {
         ParquetFieldType::Primitive { .. } => build_primitive_reader(field, mask, row_groups),
         ParquetFieldType::Group { .. } => match &field.arrow_type {
             DataType::Map(_, _) => build_map_reader(field, mask, row_groups),
-            DataType::Struct(_) => build_struct_reader(field, mask, row_groups),
+            DataType::Struct(_) => build_struct_reader(field, mask, row_groups, row_number_column),
             DataType::List(_) => build_list_reader(field, mask, false, row_groups),
             DataType::LargeList(_) => build_list_reader(field, mask, true, row_groups),
             DataType::FixedSizeList(_, _) => build_fixed_size_list_reader(field, mask, row_groups),
@@ -66,6 +87,10 @@ fn build_reader(
     }
 }
 
+fn build_row_number_reader(row_groups: &dyn RowGroups) -> Result<Box<dyn ArrayReader>> {
+    Ok(Box::new(RowNumberReader::try_new(row_groups.row_groups())?))
+}
+
 /// Build array reader for map type.
 fn build_map_reader(
     field: &ParquetField,
@@ -75,8 +100,8 @@ fn build_map_reader(
     let children = field.children().unwrap();
     assert_eq!(children.len(), 2);
 
-    let key_reader = build_reader(&children[0], mask, row_groups)?;
-    let value_reader = build_reader(&children[1], mask, row_groups)?;
+    let key_reader = build_reader(&children[0], mask, row_groups, None)?;
+    let value_reader = build_reader(&children[1], mask, row_groups, None)?;
 
     match (key_reader, value_reader) {
         (Some(key_reader), Some(value_reader)) => {
@@ -127,7 +152,7 @@ fn build_list_reader(
     let children = field.children().unwrap();
     assert_eq!(children.len(), 1);
 
-    let reader = match build_reader(&children[0], mask, row_groups)? {
+    let reader = match build_reader(&children[0], mask, row_groups, None)? {
         Some(item_reader) => {
             // Need to retrieve underlying data type to handle projection
             let item_type = item_reader.get_data_type().clone();
@@ -173,7 +198,7 @@ fn build_fixed_size_list_reader(
     let children = field.children().unwrap();
     assert_eq!(children.len(), 1);
 
-    let reader = match build_reader(&children[0], mask, row_groups)? {
+    let reader = match build_reader(&children[0], mask, row_groups, None)? {
         Some(item_reader) => {
             let item_type = item_reader.get_data_type().clone();
             let reader = match &field.arrow_type {
@@ -300,6 +325,7 @@ fn build_struct_reader(
     field: &ParquetField,
     mask: &ProjectionMask,
     row_groups: &dyn RowGroups,
+    row_number_column: Option<String>,
 ) -> Result<Option<Box<dyn ArrayReader>>> {
     let arrow_fields = match &field.arrow_type {
         DataType::Struct(children) => children,
@@ -312,14 +338,24 @@ fn build_struct_reader(
     let mut builder = SchemaBuilder::with_capacity(children.len());
 
     for (arrow, parquet) in arrow_fields.iter().zip(children) {
-        if let Some(reader) = build_reader(parquet, mask, row_groups)? {
+        if let Some(reader) = build_reader(parquet, mask, row_groups, None)? {
             // Need to retrieve underlying data type to handle projection
             let child_type = reader.get_data_type().clone();
             builder.push(arrow.as_ref().clone().with_data_type(child_type));
             readers.push(reader);
         }
     }
 
+    if let Some(row_number_column) = row_number_column {
+        let reader = build_row_number_reader(row_groups)?;
+        builder.push(Field::new(
+            row_number_column,
+            reader.get_data_type().clone(),
+            false,
+        ));
+        readers.push(reader);
+    }
+
     if readers.is_empty() {
         return Ok(None);
     }
@@ -356,14 +392,23 @@ mod tests {
         )
         .unwrap();
 
-        let array_reader = build_array_reader(fields.as_ref(), &mask, &file_reader).unwrap();
+        let array_reader = build_array_reader(
+            fields.as_ref(),
+            &mask,
+            &file_reader,
+            Some("row_number".to_string()),
+        )
+        .unwrap();
 
         // Create arrow types
-        let arrow_type = DataType::Struct(Fields::from(vec![Field::new(
-            "b_struct",
-            DataType::Struct(vec![Field::new("b_c_int", DataType::Int32, true)].into()),
-            true,
-        )]));
+        let arrow_type = DataType::Struct(Fields::from(vec![
+            Field::new(
+                "b_struct",
+                DataType::Struct(vec![Field::new("b_c_int", DataType::Int32, true)].into()),
+                true,
+            ),
+            Field::new("row_number", DataType::Int64, false),
+        ]));
 
         assert_eq!(array_reader.get_data_type(), &arrow_type);
     }

diff --git a/parquet/src/arrow/array_reader/list_array.rs b/parquet/src/arrow/array_reader/list_array.rs
@@ -563,7 +563,8 @@ mod tests {
         )
         .unwrap();
 
-        let mut array_reader = build_array_reader(fields.as_ref(), &mask, &file_reader).unwrap();
+        let mut array_reader =
+            build_array_reader(fields.as_ref(), &mask, &file_reader, None).unwrap();
 
         let batch = array_reader.next_batch(100).unwrap();
         assert_eq!(batch.data_type(), array_reader.get_data_type());

diff --git a/parquet/src/arrow/array_reader/mod.rs b/parquet/src/arrow/array_reader/mod.rs
@@ -40,11 +40,13 @@ mod list_array;
 mod map_array;
 mod null_array;
 mod primitive_array;
+mod row_number;
 mod struct_array;
 
 #[cfg(test)]
 mod test_util;
 
+use crate::file::metadata::RowGroupMetaData;
 pub use builder::build_array_reader;
 pub use byte_array::make_byte_array_reader;
 pub use byte_array_dictionary::make_byte_array_dictionary_reader;
@@ -113,6 +115,9 @@ pub trait RowGroups {
 
     /// Returns a [`PageIterator`] for the column chunks with the given leaf column index
     fn column_chunks(&self, i: usize) -> Result<Box<dyn PageIterator>>;
+
+    /// Returns an iterator over the row groups in this collection
+    fn row_groups(&self) -> Box<dyn Iterator<Item = &RowGroupMetaData> + '_>;
 }
 
 impl RowGroups for Arc<dyn FileReader> {
@@ -124,6 +129,10 @@ impl RowGroups for Arc<dyn FileReader> {
         let iterator = FilePageIterator::new(column_index, Arc::clone(self))?;
         Ok(Box::new(iterator))
     }
+
+    fn row_groups(&self) -> Box<dyn Iterator<Item = &RowGroupMetaData> + '_> {
+        Box::new(self.metadata().row_groups().iter())
+    }
 }
 
 /// Uses `record_reader` to read up to `batch_size` records from `pages`

diff --git a/parquet/src/arrow/array_reader/row_number.rs b/parquet/src/arrow/array_reader/row_number.rs
@@ -0,0 +1,154 @@
+// Licensed to the Apache Software Foundation (ASF) under one
+// or more contributor license agreements.  See the NOTICE file
+// distributed with this work for additional information
+// regarding copyright ownership.  The ASF licenses this file
+// to you under the Apache License, Version 2.0 (the
+// "License"); you may not use this file except in compliance
+// with the License.  You may obtain a copy of the License at
+//
+//   http://www.apache.org/licenses/LICENSE-2.0
+//
+// Unless required by applicable law or agreed to in writing,
+// software distributed under the License is distributed on an
+// "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
+// KIND, either express or implied.  See the License for the
+// specific language governing permissions and limitations
+// under the License.
+
+use crate::arrow::array_reader::ArrayReader;
+use crate::errors::{ParquetError, Result};
+use crate::file::metadata::RowGroupMetaData;
+use arrow_array::{ArrayRef, Int64Array};
+use arrow_schema::DataType;
+use std::any::Any;
+use std::collections::VecDeque;
+use std::sync::Arc;
+
+pub(crate) struct RowNumberReader {
+    row_numbers: Vec<i64>,
+    row_groups: RowGroupSizeIterator,
+}
+
+impl RowNumberReader {
+    pub(crate) fn try_new<I>(row_groups: impl IntoIterator<Item = I>) -> Result<Self>
+    where
+        I: TryInto<RowGroupSize, Error = ParquetError>,
+    {
+        let row_groups = RowGroupSizeIterator::try_new(row_groups)?;
+        Ok(Self {
+            row_numbers: Vec::new(),
+            row_groups,
+        })
+    }
+}
+
+impl ArrayReader for RowNumberReader {
+    fn as_any(&self) -> &dyn Any {
+        self
+    }
+
+    fn get_data_type(&self) -> &DataType {
+        &DataType::Int64
+    }
+
+    fn read_records(&mut self, batch_size: usize) -> Result<usize> {
+        let read = self
+            .row_groups
+            .read_records(batch_size, &mut self.row_numbers);
+        Ok(read)
+    }
+
+    fn consume_batch(&mut self) -> Result<ArrayRef> {
+        Ok(Arc::new(Int64Array::from_iter(self.row_numbers.drain(..))))
+    }
+
+    fn skip_records(&mut self, num_records: usize) -> Result<usize> {
+        let skipped = self.row_groups.skip_records(num_records);
+        Ok(skipped)
+    }
+
+    fn get_def_levels(&self) -> Option<&[i16]> {
+        None
+    }
+
+    fn get_rep_levels(&self) -> Option<&[i16]> {
+        None
+    }
+}
+
+struct RowGroupSizeIterator {
+    row_groups: VecDeque<RowGroupSize>,
+}
+
+impl RowGroupSizeIterator {
+    fn try_new<I>(row_groups: impl IntoIterator<Item = I>) -> Result<Self>
+    where
+        I: TryInto<RowGroupSize, Error = ParquetError>,
+    {
+        Ok(Self {
+            row_groups: VecDeque::from(
+                row_groups
+                    .into_iter()
+                    .map(TryInto::try_into)
+                    .collect::<Result<Vec<_>>>()?,
+            ),
+        })
+    }
+}
+
+impl RowGroupSizeIterator {
+    fn read_records(&mut self, mut batch_size: usize, row_numbers: &mut Vec<i64>) -> usize {
+        let mut read = 0;
+        while batch_size > 0 {
+            let Some(front) = self.row_groups.front_mut() else {
+                return read as usize;
+            };
+            let to_read = std::cmp::min(front.num_rows, batch_size as i64);
+            row_numbers.extend(front.first_row_number..front.first_row_number + to_read);
+            front.num_rows -= to_read;
+            front.first_row_number += to_read;
+            if front.num_rows == 0 {
+                self.row_groups.pop_front();
+            }
+            batch_size -= to_read as usize;
+            read += to_read;
+        }
+        read as usize
+    }
+
+    fn skip_records(&mut self, mut num_records: usize) -> usize {
+        let mut skipped = 0;
+        while num_records > 0 {
+            let Some(front) = self.row_groups.front_mut() else {
+                return skipped as usize;
+            };
+            let to_skip = std::cmp::min(front.num_rows, num_records as i64);
+            front.num_rows -= to_skip;
+            front.first_row_number += to_skip;
+            if front.num_rows == 0 {
+                self.row_groups.pop_front();
+            }
+            skipped += to_skip;
+            num_records -= to_skip as usize;
+        }
+        skipped as usize
+    }
+}
+
+pub(crate) struct RowGroupSize {
+    first_row_number: i64,
+    num_rows: i64,
+}
+
+impl TryFrom<&RowGroupMetaData> for RowGroupSize {
+    type Error = ParquetError;
+
+    fn try_from(rg: &RowGroupMetaData) -> Result<Self, Self::Error> {
+        Ok(Self {
+            first_row_number: rg
+                .first_row_number()
+                .ok_or(ParquetError::RowGroupMetaDataMissingRowNumber)?,
+            num_rows: rg.num_rows(),
+        })
+    }
+}
-Original file line number
+Diff line change
@@ Expand Up / @@ -129,6 +129,10 @@ impl RowGroups for InMemoryRowGroup { @@
                 }
             }
         }
+        fn row_groups(&self) -> Box<dyn Iterator<Item = &RowGroupMetaData> + '_> {
+            Box::new(std::iter::once(&self.metadata))
+        }
     }
     impl InMemoryRowGroup {
@@ Expand Down @@