Gobblin

Gobblin is a universal data ingestion framework for extracting, transforming, and loading large volume of data from a variety of data sources, e.g., databases, rest APIs, FTP/SFTP servers, filers, etc., onto Hadoop. Gobblin handles the common routine tasks required for all data ingestion ETLs, including job/task scheduling, task partitioning, error handling, state management, data quality checking, data publishing, etc. Gobblin ingests data from different data sources in the same execution framework, and manages metadata of different sources all in one place. This, combined with other features such as auto scalability, fault tolerance, data quality assurance, extensibility, and the ability of handling data model evolution, makes Gobblin an easy-to-use, self-serving, and efficient data ingestion framework.

Quick Links

Documentation: Check out the Gobblin documentation for a complete description of Gobblin's features
Powered By: Check out the list of companies known to use Gobblin
Architecture: The Gobblin Architecture page has a full explanation of Gobblin's architecture
Getting Started with Gobblin: Refer to the Getting Started Guide on how to get started with Gobblin
Building Gobblin: Refer to the page Building Gobblin for directions on how to build Gobblin
Javadocs: The full JavaDocs for each released version of Gobblin can be found here
Gobblin chat room: Gitter chat room for Gobblin developers and users here

Name		Name	Last commit message	Last commit date
Latest commit History 4,482 Commits
bin		bin
buildSrc/src/main/groovy/gobblin/gradle		buildSrc/src/main/groovy/gobblin/gradle
conf		conf
gobblin-admin		gobblin-admin
gobblin-api		gobblin-api
gobblin-audit		gobblin-audit
gobblin-aws		gobblin-aws
gobblin-cluster		gobblin-cluster
gobblin-compaction		gobblin-compaction
gobblin-config-management		gobblin-config-management
gobblin-core-base		gobblin-core-base
gobblin-core		gobblin-core
gobblin-data-management		gobblin-data-management
gobblin-distribution		gobblin-distribution
gobblin-docker		gobblin-docker
gobblin-docs		gobblin-docs
gobblin-example		gobblin-example
gobblin-hive-registration		gobblin-hive-registration
gobblin-metastore		gobblin-metastore
gobblin-metrics-libs		gobblin-metrics-libs
gobblin-modules		gobblin-modules
gobblin-oozie/src/test/resources/local		gobblin-oozie/src/test/resources/local
gobblin-rest-service		gobblin-rest-service
gobblin-restli		gobblin-restli
gobblin-runtime-hadoop		gobblin-runtime-hadoop
gobblin-runtime		gobblin-runtime
gobblin-salesforce		gobblin-salesforce
gobblin-service		gobblin-service
gobblin-test-harness		gobblin-test-harness
gobblin-test-utils		gobblin-test-utils
gobblin-test/resource		gobblin-test/resource
gobblin-tunnel		gobblin-tunnel
gobblin-utility		gobblin-utility
gobblin-yarn		gobblin-yarn
gradle		gradle
ligradle/findbugs		ligradle/findbugs
maven-sonatype		maven-sonatype
travis		travis
.gitignore		.gitignore
.travis.yml		.travis.yml
CHANGELOG.md		CHANGELOG.md
LICENSE		LICENSE
NOTICE		NOTICE
README.md		README.md
build.gradle		build.gradle
defaultEnvironment.gradle		defaultEnvironment.gradle
gobblin-flavored-build.gradle		gobblin-flavored-build.gradle
gradle.properties		gradle.properties
gradlew		gradlew
gradlew.bat		gradlew.bat
mkdocs.yml		mkdocs.yml
query_github_issues.py		query_github_issues.py
readthedocs.yml		readthedocs.yml
settings.gradle		settings.gradle

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Gobblin

Quick Links

About

Releases

Packages

Languages

License

jean-helsinki/gobblin

Folders and files

Latest commit

History

Repository files navigation

Gobblin

Quick Links

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages