Data Engineer for Geospatial Data (f/m/d)

Permanent employee, Full or part-time · Worldwide

Read job description in:
Your new job.
For building data insights, our artificial intelligence analyzes terabytes of data. As a credian Data Engineer, you work directly at the heart of our AI company: its data pipes. Thereby, you will ingest, combine and refine various data types from many sources. The focus will be unstructured data, e.g., aerial imagery and LiDAR point cloud data. With your experience and skillset in large-scale data engineering, you enable our data scientists to have the best possible basis for their analysis by having area-wide ready-to-use data in place.
Your tech skills.
Don’t worry if you don’t fulfill all criteria. Everyone’s got a focus. 

  • You have experience in building efficient large-scale Modern Data Platforms, including databases (No-)SQL, object stores, and cloud-scale data pipelines based on ETL/ELT/dbt.  
  • You have strong coding skills and experience designing and deploying end-to-end unstructured data pipelines (e.g., for processing large amounts of geo-referenced image data and ideally point-cloud data) 
  • You architect, build and maintain end-to-end, high-throughput pipelines for unstructured data using state-of-the-art I/O technologies such as Pytorch WebDataset 
  • You wrangle large-scale data sets using frameworks such as CGAL, GDAL, PDAL, rasterio, Geopandas, Boost.Geometry or similar 
  • You have knowledge in projections, coordinate systems, georeferencing as well as web map, webtile, and web feature services 
  • You have solid experience with a hyperscaler’s Data Platform stack, ideally, Azure Data Factory, Azure Functions, Azure Data Lake Storage, or equivalent and distributed processing frameworks (e.g., Apache Spark/Databricks)
  • You proactively drive the design of systems that are modular, testable, and secure in Python, as well as their support infrastructure (shell scripts, job schedulers, message queues, etc.).  
  • You are familiar with profiling tools, debugging logs, performance metrics, and other data sources to make code- and application-level improvements
Benefits of working with credium.
Enjoy the spirit of working in an inspiring start-up atmosphere. You can count on the following points: 

  • You will be working with people who all want to grow and excel 
  • Your international colleagues will truly support you because we mutually rely on one another 
  • You will be working with a digital startup of the year nominee by the German Federal Ministry of Economic Affairs 
  • You gain unique experience of working in a venture-capital-backed AI company 
  • We provide a competitive salary and flexible working settings (working hours, home office,  all-remote possible etc.) 
  • Newly renovated office in the heart of Augsburg with an indoor garden, coffee-flat and ergonomically designed workplaces (e.g., height-adjustable desks) 
About us
credium is an AI-company focused on building data insights. We combine the trends of sustainability and digitization by refining open data that is mainly unstructured (e.g., aerial imagery, LiDAR data) using AI. This way credium creates up-to-date, reliable, and, above all, nationwide building information as an on-demand service.  

credium_dataviz_german
Dein neuer Job.
Um Dateneinblicke zu gewinnen, analysiert unsere künstliche Intelligenz Terabytes von Daten. Als credian Data Engineer arbeitest ​Du direkt im Herzen unseres KI-Unternehmens: in den Datenpipelines. Dabei werden Sie verschiedene Datentypen importieren, kombinieren und verfeinern. Der Schwerpunkt liegt dabei auf unstrukturierten Daten, z. B. Luftbild- und LiDAR-Punktwolkendaten. Mit Deiner Erfahrung und Fähigkeiten im Bereich des Large-Scale-Data-Engineering ermöglichst Du  unseren Data Scientists die bestmögliche Grundlage für deren Analysen, indem Du flächendeckend einsatzbereite Daten zur Verfügung stellst.
Deine Tech Skills.
Mach Dir keine Sorgen, wenn Du nicht alle Kriterien erfüllst. Jede und jeder hat einen Schwerpunkt.

  • Du hast Erfahrung im Aufbau von effizienten, groß angelegten modernen Datenplattformen, einschließlich (No-)SQL-Datenbanken, Objektspeichern und Cloud-basierten Datenpipelines auf Basis von ETL/ELT/dbt.  
  • Du verfügst über ausgeprägte Programmierkenntnisse und hast Erfahrung in der Entwicklung und Bereitstellung von End-to-End-Pipelines für unstrukturierte Daten (z. B. für die Verarbeitung großer Mengen georeferenzierter Bilddaten und idealerweise Punktwolkendaten). 
  • Du entwirfst, erstellst und pflegst End-to-End-Pipelines mit hohem Durchsatz für unstrukturierte Daten unter Verwendung modernster E/A-Technologien wie Pytorch WebDataset 
  • Du verarbeitest große Datensätze mit Frameworks wie CGAL, GDAL, PDAL, rasterio, Geopandas, Boost.Geometry oder Ähnlichen 
  • Du kennst dich aus mit Projektionen, Koordinatensysteme, Georeferenzierung sowie Web Map, Webtile und Web Feature Services 
  • Du hast solide Erfahrung mit dem Data Platfrom Stack eines Hyperscalers, idealerweise mit Azure Data Factory, Azure Functions, Azure Data Lake Storage oder gleichwertig und verteilten Verarbeitungsframeworks (z.B. Apache Spark/Databricks)
  • Du strukturierst das Design von modularen, testbaren und sicheren Systemen in Python sowie deren Support-Infrastruktur (Shell-Skripte, Job Scheduler, Message Queues usw.)
  • Du bist vertraut mit Profiling-Tools, Debugging-Protokollen, Leistungsmetriken und anderen Datenquellen, um Verbesserungen auf Code- und Anwendungsebene vorzunehmen
Gründe bei credium zu arbeiten.
Genieße den Spirit einer inspirierenden Start-up-Atmosphäre. Mit dem Folgenden kannst Du rechnen:
  • Arbeiten in einem vielfältigen Team von hochmotivierten Kolleginnen und Kollegen
  • Flexible Arbeitsbedingungen (Arbeitszeiten, Home Office, etc.)
  • Du arbeitest bei einem "Digitales Startup des Jahres"-Kandidat nominiert vom Bundeswirtschaftsministerium
  • Neu renoviertes Büro im Herzen Augsburgs mit Indoor Garden und ergonomisch gestalteten Arbeitsplätzen (z.B. höhenverstellbare Schreibtische)
  • Kaffee-Flat im Büro
  • Wettbewerbsfähiges Gehalt
Über uns
credium ist ein KI-Startup, das die Trends der Nachhaltigkeit und der Digitalisierung durch die Veredelung von Open-Data mit künstlicher Intelligenz verbindet. So schafft credium aktuelle, zuverlässige und vor allem flächendeckende Gebäudedaten als On-Demand-Service.
credium_dataviz_german
Your application!
We appreciate your interest in credium. Please fill in the following short form. Should you have any difficulties in uploading your files, please contact us by mail at join@credium.de

Please upload your CV, and optionally include other documents (in total max. 20 MB).

Click to select multiple files or use drag-and-drop
Click to select multiple files or use drag-and-drop
Click to select multiple files or use drag-and-drop
Click to select multiple files or use drag-and-drop

Uploading document. Please wait.